메뉴 바로가기 본문 바로가기 하단 바로가기

Korea Bioinformation Center

국내 생명연구자원정보의 총괄관리와 생명정보 분야의 전문연구를 위한 범부처 국가센터

KOBIC 공지

공개 분석 파이프라인

#Whole Genome Sequencing
#WGS
#Genomics
#Next Generation Sequencing
#Precision Medicine
#Clinical Genomics
#noncoding genome
#GATK
#fastp
#Cutadapt
#BWA
#SortSam
#MarkDuplicates
#CountBase
#BaseRecalibrator
#ApplyBQSR
#HaplotypeCaller
#somalier
KOBICian's Story
디지털 생명과학 시대에 접어들면서 우리는 다양한 형식과 규모의 바이오 데이터를 데이터베이스 내에 쌓아가고 있습니다. 유전체, 전사체, 단백체, 대사체, 바이오이미징, 전임상, 화합물 등 서로 다른 분야의 생명연구자원은 이제 함께 연결되어 통합적으로 해석되어야 할 대상으로 주목받고 있습니다. 이러한 데이터를 하나의 통합된 데이터베이스 안에 정리하고 연계하는 일은 단순한 저장을 넘어 복잡한 설계가 필요한 일이자, 생명현상을 깊이 이해하기 위한 필수적인 과정입니다.바이오 데이터는 개별적으로 존재하는 것이 아니라 유기적으로 연결되어 있습니다. 예를 들어, 하나의 유전자가 활발히 작동하면 단백질이 만들어지고, 이는 대사 반응에 영향을 주며, 그 결과는 실험 이미지나 화합물 반응에서도 나타날 수 있습니다. 하나의 사건이 여러 데이터로 확산되는 이 구조를 이해하려면 단편적인 정보의 나열이 아니라 관계 중심의 데이터 연결이 필요합니다.또한 생명과학 데이터는 표 형식뿐 아니라 이미지, 3D 구조, 그래프 등 다양한 형태로 존재합니다. 단백질만 해도 서열 정보, 3차 구조, 기능 정보 등이 모두 서로 다른 방식으로 저장됩니다. 이를 하나의 시스템에 담기 위해서는 다양한 형식을 수용할 수 있도록 유연하게 설계되어야 합니다.이처럼 복잡하고 다양한 데이터를 효과적으로 다루고 서비스 하기 위해서는 기존의 관계형 데이터베이스만으로는 한계가 있을 수 있습니다. 관계형 데이터베이스는 명확한 테이블 구조와 고정된 스키마를 기반으로 동작하기 때문에, 데이터의 형태가 유동적인 비정형 데이터를 다루기 어렵고, 유전자와 단백질, 대사산물, 화합물 사이처럼 복잡하게 얽힌 다대다(M:N) 관계나 계층적 데이터 구조를 표현하는 데도 제약이 큽니다. 이러한 이유로 정형/비정형 문서중심의 NoSQL, 관계 구조를 표현하기 쉬운 그래프 데이터베이스 등 다양한 기술을 함께 활용해야 하며, 각각의 장점을 살려 통합적으로 설계하는 것이 중요합니다.이러한 기술적 고려 외에도 데이터베이스를 설계할 때 무엇보다 중요한 것이 있습니다. 데이터베이스의 설계 및 모델링은 단지 기술로만 완성되지 않습니다. 누가 데이터를 만들고, 어떻게 분석하며, 어떤 방식으로 활용되는지를 이해하고, 그 흐름에 맞게 구조화되어야 진정으로 활용 가능한 시스템이 됩니다. 업무 흐름이 명확하면 데이터도 자연스럽게 정돈되고, 문제 발생시 빠르게 대응할 수 있으며, 새로운 작업이 추가되더라도 유연하게 적용할 수 있습니다. 여기서 중요한 개념이 데이터 모델링과 데이터베이스 모델링입니다. 데이터 모델링은 분석할 대상의 개념과 의미를 정의하고 그 관계를 추상적으로 설계하는 과정이며, 데이터베이스 모델링은 이를 실제 시스템에 구현 가능한 형태로 구체화하는 작업입니다. '무엇을 담을 것인가'를 정의하는 것이 데이터 모델링이라면, '어떻게 담을 것인가'를 결정하는 것이 데이터베이스 모델링입니다. 두 과정은 생명과학 데이터의 통합과 활용을 위한 기반입니다.이러한 철학은 K-BDS(Korea BioData Station)가 추구하는 방향과도 일치합니다. K-BDS는 유전체, 전임상, 단백질, 대사체, 영상/이미지 등 다양한데이터를 통합하여 연구자들이 효율적으로 활용할 수 있도록 지원하는 국가 바이오데이터 플랫폼입니다. 현재 K-BDS는 데이터 간 연계성을 점진적으로 확장하며, 다양한 생명과학 데이터가 유기적으로 연결되는 구조로 발전하고 있습니다. 단일 유형의 데이터 제공을 넘어, 다양한 데이터 간 의미 있는 관계를 표현하고 공유할 수 있는 환경을 구축하고자 합니다.우리가 만들고자 하는 바이오 데이터베이스는 단순한 저장소가 아닌, 다양한 사람들이 데이터를 생성하고 다듬고 활용하는 하나의 '업무 생태계'입니다. 이 생태계가 원활히 돌아가기 위해서는 기술적인 설계와 더불어, 업무 흐름과 역할, 절차가 명확히 정의되어야 하며, 그것이 데이터 구조 안에 반영되어야합니다. K-BDS가 단순한 데이터 모음이 아닌, 사람과 업무 중심의 구조로 구현될 때 그 가치는 더욱 커질 것으로 기대합니다.

바이오익스프레스 서비스는 동적 컨테이너 기반 자동화된 워크플로우 분석 플랫폼과 고속 데이터 전송 서비스를 통해 과학 분야의 빅데이터 분석을 가능하게 하는 국내 유일의 클라우드 기반 통합 데이터 분석 서비스입니다.

다운로드

환경에 맞는 OS용 워크벤치 및 고속전송 서비스를
다운로드 해주세요.

6,185

사용자

1,085

워크스페이스

89,519

실행 태스크
국가바이오데이터스테이션 데이터 활용 바로가기

바이오 연구 데이터란 생명과학 분야의 국가 R&D 사업을 통해 생산된 모든 종류의 데이터를 의미하며, 이러한 데이터를 활용한 혁신 연구 방식이 각광받으면서 R&D 혁신을 견인하는 핵심요소로 부각되고 있습니다. 이를 위하여 부처·사업·연구자별 흩어져 있는 데이터를 통합 수집·제공하는 국가바이오데이터스테이션을 구축하여 데이터 기반 바이오 연구 환경을 조성하려 합니다.

데이터별 등록 현황

  • 2,115

    바이오프로젝트
  • 108,472

    바이오샘플
  • 2,370,006

    등록된 데이터

바이오 프로젝트 등록 현황

등록 누적 건수(건)
국가 바이오 빅데이터 사업 사업소개 바로가기

정밀의료의 근간이 되는 바이오 빅데이터는 사후적 치료 중심에서 개인 맞춤형 치료·예방의료로 전환됨에 따라 중요도가 커지고 있습니다. 특히 선점 효과가 큰 바이오 산업의 경우 선제적 투자가 필요하며, 주요국들은 대규모 바이오 빅데이터를 구축하고 있습니다. 이에 따라 국가적으로 미래 의료 선도를 위한 국가 바이오 빅데이터를 구축하기 위해 본 사업이 시행되었습니다. 정밀의료 시대의 중심인 '바이오 빅데이터'를 국가차원에서 수집-저장-활용 할 수 있는 기반을 조성하고, 신산업 촉진 및 건강한 삶의 증진에 기여하고자 합니다.

임상정보 수집

16개 희귀질환 협력기관을 지정 운영하여 희귀질환자 모집 후 임상정보 수집

데이터 분석

수집된 희귀질환자의 검체를 자원 제작 기관으로 운송 후 유전체 데이터 생산ㆍ분석

데이터 공유

수집된 임상정보 및 유전체 데이터는 3개의 기관에서 컨소시엄을 구성해 공유

데이터 활용

분석한 데이터는 희귀질환자 상담 및 진료 ㆍ연구 활동 등에 활용

유전체 데이터 25,000
변이분석 데이터 25,000
임상 정보 25,000
코호트 7
감염병 연구정보포털 소개 바로가기

감염병 연구정보포털(Infectious Disease Data Portal)은 전 세계 감염병 바이러스의 연구데이터를 통합 제공하는 포털 서비스 입니다. 빠르게 변화하는 상황에서 감염병을 이해하고 치료법과 백신을 개발하기 위해 데이터와 결과를 조화롭게 공유하기 위해 KOBIC은 전세계 감염병의 연구정보데이터를 통합하여 제공하고 있습니다.

시퀀스 대시보드

88,386 국내 유전체 서열
1,354 국내 단백질 서열
19,685,177 국외 유전체 서열
35,837,682 국외 단백질 서열
19,764,289 코로나 유전체 서열
35,333,179 코로나 단백질 서열
바이러스

감염병 개요, 입자 및 유전체 구조, 생활사, 역학, 변이 등 바이러스에 대한 통합 정보를 제공

데이터

전세계에서 수집한 염기서열 및 단백질 서열, 단백질 구조를 품질분석하여 제공

통계

바이러스 데이터의 발병 시기, 지역, 변이 등 다양한 통계 서비스

분석도구

간단한 웹 기반의 감염병 표준 염기서열 BLAST 서비스

연구지원

국내 생명과학 연구의 활성화를 위하여 생명정보학 전문지식 습득 및 전산자원이 필요한 연구자 여러분들께 다양한 생명정보학 관련 연구를 지원합니다.

  • 042-879-8544
  • swhwang@kribb.re.kr

KOBIC 온라인 교육

바로가기
  • 042-879-8582
  • bkbaik@kribb.re.kr
TOP