취리히 연방공과대학교(ETH Zurich) 과학자들은 "DNA 구글"에 비유되는 선구적인 DNA 검색 엔진인 MetaGraph를 개발했습니다. 이 혁신은 방대한 DNA 및 RNA 서열 데이터베이스를 빠르고 포괄적으로 검색할 수 있게 함으로써 유전 연구를 획기적으로 가속화할 것으로 기대됩니다.
취리히 연방공과대학교(ETH Zurich)의 연구원들은 MetaGraph라는 획기적인 도구를 공개했습니다. 이 도구는 방대한 DNA 및 RNA 시퀀스 데이터베이스를 빠르고 효율적으로 검색할 수 있도록 하여 유전 연구에 혁명을 일으키도록 설계되었습니다.
이 새로운 방법은 다음과 같습니다. 출판 Nature 저널에 실린 이 연구는 희귀 유전 질환과 종양 세포의 특정 돌연변이를 식별하는 데 도움이 될 것으로 기대되며, 생물의학 연구의 새로운 시대를 열 것으로 기대됩니다.
MetaGraph는 인터넷 검색 엔진과 비슷하게 작동하여 연구자가 관심 있는 시퀀스를 입력하면 글로벌 데이터베이스에서 해당 시퀀스가 나타난 위치를 빠르게 찾을 수 있습니다.
"이것은 일종의 DNA 구글과 같습니다." ETH 취리히의 컴퓨터 과학과 교수이자 생물의학 정보학 그룹의 일원인 군나르 레취가 보도자료를 통해 말했습니다.
이 도구는 저장된 모든 시퀀스의 원시 데이터를 검색하여 이전에는 시간과 리소스가 많이 소요되었던 방대한 데이터 세트를 다운로드할 필요성을 없앴습니다.
차세대 시퀀싱의 중요성은 최근 몇 년 동안 부각되어 왔는데, 특히 COVID-19 팬데믹 동안 SARS-CoV-2 유전체의 빠른 디코딩과 모니터링이 가능해졌기 때문입니다.
그러나 American Sequence Read Archive(SRA)와 European Nucleotide Archive(ENA)와 같은 데이터베이스에 저장된 약 100페타바이트에 달하는 엄청난 양의 데이터는 연구자들에게 상당한 어려움을 안겨주었습니다.
이제 ETH 취리히 과학자들이 개발한 혁신적인 MetaGraph 도구가 이러한 과제를 정면으로 해결합니다. 이 도구는 데이터를 300배까지 압축하여 정보의 무결성을 유지하면서도 높은 효율성을 제공합니다.
래치는 "수학적으로 말하면 수백만 개의 열과 수조 개의 행으로 이루어진 거대한 행렬입니다."라고 덧붙였습니다.
새로운 검색 엔진은 검색 과정을 간소화하고 속도를 높일 뿐만 아니라 비용도 저렴합니다. MetaGraph를 이용한 대규모 검색 비용은 메가베이스당 $0.74를 넘지 않습니다.
이러한 경제성과 도구의 정밀성 및 효율성은 잘 알려지지 않은 병원균이나 신종 질병에 대한 연구를 크게 촉진할 수 있습니다. 기존 데이터베이스에서 내성 유전자와 유익한 박테리오파지를 식별함으로써 항생제 내성 연구의 발전을 이끌 것으로 기대됩니다.
컴퓨터 과학과의 수석 과학자이자 생물의학 정보학 그룹의 일원인 André Kahles는 "필요한 정보를 잃지 않으면서 데이터 세트를 최대한 압축적으로 유지하기 위해 가능한 한 한계를 넓히고 있습니다."라고 덧붙였습니다.
2020년에 처음 발표된 이후 지속적으로 개선되어 온 MetaGraph는 이미 쿼리에 사용할 수 있으며, 전 세계 시퀀스 데이터셋의 거의 절반을 색인화했습니다. 연구진은 연말까지 나머지 데이터도 포함할 계획입니다.
오픈 소스이기 때문에 MetaGraph는 제약 회사의 응용 프로그램을 비롯하여 미래에는 개인 용도로도 사용될 수 있는 엄청난 잠재적 이점을 제공합니다.
이 도구의 향후 활용 가능성에 대해 Kahles는 이렇게 덧붙였습니다. "초창기에는 구글조차도 검색 엔진이 정확히 무엇에 유용한지 알지 못했습니다. DNA 시퀀싱 기술이 급속도로 발전한다면, 발코니 식물을 더 정확하게 식별하는 것이 일반화될 수도 있습니다."
출처: ETH 취리히

