새로운 AI 모델, 수십 년 앞선 질병 위험 예측

연구진은 방대한 건강 기록을 분석하여 수십 년 전에 질병 위험을 예측할 수 있는 선구적인 AI 모델을 개발했습니다. 이 혁신은 조기 개입과 더욱 개인화된 치료 계획을 가능하게 함으로써 의료 분야에 혁명을 가져올 수 있습니다.

새로운 연구에서 출판 유럽 ​​분자생물학 연구소(EMBL), 독일 암 연구 센터(DKFZ), 코펜하겐 대학의 연구진은 Nature 저널에 10년 전에 1,000개 이상의 질병에 대한 위험성과 시기를 예측할 수 있는 선구적인 AI 모델을 공개했습니다.

이 새로운 생성 AI 모델은 대규모 언어 모델(LLM)에서 사용되는 것과 유사한 알고리즘 원리를 채택합니다.

이 시스템은 영국 바이오뱅크(Biobank)에 등록된 400,000만 명의 참가자로부터 수집된 익명화된 건강 데이터를 기반으로 학습되었으며, 덴마크 국가 환자 등록부(National Patient Registry)에 등록된 1.9만 명의 환자 데이터를 사용하여 추가 검증되었습니다. 연구진에 따르면, 이는 생성 AI가 인간 질병 진행을 대규모로 모델링할 수 있는 잠재력을 가장 포괄적으로 보여주는 사례 중 하나입니다.

EMBL 임시 전무이사인 이완 버니는 보도자료를 통해 "저희 AI 모델은 AI가 우리의 장기적인 건강 패턴을 학습하고 이 정보를 활용하여 의미 있는 예측을 도출할 수 있음을 보여주는 개념 증명입니다."라고 밝혔습니다. "시간 경과에 따른 질병의 진행 과정을 모델링함으로써 특정 위험이 언제 발생하는지, 그리고 조기 개입을 위한 최선의 계획은 무엇인지 탐색할 수 있습니다. 이는 의료 서비스에 대한 더욱 개인화되고 예방적인 접근 방식을 향한 중요한 진전입니다."

미래 건강 결과 예측

대규모 언어 모델이 문장 구조를 파악하는 방식과 유사하게, 이 AI 모델은 건강 데이터의 "문법"을 해석하여 병력을 시간 경과에 따른 일련의 사건으로 파악합니다. 이러한 사건에는 의학적 진단과 흡연 습관과 같은 생활 습관이 포함됩니다. 이 모델은 이러한 사건의 순서와 시점을 기반으로 질병 위험을 예측하는 방법을 학습합니다.

EMBL 유럽 생물정보학 연구소(EMBL-EBI)의 톰 피츠제럴드 연구원은 "의료 사건은 종종 예측 가능한 패턴을 따릅니다."라고 덧붙였습니다. "저희 AI 모델은 이러한 패턴을 학습하고 미래의 건강 결과를 예측할 수 있습니다. 개인의 병력 및 기타 주요 요인을 기반으로 어떤 일이 발생할지 예측할 수 있는 방법을 제공합니다. 중요한 것은 이것이 확실한 것이 아니라 잠재적 위험에 대한 추정치라는 것입니다."

이 모델은 특정 암, 심장마비, 패혈증과 같이 진행 패턴이 명확한 질환에 효과적이지만, 정신 건강 장애나 임신 관련 합병증과 같이 변동성이 큰 질환에 대해서는 신뢰도가 낮습니다.

사용 및 제한 사항

일기 예보와 마찬가지로 AI 모델은 확실성보다는 확률을 제공합니다. 예를 들어, 특정 기간 내 심장병 발병 위험을 시간 경과에 따른 통계적 비율로 추정할 수 있습니다. 이는 강수 확률 70%를 예측하는 것과 유사합니다.

단기 예측은 장기 예측보다 더 정확한 경향이 있습니다.

예를 들어, 이 모델은 영국 바이오뱅크 코호트에 속한 60~65세 남성의 심장마비 위험이 서로 다르다는 것을 시사하는데, 발생 확률은 연간 1만 명당 4명에서 100명당 10,000명까지 다양하며, 이는 이전 진단 및 생활 습관에 따라 영향을 받습니다. 여성의 심장마비 위험은 일반적으로 낮지만, 위험 분포는 남성과 유사합니다.

이러한 예측은 영국 바이오뱅크의 다양한 인구통계학적 그룹에서 실제로 관찰된 사례와 잘 일치한다는 점에 유의하는 것이 중요합니다.

이 모델은 정확한 인구 수준의 위험 추정치를 생성하도록 설계되었지만, 한계가 있습니다. 주로 40~60세 연령대를 대상으로 학습되었기 때문에 아동기 및 청소년기 건강 사건은 제대로 대표되지 않습니다.

또한, 특정 인종 집단의 과소 대표를 포함하여 훈련 데이터의 차이로 인해 인구 통계적 편향이 존재합니다.

AI 모델은 아직 임상적으로 사용할 준비가 되지 않았지만, 연구자들이 질병 진행을 이해하고, 생활 방식과 과거 질병이 장기적인 위험에 어떤 영향을 미치는지 탐구하고, 실제 데이터가 제한적이거나 접근이 불가능한 경우 건강 결과를 시뮬레이션하는 데 도움이 될 것으로 기대됩니다.

DKFZ의 종양학 AI 부서장이자 EMBL-EBI의 전 그룹 리더였던 모리츠 게르스퉁은 "이것은 인간의 건강과 질병 진행을 이해하는 새로운 방식의 시작입니다."라고 덧붙였습니다. "저희와 같은 생성 모델은 언젠가 개인 맞춤형 치료를 제공하고 대규모 의료 수요를 예측하는 데 도움이 될 수 있습니다. 이러한 모델은 대규모 인구 집단으로부터 학습함으로써 질병의 진행 방식을 이해하는 강력한 시각을 제공하고 궁극적으로는 더 빠르고 맞춤화된 개입을 지원할 수 있습니다."

출처: 유럽 ​​분자 생물학 실험실