스탠포드에서 개발한 새로운 AI 모델인 SleepFM은 실험실에서 기록된 하룻밤 수면 데이터를 미래 질병에 대한 강력한 조기 경보 시스템으로 활용합니다. 수면의 "언어"를 학습함으로써 심장병부터 암에 이르기까지 다양한 질병의 위험을 예측할 수 있습니다.
수면 연구실에서 하룻밤을 보내는 것이 언젠가는 코골이나 불면증 진단 이상의 의미를 가질 수 있을 것입니다. 증상이 나타나기 몇 년 전에 심각한 질병을 조기에 발견할 수 있는 경고 시스템 역할을 할 수도 있습니다.
스탠포드 의대 연구진과 공동 연구진은 SleepFM이라는 인공지능 모델을 개발했는데, 이 모델은 하룻밤 동안의 상세한 수면 기록을 분석하여 100가지가 넘는 다양한 질병에 걸릴 위험을 예측할 수 있습니다.
작품, 출판 네이처 메디신(Nature Medicine) 저널에 발표된 이 연구는 수면 전문의들이 수십 년 동안 수집해 왔지만 부분적으로만 활용해 온 자료, 즉 뇌파, 심장 박동, 호흡, 눈 움직임, 근육 활동 등을 추적하는 표준적인 야간 수면 검사인 수면다원검사(polysomnography)를 활용합니다.
수면다원검사는 이미 수면무호흡증 및 기타 수면 장애 진단에 핵심적인 역할을 하고 있습니다. 그러나 각 검사에서 생성되는 풍부하고 연속적인 생리학적 데이터는 보고서 작성 후에는 대부분 활용되지 않고 있습니다.
스탠포드 수면 의학과 크레이그 레이놀즈 석좌교수이자 이번 연구의 공동 선임 저자인 에마뉘엘 미뇨는 보도자료에서 “수면 연구를 할 때 놀라울 정도로 많은 신호를 기록합니다.”라고 밝혔습니다. “피험자를 완전히 통제된 상태로 8시간 동안 관찰하면서 전반적인 생리 현상을 연구하는 것이죠. 그만큼 데이터가 풍부합니다.”
SleepFM은 그러한 데이터를 활용하도록 설계되었습니다.
SleepFM은 대규모 언어 모델과 같은 광범위한 AI 범주인 "기초 모델"로 개발되었으며, 약 65,000명의 수면 연구 참여자로부터 수집한 거의 600,000시간 분량의 수면다원검사 데이터를 기반으로 학습되었습니다. 가장 큰 데이터 그룹은 1970년대부터 수면 기록을 수집하고 이를 장기적인 건강 기록과 연계해 온 스탠퍼드 수면 의학 센터에서 제공되었습니다.
인공지능의 관점에서 볼 때, 수면은 간과되어 온 분야입니다.
스탠포드 생의학 데이터 과학 부교수이자 공동 선임 저자인 제임스 조우는 "인공지능 관점에서 수면은 상대적으로 연구가 부족한 분야입니다. 병리학이나 심장학을 연구하는 인공지능 연구는 많지만, 삶에서 매우 중요한 부분인 수면을 연구하는 연구는 상대적으로 적습니다."라고 덧붙였습니다.
SleepFM을 훈련시키기 위해 연구팀은 언어 모델이 개별 단어와 구문을 학습하는 방식과 유사하게 하룻밤 동안의 수면 연구 데이터를 5초 단위로 나누었습니다. 각 데이터 조각에는 뇌 활동(뇌전도), 심장 활동(심전도), 근육 활동(근전도), 호흡 기류 및 맥박과 같은 여러 데이터 스트림이 포함되었습니다.
"SleepFM은 본질적으로 수면의 언어를 배우는 것입니다."라고 Zou는 덧붙였다.
연구진은 또한 '한 가지 신호만 숨기는 대조 학습'이라는 새로운 훈련 전략을 개발했습니다. 간단히 말해, 심장 박동과 같은 한 가지 유형의 신호를 숨기고 나머지 신호를 사용하여 모델이 해당 신호를 재구성하도록 하는 것입니다. 이를 통해 인공지능은 신체의 야간 생리 현상이 서로 어떻게 연관되는지 이해하게 됩니다.
"이번 연구에서 우리가 이룬 기술적 진전 중 하나는 이러한 다양한 데이터 방식을 조화시켜 동일한 언어를 학습할 수 있도록 하는 방법을 알아낸 것입니다."라고 Zou는 덧붙였습니다.
이러한 광범위한 교육 단계를 거친 후, 팀은 특정 작업에 맞게 SleepFM을 세밀하게 조정했습니다.
먼저, 연구진은 기존 수면 AI 도구들이 이미 시도하고 있는 것처럼 수면 단계를 분류하고 수면 무호흡증의 심각도를 평가하도록 SleepFM에 요청했습니다. 이러한 기준에서 SleepFM은 현재 최첨단 모델과 동등하거나 그 이상의 성능을 보였습니다.
연구진은 한 걸음 더 나아가 하룻밤 수면 속에 숨겨진 패턴이 미래의 질병을 예측할 수 있는지 여부를 실험했습니다.
스탠포드 수면 의학 센터는 수십 년간 축적된 수면 연구 관련 전자 건강 기록을 보유하고 있기 때문에, 연구팀은 어떤 환자들이 나중에 다양한 질환에 걸렸는지 확인할 수 있었습니다. 이를 통해 연구팀은 수면 데이터에서 이러한 질환의 발병을 예측할 수 있는 단서가 있는지 질문할 수 있었습니다.
SleepFM은 1,000개 이상의 질병 범주를 분석한 결과, 원본 수면 기록을 기반으로 상당히 정확하게 예측할 수 있는 질병이 130개라는 것을 발견했습니다. 이 모델은 특히 암, 임신 합병증, 순환기 질환 및 정신 질환에 대한 예측력이 뛰어났습니다.
연구진은 성능을 측정하기 위해 표준 지표인 일치도 지수(C-index)를 사용했는데, 이 지표는 모델이 누가 더 빨리 병에 걸릴 가능성이 높은지 얼마나 잘 예측하는지를 나타냅니다.
"이 모델은 모든 가능한 개인 쌍에 대해 누가 심장마비와 같은 사건을 더 일찍 경험할 가능성이 높은지 순위를 매깁니다. C-지수가 0.8이라는 것은 모델의 예측이 실제 결과와 80% 일치한다는 의미입니다."라고 Zou는 덧붙였습니다.
SleepFM은 파킨슨병, 치매, 고혈압성 심장 질환, 심장마비, 전립선암, 유방암 및 전체 사망률을 포함한 여러 심각한 질환에서 해당 수준에 도달하거나 이를 초과했습니다.
"다양한 조건에서 모델이 유용한 예측을 내놓을 수 있다는 점에 기분 좋게 놀랐습니다."라고 Zou는 덧붙였습니다.
C-index 점수가 다소 낮은 모델들도 이미 종양학 및 기타 전문 분야에서 치료 결정 지침으로 사용되고 있으므로, SleepFM의 성능은 검증을 거쳐 신중하게 활용한다면 임상적으로 의미 있는 결과를 가져올 수 있을 것이다.
이번 연구는 인공지능이 예방 의학을 어떻게 변화시킬 수 있을지에 대한 통찰력도 제공합니다. 정기적인 수면 검사를 통해 특정 암이나 심혈관 질환의 위험 증가를 수년 전에 미리 파악할 수 있다면, 의사들은 질병이 발병하기 훨씬 전에 더 잦은 검진, 생활 습관 개선 또는 면밀한 모니터링을 권장할 수 있을 것입니다.
현재 SleepFM은 연구 도구이며, 환자들이 수면 클리닉 방문 시 접하게 될 도구는 아닙니다. 연구팀은 예측 기능을 개선하고 모델을 더 쉽게 해석할 수 있도록 개발 중입니다.
"영어로는 그 내용을 설명해주지 않아요."라고 저우는 덧붙였다. "하지만 우리는 모델이 특정 질병을 예측할 때 무엇을 고려하는지 파악하기 위해 다양한 해석 기법을 개발했습니다."
이러한 기술들은 특정 질병에 특정 신호가 더 중요하다는 것을 시사합니다. 예를 들어 심장 질환에는 심장 박동이, 정신 질환에는 뇌파가 더 중요합니다. 하지만 모델은 여러 채널을 동시에 비교할 수 있을 때 가장 좋은 성능을 발휘합니다.
미뇨는 "질병 예측에 가장 많은 정보를 얻을 수 있었던 방법은 서로 다른 채널들을 비교 분석하는 것이었다"고 덧붙였다.
다시 말해, 수면 중에 신체의 각 부분이 서로 조화를 이루지 못할 때 문제가 발생할 수 있습니다. 예를 들어, 뇌 활동은 깊은 휴식을 나타내는데 심장은 비정상적으로 활발하게 움직이는 경우입니다.
연구진은 향후 수면다원검사보다 세부적인 데이터는 부족하지만 대규모 수집이 훨씬 용이한 소비자용 웨어러블 기기의 데이터를 통합하여 SleepFM을 개선할 계획입니다. 또한, 이 모델을 다양한 인구 집단과 의료 시스템에 적용하고, 시간이 지남에 따라 개인의 수면 패턴 변화가 질병 위험과 어떻게 관련되는지 탐구할 수 있는 가능성도 보고 있습니다.
이 프로젝트에는 스탠포드 대학교, 덴마크 공과대학교, 코펜하겐 대학병원(리그스호스피탈레트), 바이오세레니티, 코펜하겐 대학교 및 하버드 의과대학의 과학자들이 참여했습니다.
학생과 신진 연구자들에게 SleepFM은 오랜 임상 관행을 현대 AI로 어떻게 재해석할 수 있는지 보여주는 사례 연구입니다. 수면 장애 진단을 위해 설계된 이 검사는 우리가 신호를 해석하는 방법을 배운다면 암, 심장 질환, 뇌 건강에 대한 단서도 제공할 수 있습니다.
출처: 스탠포드 의학

