< 개발된 메타분석 기반 기계학습 알고리즘의 도식 [한국연구재단 사진인용] >
[한국기술뉴스] 4일 한국연구재단은 건국대학교 김성영 교수 연구팀이 메타분석 기반 기계학습 알고리즘으로 암을 구별할 수 있는 인공지능 플랫폼을 개발했다고 밝혔다.
인공지능 의학에 관심이 증가하면서 다중오믹스 데이터와 기계학습을 활용한 예측 암진단 기술이 개발되고 있다. 하지만 예측 인자와 모델이 연구자별로 상이해 보다 객관적이고 신뢰할 수 있는 모델 발굴 및 검증 요구가 높아지고 있다.
연구팀은 연구결과를 일관성 있게 평가하고 통계적 정확도를 높이기 위해 메타분석을 기반으로 연구했다. 암조직 유전자 발현 및 관련 생물경로를 메타분석 기반 알고리즘으로 통합하고 인공지능을 위한 학습재료로 사용했다.
메타분석
유사한 주제로 실시된 개별연구에 나타난 연구 추정치를 공통된 효과크기로 전환하여 실험결과를 객관적이고 일반화시키는 방법으로 근거중심의학의 핵심이 되는 통계기법이다.
유전체 빅데이터는 ‘차원의 저주’라 불리는 고차원 문제에 직면한다. 연구팀은 비선형 주성분 분석과 생물경로를 이용한 차원축소 방법이 모델의 일반성과 해석력을 크게 끌어올리는 것을 확인했다. 이렇게 만들어진 알고리즘을 실제 암맹 갑상선암 샘플에 검증한 결과 높은 성능을 나타냈다. 여러 갑상선암 아형을 테스트한 결과 높은 정확도로 이들 아형까지도 구분했다. 노화관련 질환인 점을 고려하여 노화인자를 교정한 고위험군에서도 이 모델의 성능을 확인했다.
유전체 발현 데이터는 연구자 및 수행기관, 분석플랫폼 별로 예측인자와 모델이 상이하다. 개발된 메타분석 및 생물경로 기반 알고리즘은 보다 객관적이고 해석력이 뛰어났다. 실제 연구팀은 다중오믹스 분석을 통해 갑상선암 관련 생물경로의 조절인자를 찾아내 모델의 해석력을 극대화했다.
한편 개발된 알고리즘은 갑상선암 이외의 다른 암으로도 쉽게 응용될 수 있다. 또한 회귀 및 경로 분석 기반 알고리즘으로 일관성을 중시하는 임상에서 선호할 것으로 기대된다.
이번 연구는 수학 및 컴퓨터생물학 분야 국제학술지 브리핑스 인 바이오인포메틱스(Brief. Bioinform)에 최신호에 게재될 예정이다.