메인메뉴 바로가기
본문바로가기

과학이야기 재미있고 다양한 과학이야기를 읽어보세요

코로나-19 진단검사 전에 시행한 AI 테스트, 결과는?
조회 261 2021.06.07 신고


2021년 4월 19일. 필자의 두 자녀가 다니는 학교에서 ‘코로나-19’ 학생 확진자가 발생하였다. 해당 학생과 동선이 겹친 두 자녀는 다음날 보건소에서 코로나 진단검사를 받을 것을 통보받았다. 그동안은 남의 이야기처럼 생각했던 아이들도 꽤 당황스러운 모습이었다. 다행히도 무증상이지만, 불안해하는 두 자녀를 위해 코로나 진단검사 전날, AI 테스트를 먼저 시행해보았다.






" MIT AI Model을 활용, 기침 소리로 코로나-19 예측 "


기침 소리로 그 사람이 ‘코로나-19’에 감염되었는지를 예측해보는 인공지능으로 미국 MIT 연구소에서 개발한 모델이다. 이에 대한 자세한 내용은 앞서 소개한 포스팅을 참고하자.  열어보기 







1단계. 두 자녀의 기침 소리 녹음


제일 중요한 두 자녀의 기침 소리를 생성한다. 스마트폰 녹음 기능을 이용하여 각 3번의 기침 소리를 녹음하고 파일(*.m4a)로 저장하였다.




Sample 1




Sample 2







저장된 음성파일은 2채널(스테레오)로 이루어져 있다. 여기서는 1채널만 필요하기에, 잡음이 덜한 첫 번째 채널을 추출햇으며, 이후 3번의 기침소리를 하나씩 분리하여 각각의 파일(*.mp3)로 저장하였다.






2단계. MIT AI Model을 바탕으로 재연한 인공지능 예측모델


MIT 연구소에서 발표한, 기침 소리로 코로나-19 감염을 예측하는 AI Model을 바탕으로 인공지능 예측모델을 재연해 보았다. 이는 앞서 소개한 포스팅 ‘내 기침 소리는 코로나일까?’에서 자세히 확인할 수 있다. 인공지능 예측모델에서는 총 121개의 양성·음성인 사람들의 기침 소리를 이용하여, 101개는 훈련용 데이터로 기계학습에 사용하고 나머지 20개는 테스트용 데이터로 사용하였다. 기계학습을 마친 후 시행한 검증에서는 훈련용 데이터 샘플의 분류에 따라 매번 달라지기는 하지만, 20개의 기침 소리 중 평균 17개를 맞추어 대략 85% 내외의 신뢰도를 보여주고 있다.







3단계. 두 자녀의 기침 소리 AI 테스트


위의 과정을 거쳐 재연해본 인공지능 예측모델에서 기계학습을 마친 후, 두 자녀의 기침 소리 샘플 각 3개를 테스트한 결과는 모두 음성(neg)이 나왔다.



각 기침 소리의 테스트 결과는 위와 같이 나타난다. 이 결과를 통해 기침 소리의 데이터가 양성(pos)과 음성(neg) 중에 어디에 더 가까운지를 확률로 계산하고, 이 중 높은값으로 최종적인 판정을 한다. <| pos→0.305906, neg→0.694094 |> 결과를 예시로 분석해 보면, 기침 소리가 양성(pos)에 가까울 확률이 0.305906이고 음성(neg)에 가까울 확률이 0.694094인 것이며 결과적으로 음성(neg)의 확률이 더 높기 때문에 해당 기침 소리 샘플은 음성(neg)으로 판별할 수 있는 것이다. 


하지만 여기서 이 확률값이 높다고 해서 더욱 신뢰하고, 낮다고 해서 더욱 신뢰하지 못하는 것은 아니다. 실제 양성(pos) 및 음성(neg) 기침 소리의 신뢰도 검증결과를 보면, 아래의 표처럼 양성일 확률 (pos→0.885736)이 아주 높게 나왔어도 실제는 음성이었으며, 음성일 확률(neg→0.772386)이 아주 높게 나왔어도 실제는 양성인 경우도 있었다.



따라서 두 자녀의 AI 테스트 결과에 대한 신뢰도는 각 테스트에서 보여주는 개별적 확률이 아닌, 검증과정에서 얻은 전체적인 신뢰수준 85%로 보는 것이 타당하다. 신뢰도 85%가 결코 높은 수준이라고 말할 수는 없지만, 총 3번의 테스트 결과가 동일했기에 두 자녀는 조금의 심적 안정을 취하고 다음 날 선별진료소에 가서 코로나-19 진단검사를 받았다.






두 자녀의 코로나-19 진단검사 결과


다행스럽게도 두 자녀의 진단검사 결과 역시 음성(neg)으로 통보받았다. 그렇다고 여기서 활용된 85% 신뢰수준의 AI Model을 일반화시킬 수는 없다. MIT에서 수많은 데이터를 훈련시켜 만든 97.1% 신뢰수준의 AI Model 역시 그것의 활용에는 좀 더 많은 검증과 활용 방안에 대한 연구가 필요할 것이다.계학적으로 99% 신뢰도라는 것이 무척 높은 확률이기는 하다. 하지만, 집단의 규모가 큰 인구를 대상으로 한 감염병의 관점에서 1% 위험률은 100명 중 1명의 잘못된 진단을 초래할 수 있음을 의미한다. 이로 인하여 감지하지 못한 감염자로 인한 확산의 위험성은 여전하기에 더욱 보수적으로 접근해야 한다. 

 

최근 ‘코로나-19’가 좀처럼 진정되지 않자 정부에서는 신속한 검사를 위하여 자가진단키트 활용도 검토하고 있다. 알려진 바에 의하면, 자가진단키트의 신뢰수준은 약 96% 수준의 특이도(음성을 음성이라 판정)와 90% 수준의 민감도(양성을 양성이라 판정)를 보이고 있다. 자가진단키트의 도입에 대하여 의견이 분분한 이유도 바로 여기에 있다. ■

 




 이 글에서 소개한 내용은 세계적으로 유명한 Mathematica 소프트웨어로 구현한 것이며, 이는 파주여고 이장훈 선생님의 홈페이지 수학생각(http://www.mathought.com)의 수학실험실에서 Dynamic한 실험과 조작을 통하여 더욱 즐겁게 관찰할 수 있다. 단, 공개프로그램인 Wolfram CDF Player를 설치한 PC에서 작동이 가능하다.


바로가기

RNN-AI Model : 기침소리로 코로나 감염 예측 실험보고서

○ RNN-AI Model : 코로나19 진단검사 전 시행한 AI TEST 진행과정

0 댓글0
추천콘텐츠
TOP으로 이동