KAIST, 코로나19 해외유입 확진자 수 예측 기술 개발
상태바
KAIST, 코로나19 해외유입 확진자 수 예측 기술 개발
  • 송윤영 기자
  • yaho1130@hanmail.net
  • 승인 2020.08.19 13:00
  • 댓글 0
이 기사를 공유합니다

빅데이터‧AI 기술을 기반으로 K-방역의 우수성을 입증, 글로벌 위상 제고에 기여
오는 24일 국제학술대회 ‘ACM KDD 2020’에서 발표예정
항공편 수와 통신사 로밍 고객 입국자 수를 활용, 기존 대비 정확성이 35% 향상
(사진제공=KAIST) 산업및시스템공학과 이재길 교수(앞열 왼쪽 세번째)와 연구팀
(사진제공=KAIST) 산업및시스템공학과 이재길 교수(앞열 왼쪽 세번째)와 연구팀

(대전=세종충청뉴스) 송윤영 기자 = 최근 전 세계적으로 코로나바이러스감염증-19(COVID-19) 확진자 수가 2,000만 명을 넘어선 가운데 최근 국내에서도 코로나19 확진자 수가 급증해 2차 대유행 조짐을 보이면서 정부는 16~17일부터 서울 등 수도권과 부산 등 일부 지역을 대상으로 사회적 거리두기 단계를 2단계로 격상해 시행 중이다.  

중앙재난안전대책본부(중대본)에 따르면 국내 코로나 누적 확진자 수는 18일 오전 0시 기준으로 총 1만5,761명이다. 이 중 해외유입 감염자 수는 2,662명(18일 오전 0시 기준)으로 전체 확진자의 16.9%를 차지한다. 대륙별로 보면 아시아(중국 외), 미주, 유럽, 아프리카 순이다. 지난 14일 이후 국내 지역 발생 신규확진자 수가 급증하고 있지만 향후 해외유입 확진자 수의 확산추세 또한 결코 장담할 수 없는 상황이다.

이런 가운데 국내 연구진이 해외유입 확진자 수를 예측할 수 있는 관련 기술을 개발했다. KAIST(총장 신성철)는 산업및시스템공학과 이재길 교수 연구팀이 코로나19 해외유입 확진자 수를 예측하는 빅데이터‧인공지능(AI) 기술을 개발했다고 19일 밝혔다.

이재길 교수 연구팀이 개발한 이 기술은 해외 각국의 확진자 수와 사망자 수, 해외 각국에서의 코로나19 관련 키워드 검색빈도와 한국으로의 일일 항공편 수, 그리고 해외 각국에서 한국으로의 로밍 고객 입국자 수 등 빅 데이터에 인공지능(AI) 기술을 적용해 향후 2주간의 해외유입 확진자 수를 예측한다. 

코로나19 확진자 수가 급증할수록 해외유입에 의한 지역사회 확산의 위험성도 항상 뒤따르기 마련이다. 이에 따라 이재길 교수 연구팀이 개발한 정확한 해외유입 확진자 수 예측기술은 방역 시설 및 격리 시설 확충, 고위험 국가 입국자 관리 정책 등에 폭넓게 응용 및 적용될 수 있을 것으로 기대가 크다. 

KAIST 지식서비스공학대학원에 재학 중인 김민석 박사과정 학생이 제1 저자로, 강준혁, 김도영, 송환준, 민향숙, 남영은, 박동민 학생이 제2~제7 저자로 각각 참여한 이번 연구는 최고권위 국제 학술대회 `ACM KDD 2020'의 `AI for COVID-19' 세션에서 오는 24일 발표된다. (논문명 : Hi-COVIDNet: Deep Learning Approach to Predict Inbound COVID-19 Patients and Case Study in South Korea)

해외유입 확진자 수는 다양한 요인에 의해서 영향을 받는다. 일반적으로 해외 각국에서의 코로나19 위험도와 비례하며, 해외 각국에서 한국으로의 입국자 수와도 비례한다. 그러나 코로나19 위험도와 입국자 수를 실시간으로 알아내기에는 많은 제약이 따르므로 연구진은 쉽게 구할 수 있는 종류의 빅데이터를 기반으로 하는 인공지능(AI) 모델을 구축하는 데 성공했다.

연구진은 기본적으로 해외 각국의 코로나19 위험도를 산출할 때, 보고된 확진자 수와 사망자 수를 활용했다. 그러나 이러한 수치는 진단검사 수에 좌우되기 때문에 코로나19 관련 키워드 검색빈도를 같이 입력 데이터로 활용해 해당 국가의 코로나19 위험도를 실시간으로 산출했다.

이와 함께 실시간 입국자 수는 기밀정보로서 외부에 공개되지 않기 때문에 매일 제공되는 한국에 도착하는 항공편수와 로밍 고객 입국자 수를 통해 이를 유추해냈다. 로밍 고객 입국자 수 데이터는 KT로부터 제공 받았 지만 KT 고객 입국자만을 포함한다는 한계를 일일 항공편수를 함께 고려함으로써 이 문제를 해소했다.

이밖에 해외유입 확진자 수 예측을 위해서는 국가 간의 지리적 연관성도 매우 중요하게 고려해야 한다. 어느 특정 국가의 코로나19 발병이 이웃 국가로 더 쉽게 전파되며, 국가 간의 교류도 거리에 따라 영향을 받기 때문이다. 연구팀은 이러한 문제해결을 위해 지리적 연관성을 학습하도록 국가-대륙으로 구성되는 지리적 계층구조에 따라 우선 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측함으로써 궁극적으로 전체 해외유입 확진자 수를 정확히 예측하도록 하는 인공지능(AI) 모델을 설계했다. 연구팀은 이 인공지능 모델을 `Hi-COVIDNet'라고 이름 붙였다. 

이후 연구팀은 약 한 달 반에 걸친 단기간의 훈련 데이터만으로 생성된 `Hi-COVIDNet'을 통해 향후 2주 동안의 해외유입 확진자 수를 예측한 결과, 이 모델이 기존의 시계열 데이터기반의 예측 기계학습이나 딥러닝 기반의 모델과 비교했을 때 최대 35% 더 높은 정확성을 지니고 있음을 확인했다. 

제1 저자인 김민석 박사과정 학생은 "이번 연구는 최신 AI 기술을 코로나19 방역에 적용할 수 있음을 보여준 사례ˮ 라면서 "K-방역의 위상을 높이는데 기여할 것으로 기대한다ˮ 고 밝혔다. 

이번 연구는 KAIST 글로벌전략연구소(소장 김정호)의 코로나19 AI 태스크포스팀의 지원을 받았고, KT(담당 변형균 상무)와 과학기술정보통신부(담당 김수정 서기관)의 `코로나19 확산예측 연구 얼라이언스'를 통해 로밍 데이터 세트를 지원받아 이뤄졌다.  

그림 1. 코로나19 해외유입 확진자 수 예측 방법의 모식도(코로나19 해외유입 확진자 수 예측 방법의 모식도: 해외 각국에서의 발병 건수, 관련 키워드 검색 횟수, 한국으로의 입국 항공편수, 입국 로밍 고객 수 등의 빅데이터와 과거 해외유입 확진자 수 동향으로 인공지능 모델을 훈련하여 향후 2주의 해외유입 확진자 수를 예측한다)
그림 1. 코로나19 해외유입 확진자 수 예측 방법의 모식도(코로나19 해외유입 확진자 수 예측 방법의 모식도: 해외 각국에서의 발병 건수, 관련 키워드 검색 횟수, 한국으로의 입국 항공편수, 입국 로밍 고객 수 등의 빅데이터와 과거 해외유입 확진자 수 동향으로 인공지능 모델을 훈련하여 향후 2주의 해외유입 확진자 수를 예측한다)
그림 2. 연구팀에서 개발한 인공지능 모델의 신경망 구조(연구팀에서 개발한 인공지능 모델의 신경망 구조: 국가 인코더(하부)와 대륙 인코더(상부)로 구성된다. 국가 인코더에서는 국가별 코로나19 위험도와 입국자 수를 학습한다. 대륙 인코더에서는 해당 국가들의 인코더 출력을 취합하여 대륙별 코로나19 위험도와 입국자 수를 학습한다. 이를 통해 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측함으로써 전체 해외유입 확진자 수를 정확히 예측하는 것이 가능해진다)
그림 2. 연구팀에서 개발한 인공지능 모델의 신경망 구조(연구팀에서 개발한 인공지능 모델의 신경망 구조: 국가 인코더(하부)와 대륙 인코더(상부)로 구성된다. 국가 인코더에서는 국가별 코로나19 위험도와 입국자 수를 학습한다. 대륙 인코더에서는 해당 국가들의 인코더 출력을 취합하여 대륙별 코로나19 위험도와 입국자 수를 학습한다. 이를 통해 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측함으로써 전체 해외유입 확진자 수를 정확히 예측하는 것이 가능해진다)

□ 연구개요

1. 연구 배경
세계보건기구(WHO)가 2020년 3월 11일 코로나19 팬데믹(pandemic)을 선포하였다. 코로나19 누적 확진자 수는 전 세계적으로 약 2,000만 명에 이르러, 대부분 국가에서 심각한 사회적 문제를 일으키고 있다. 이로 인해 포스트 코로나 뉴 노멀의 시대에 대비해야 한다는 인식이 강해지고 있다. 코로나19 종식보다는 코로나19 전파를 최소화하며 새로운 일상에 적응해야 한다는 뜻이다. 이를 위해서는 코로나19 전파경로를 정확하게 판별하는 것이 중요하며, 해외유입은 주요 전파경로 중의 하나이다. 2020년 7월로 들어서면서 해외유입 신규확진자가 국내발생 신규확진자를 앞지르고 있다. 따라서, 본 연구에서는 특정 국가로의 해외유입 확진자 수를 예측할 수 있는 빅데이터‧인공지능 기술을 개발한다.

2. 연구 내용
특정 국가로의 해외유입 확진자 수 동향은 다양한 요인에 의해서 영향을 받는다. 해외 각국에서의 코로나19 위험도에 비례하며, 해외 각국에서 한국으로의 입국자 수에 비례한다. 연구팀은 이러한 경향을 모델링 할 수 있도록 다양한 종류의 획득 가능한 빅데이터를 활용하였다. 우선 해외 각국의 코로나19 위험도는 보고된 확진자 수와 사망자 수를 기본적으로 활용하였다. 그러나 이러한 수치는 진단검사 수에 좌우되기 때문에 코로나19 관련 키워드 검색빈도를 같이 입력하여 실시간으로 해당 국가의 코로나19 위험도를 산출하였다. 그리고 실시간 입국자 수는 기밀정보로서 외부에 공개하지 않고 있어서, 매일 제공되는 한국 도착 항공편수와 로밍 고객 입국자수를 통해 이를 유추하려 시도하였다. 로밍 고객 입국자 수는 한국 국적의 입국자만을 주로 포함하기 때문에, 항공편수를 함께 고려하여 이러한 제약을 극복하였다. 또한, 연구팀은 해외유입 확진자 수와 지리적 연관성을 모델링 하기 위해서 국가-대륙으로 구성되는 지리적 계층구조를 고려하였다. 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측함으로써 전체 해외유입 확진자 수를 정확히 예측하도록 인공지능 모델을 설계하였다. 약 1달 반 동안의 훈련 데이터로 생성된 인공지능 모델로 향후 2주간 한국으로의 해외유입 확진자 수를 예측한 결과, 연구팀의 인공지능 모델은 기존의 시계열 데이터 예측 기계학습 혹은 딥러닝 모델 대비 최대 35% 더 높은 예측 정확도를 달성하였다.

3. 기대 효과
코로나19 국내 유입 차단을 위해서 인천국제공항 등지에 검역소를 운영하고 있는데, 해외유입 확진자 수 예측결과는 검역관, 진단키트 등의 검역자원을 적절하게 배치하고 입국자 자가격리시설을 적절히 확보하기 위한 근거로 활용할 수 있다. 또한, 정부의 입국검역 강화와 특별 입국절차 제정에 대한 근거로도 활용할 수 있다. 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
이슈포토