KAIST, 강수 관측 오차범위 42.5% 줄인 알고리즘 개발
상태바
KAIST, 강수 관측 오차범위 42.5% 줄인 알고리즘 개발
  • 송윤영 기자
  • yaho1130@hanmail.net
  • 승인 2023.04.25 17:12
  • 댓글 0
이 기사를 공유합니다

김형준 교수 및 일본 도쿄대 공동연구팀, 인공위성의 마이크로파 라디오미터 관측을 이용해 지상 강수량을 추정하는 새로운 기계학습 방법을 제안
강수 강도(회귀)와 강수 유무(분류)의 동시 추정 작업을 모델에 명시적으로 포함함으로써 알고리즘의 정확도를 향상
사진 1. KAIST 문술미래전략대학원 김형준 교수
(사진제공=KAIST) 문술미래전략대학원 김형준 교수

(대전=세종충청뉴스) 송윤영 기자 = 강수량의 정확한 파악은 지구의 물 순환을 이해하고 수자원과 재해 대응을 위해 중요하다. 강수량 추정을 위한 알고리즘에는 다양한 방법들이 제안되어 왔으며, 최근에는 기계학습을 이용한 방법들이 많이 제안되고 있다.

KAIST(총장 이광형)는 문술미래전략대학원(건설및환경공학과 및 녹색성장지속가능대학원 겸임) 김형준 교수와 도쿄대 등으로 구성된 국제 공동연구팀이 인공위성에 탑재된 마이크로파 라디오미터(주1)의 관측값을 이용해 지상 강수량을 추정하는 새로운 기계학습 방법을 제안했다고 25일 밝혔다. 연구팀은 기존의 방법과 비교해 전 강수량에 대해 오차(RMSE)를 최소 15.9%에서 최대 42.5%까지 줄이는 데 성공했다.

단순한 데이터 주도(data-driven)모델(주2)은 대량의 훈련 데이터가 필요하고 물리적인 일관성이 보장되지 않으며 결과의 원인 분석이 어렵다는 등의 문제가 있었다. 연구팀은 이번 연구에서 위성 강수량 추정에 대한 분야 지식을 명시적으로 포함함으로써 학습 모델 내의 상호 의존적인 지식 교환을 구현했다. 구체적으로, 멀티태스크 학습(multitask learning)(주3)이라는 심층 학습 기법을 사용해 강수 여부를 인식하는 분류 모델과 강수 강도를 추정하는 회귀 모델을 통합하고 동시에 학습시켰다.

이번 연구에서 제안한 기계학습 모델에는 이번에 포함된 메커니즘 외에도 다양한 물리적 메커니즘을 포함할 수 있다. 예를 들어, 비 또는 눈, 진눈깨비 등 강수 종류의 분류 및 상승 기류 또는 층상 구름 유형 등 강수를 일으키는 구름 유형의 분류를 포함함으로써 앞으로 추정의 정확도가 더욱 향상될 것으로 기대된다.

KAIST 김형준 교수의 이번 연구 결과는 국제 학술지 ‘지구물리 연구 레터(Geophysical Research Letters)’에 지난 4월 16일 출판됐다. (논문명: Multi-Task Learning for Simultaneous Retrievals of Passive Microwave Precipitation Estimates and Rain/No-Rain Classification; doi:10.1029/2022GL102283)

한편 이번 연구는 한국연구재단 해외우수과학자유치사업(BP+)와 정보통신기획평가원 인공지능대학원지원(한국과학기술원)지원을 받아 수행됐다.

붙임 : 연구개요, 그림 설명

□ 주

(주1) 마이크로파 라디오미터

마이크로파 라디오미터는 물체가 방출하는 전자파(마이크로파)를 관측하는 센서로서 강수량 추정에서는 빗방울에서 방출되는 마이크로파의 방사 강도를 측정하고 그 측정값으로 강수량을 추정.

(주2) 데이터 구동형 모델

 데이터 기반 모델이란 대량의 데이터에서 자동으로 패턴을 인식하여 모델을 구축하는 방식으로서 인간의 주관적인 판단이나 선입견을 배제할 수 있고 수작업으로 설계하기 어려운 복잡한 패턴을 모델링할 수 있음.

(주3) 멀티태스킹 학습

멀티태스킹 학습은 하나의 모델로 여러 개의 태스크(문제)를 해결하는 딥러닝 기법으로 관련된 여러 태스크를 동시에 학습시킴으로써 태스크 간의 공통 요소를 학습하여 모델의 전반적인 성능이 향상되는 것으로 알려져 있음.

(주4) 합성곱 신경망(Convolutional neural network, CNN)

CNN은 이미지의 특징 추출에 활용되는 딥러닝 알고리즘의 일종으로 이미지의 국소적인 패턴(에지, 텍스처, 형상 등)을 추출하는 데 활용되며, 필터라는 작은 행렬의 컨볼루션을 통해 입력 이미지를 고차원 공간의 특징으로 변환.

(주5) 구름미세물리

구름미세물리는 대기 중 구름의 미세한 입자와 물리적 과정에 대해 연구하는 분야로서 구름의 구성요소인 물방울, 빙정, 강설 입자 등 미세입자의 발생, 성장, 증발, 응결, 충돌 등의 물리적 거동을 설명. 이러한 미세입자의 거동은 구름의 발생과 소멸, 강수의 형태와 양에 영향을 미침.

(주6) 블랙박스 모델

블랙박스 모델은 입력과 출력의 값은 알 수 있지만, 내부 구조와 메커니즘이 불분명한 모델을 일컫는 용어로 데이터 양이 방대하고 복잡한 문제를 해결할 때 높은 정확도를 보일 수 있지만, 모델의 설명 가능성이 낮아 예측 결과에 대한 이해와 신뢰도가 떨어질 수 있어 실제 문제에 적용하는 경우 불안요소로 작용함.

□ 연구개요

배경

강수량의 정확한 파악은 지구의 물 순환을 이해하고 수자원과 재해 대응을 위해 중요하다. 고해상도의 전지구 강수량 자료에 있어서 위성 관측은 유일한 수단이라 할 수 있으며, 2014년 NASA(National Aeronautics and Space Administration)와 JAXA(Japan Aerospace Exploration Agency)가 주도적으로 시작한 전지구 강수량 관측(Global Precipitation Measurement) 계획(Global Precipitation Measurement, GPM)이 핵심적인 역할을 담당하고 있다. GPM의 강수량 추정을 위한 알고리즘에는 다양한 방법들이 제안되어 왔으며, 최근에는 기계학습을 이용한 방법들이 많이 제안되고 있다. 그러나 이러한 기존 방법들은 데이터 기반 모델이며, 위성 관측으로부터 강수량을 추정하는 작업에 대한 지식은 고려하지 않고 있다. 이에 본 연구에서는 위성 강수량 추정에 대한 이해를 모델에 명시적으로 반영하여 모델 내에서 상호 의존적인 지식의 교환을 통해 강수량 추정 정확도를 향상시키는 방법을 제안하였다.

2. 연구 내용

본 연구에서는 전지구 강수량 관측 계획에 탑재된 마이크로파 방사계로부터 지상 강수량을 추정하기 위한 기계학습 기법을 제안한다. 모델은 합성곱 신경망(Convolutional neural network, CNN)(주4)를 이용하여 강수량을 출력하는 모델을 설계하였다. 이 모델에 대해 멀티태스크 학습이라고 하는 딥러닝 기법을 이용하여 강수량 분류 모델과 강수량 추정 모델을 통합하여 동시에 학습하는 모델을 제안하였다. 멀티태스크 학습은 영상처리나 자연어 처리 분야에서 그 효과가 검증된 기법으로, 본 연구에서는 이를 위성 강수량 추정에 적용하였다. 적용에 있어 기상 분야에서 사용되는 임계값으로 강수 강도를 '약한 비', '중간 비', '강한 비'로 정의하고 이를 분류하는 모델을 강수량 추정의 관련 태스크로 정의하였다.

또한 기계학습의 오차를 고려한 평가를 위해 모델을 여러 번 독립적으로 학습시키고 그 평균과 분산을 고려하여 결과를 평가하는 실험(앙상블 실험)을 채택하였다(그림 1). 실험 결과, 제안 모델은 기존 GPM 기반의 강수 자료 대비 강수량 추정에서 15.9-42.5%(Root Mean Squared Error, RMSE), 강우 유무 분류에서 5.3-34.3%(Critical Success Index)의 개선율을 달성했다. 또한, 기존 딥러닝 모델을 이용한 실험과의 비교에서도 제안된 모델이 전반적으로 더 나은 정확도를 구현하고, 편향이 적은 강수량 추정을 실현하고 있음을 확인했다.

강수량 추정과 강수 유무 분류를 동시에 학습하여 정확도를 향상시킬 수 있었던 이유로는 위성 마이크로파 라디오미터를 이용한 강수 관측에 있어서 두 학습의 물리적 메커니즘이 동일하고, 동시 학습을 통해 모델 내에서 지식 공유가 이루어졌기 때문으로 생각된다. 따라서 비, 눈, 진눈깨비 등 강수 종류 분류와 강수를 가져오는 구름 종류 분류도 물리적으로 연관된 현상이기 때문에 이를 동시에 학습하는 것도 정확도 향상에 도움이 될 수 있을 것으로 판단된다.

3. 기대 효과

본 연구에서는 강수 강도와 강수 분류의 물리적 정합성에 주목하여 모델을 제안하였지만, 본 방법은 다양한 물리적 강수 과정을 모델 내에서 표현하는 것으로 확장할 수 있으며, 향후 기상학 및 구름미세물리(주5)와의 융합을 통해 모델 정확도를 더욱 향상시킬 수 있을 것으로 기대된다. 또한 물리적 이해와 기계학습의 융합을 통해 대량의 훈련 데이터, 물리적 정합성 미확보, 블랙박스 모델(주6) 등 잘 알려진 데이터 기반 모델의 문제점을 해소하는 데 기여할 수 있으며 그런 점에서 본 연구는 향후 기계학습을 이용한 위성 강수량 추정에 새로운 가능성을 제시했다고 볼 수 있다.

그림1 다중작업학습(Multi-task Learning)과 단일작업학습(Single-task Learning)의 개념도
그림1 다중작업학습(Multi-task Learning)과 단일작업학습(Single-task Learning)의 개념도
그림2 다중작업학습 알고리즘을 이용한 강수 추정과 기존 위성 강수 관측 자료와의 성능 비교
그림2 다중작업학습 알고리즘을 이용한 강수 추정과 기존 위성 강수 관측 자료와의 성능 비교

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사
이슈포토