코로나19의 종료 시점을 예측할 수 있을까? > 과학기술칼럼

본문 바로가기

코로나19의 종료 시점을 예측할 수 있을까?

페이지 정보

최성우 작성일2020-03-30 11:02

본문

코로나19 바이러스가 여전히 맹위를 떨치면서 전 세계적으로 고통과 혼란이 지속되고 있다. 특히 우리나라의 경우 하루 확진자 증가 폭이 100명 안팎을 오가면서 다소 줄어들기는 하였지만, 미국과 유럽 등지에서 감염자가 급증하는 현재 외국으로부터의 유입을 차단하는 것이 새로운 고민거리가 되고 있다.
 많은 사람들은 코로나19 바이러스의 유행이 언제쯤 종료될 수 있을 것인지, 또한 그 시점을 정확히 예측할 수 있을지 궁금해할 것이다. 이와 관련해서 도움을 줄 수 있는 과학 분야가 바로 생물통계학(Biostatistics)과 복잡계 물리학 등이다. 지금도 관련 연구를 하는 이들이 국내외에 적지 않은데, 전염병 확산 모델 등과 함께 이 문제에 대해 살펴보는 것도 큰 의미가 있을 듯하다.

 현재의 코로나19 바이러스뿐만 아니라, 오래전부터 인류를 위협하거나 큰 피해를 끼친 전염병은 대단히 많다. 흑사병이라고도 불리는 페스트가 중세 이후 유럽에서 가끔 대유행할 때에는 갑자기 인구의 3분의 1 이상이 줄어든 나라들도 있을 정도로 엄청난 희생자를 냈고, 신대륙의 발견 이후 유럽인들이 이곳에 전파한 천연두 바이러스에 의해 원주민들은 거의 절멸할 정도가 되었다.
 제1차 세계대전 직후인 1918 년에 창궐한 스페인 독감은 전 세계적으로 사망자가 5000만 명 이상까지 이르렀을 것으로 추정되며, 20세기 후반 이후에도 가공할 치사율을 지닌 에볼라(Ebola) 바이러스, 에이즈(AIDS), 사스(SARS), 신종 플루 등이 지속적으로 인류를 괴롭혀왔다. 또한 생물학적인 감염병은 아니지만 컴퓨터 바이러스의 창궐 역시 순식간에 수많은 컴퓨터를 감염시키거나 인터넷망을 마비시키는 등 큰 피해를 끼쳐왔다.   
 수리과학적 모형에 기반을 둔 전염확산 연구의 역사는 무척 오래 되었는데, 1766년에 스위스의 수학자 베르누이(Daniel Bernoulli; 1700-1782)가 천연두를 대상으로 처음 연구한 것으로 알려져 있다. 20세기 들어서 1927년부터 1933년까지 영국 왕립학회지에 3편에 걸쳐서 출판된 ‘A Contribution to the Mathematical Theory of Epidemic’이라는 제목의 논문이 현대적인 연구의 시작이다. 이 논문에서 연구자들은 전염병 확산의 기본이 되는 구획화(compartmental) 모델을 제시하는데, 이는 거의 백 년이 지난 오늘날까지도 유용하게 사용되는 체계이다.
 즉 이 모델에 따르면 질병의 전염상태를 아직 감염되지 않았지만 감염의 가능성이 있는 민감군 S(susceptible), 감염은 되었지만 발병하지 않은 잠복 상태인 노출군 E(exposed), 감염되어 다른 개체를 감염시킬 수 있는 전염군 I(infected), 질병이 회복되어 면역된 상태인 회복군 R(recoved)로 나누어 이들 군 사이의 상태 전이를 모형화한다. 전염병의 확산에 따라 S -> E -> I -> R의 단계로 진화하므로 이른바 SEIR모델이라 부르는데, 간혹 잠복기의 노출군인 E의 상태를 제외하여 SIR만으로 모델링하기도 한다.

 이와 같은 모델에 기반을 둔 전염병의 확산 연구는 전통적으로 수리생물학 또는 생물통계학의 영역이었으나, 근래 복잡계 물리학의 발전에 따라 복잡계 네트워크 이론 등이 이 분야의 연구에 큰 영향을 끼치고 있다. 즉 많은 질병이 개인 사이의 사회적 네트워크를 통하여 일어나므로, 복잡한 시스템에서 일어나는 전염확산 현상을 제대로 이해하기 위해서는 이를 매개하는 복잡 네트워크의 구조 등에 대한 이해가 필요하기 때문이다. 꼭짓점(vertex)과 선분(edge)으로 이루어지는 복잡계 네트워크 모형에서는 각각의 구성 원소를 하나의 꼭지점에 대응시키고, 상호작용을 하는 각 꼭짓점들을 선분(edge)으로 연결함으로써, 수많은 구성요소들이 복잡하게 상호작용을 교환하는 시스템에 대한 유용한 수학적 모델을 제공한다.
 전염병 감염자의 수치 증가 등을 매우 단순화한 모델로는 이른바 로지스틱 곡선(logistic curve)이 많이 쓰인다. 벨기에의 수학자 베르휼스트가 1838년에 인구증가 과정을 설명하는 법칙으로서 제안한 이 S자형의 곡선은 이후 생물의 증식현상이나 경제발전 과정 등을 근사적으로 모델링하는 데에 자주 쓰여왔다. dN/dt=rN(1-(N/K)) 등과 같은 형태로서 시간(t)을 변수로 하여 확진자수(N)가 변화하는 미분방정식을 따르게 된다.

 그러나 첨단의 연구기법을 적용하여 어떤 수학적 모델을 쓰든, 감염병의 종료 시점을 정확히 예측하기는 무척 어려운 일이다. 즉 상황이 모두 종료된 이후에는 수치적 모델을 적용하여 잘 설명할 수 있을지 몰라도, 전염병의 창궐이 한창 진행 중일 때에는 예상하지 못한 온갖 변수들이 갑자기 튀어나오기 일쑤이기 때문에, 현재까지 알려진 수치만으로 예측한 결과는 현실을 제대로 반영하기 매우 힘들다. 
 저명한 통계 물리학자가 지난 2월 중순에 로지스틱 곡선 모델을 적용하여 국내에서 2월말 또는 3월 초에 코로나19의 확산이 종료될 것이라고 조심스럽게 예측하였으나, 얼마 지나지 않아 특정 종교집단 등을 중심으로 감염자가 폭증하면서 본의 아니게 대중들과 방역 당국을 혼란스럽게 한 바 있다.
 이후로도 3월말 또는 6월 중순 등으로 코로나19의 국내 유행이 종료될 것이라는 예측과 연구 결과 등이 언론에 나온 바 있다. 그러나 관련 분야의 과학자들이 이러한 연구를 진행하는 것은 당연한 일이겠으나, 대중들에게 발표할 때에는 보다 신중을 기해야 할 것이다.
 당장 내일의 일기예보조차도 간혹 틀려서 대중들의 불만이 고조되는 경우가 적지 않은데, 감염병의 정확한 종료 시점과 최종 환자 수 등을 섣불리 예측하여 어긋난다면 도리어 과학에 대한 대중들의 불신이 커질 것이기 때문이다.

                                                                          By 최성우

이미지1: 전염병 확산 모델로도 많이 쓰이는 로지스틱 곡선
이미지2: 5000만 명 이상의 사망자를 낸 것으로 추정되는 1918 년 스페인 독감 창궐 시의 상황

댓글 6

늘그대로님의 댓글

늘그대로

logistic curve는 너무 단순화인거 같고, 요즘은 바이오인포매틱스가 대세인 것 같더군요.

참고로 아래의 기사를 읽어 보심이...

미국 다음은 일본, 그 다음은 아프리카다 (2020년 3월 24일)
http://www.newstof.com/news/articleView.html?idxno=10469

바이러스 확산 시뮬레이션 해보니...한국은 상대적 '안전지대' (2020년 2월 3일)
http://www.newstof.com/news/articleView.html?idxno=10235

Hithere님의 댓글

Hithere

주로 과거의 자료를 가지고 분석해서 현재의 상황에 안 맞을 것 같네요. 과거의 경우는 사실 닫힌 계에서 어느 정도 확산가능하냐에 문제인데 지금은 그때보다 훨씬 시스템이 열려있어서 과역 여러개의 군집이 서로 상호작용할 때도 기존의 모델이 맞을 까 싶네요.

ourdream님의 댓글

ourdream

전 천문학자는 아니지만 천문학의 일부 부분들은 오차가 20~30% 이라고 하더군요. 측정 대상에 대해 밀접한 접근이 어렵기에 어쩔 수 없는 측면이 있습니다.

비슷하게 인간이 직접적으로 포함된(정확히는 인간에 위협이 되는) 연구 영역들은 그 오차가 엄청납니다. 한마디로 정확하게 접근하고 테스트하기 힘들다는 의미죠. 일례로 의료 기기 연구만 보더라도 연구실에서는 임상에 바로 쓰일만큼 결과가 좋지만 막상 인간에게 직접 적용할 필요도 없이 in-vivo로 측정으로 가더라도 생각치도 못한 영향이 발생하게 됩니다. 사람에게 직접 적용하는 임상은 말할 것도 없지요.

이번 신종코로나에 대한 연구들도 그 대상이 인간 군집이고 인간의 몸(즉, 안위에 위협)에 직접적인 연관이 있으므로 신뢰할 만한 결과를 산출하기가 매우 어려울 겁니다.

최성우님의 댓글

최성우

의견들 감사합니다.  수리생물학, 생물통계학, 복잡계 물리학 등에서 전염병 확산 문제를 연구하시는 전문가분들은 저보다야 훨씬 잘 아는 분들일 것이고 연구기법 등도 역시 과거에 비해 크게 향상되었을 것입니다. 그러나...

https://news.joins.com/article/23727089  (3월말~4월초 종료를 예측한 칼럼) 
https://www.mk.co.kr/news/society/view/2020/03/250330/  (6월 15일을 유행 종료일로 특정한 연구결과 발표)

위에서 3월 23일 쯤 국내 하루 확진자가 10명 이하로 감소할 것이라 말씀한 분은 이미 '양치기 소년'이 되셨고...^^
종료날짜(6월 15일)뿐 아니라 전체 확진자 수를 한명 단위까지 예측하신 교수님은 '국민 행동 변화'까지 변수로 추가하셨다는데... 
사람들의 행동변화를 어떻게 수치화해서 반영할 수 있는 것인지 궁금하기도 하지만, 설령 효과적으로 반영을 했다고 가정한다면...  그런데 그 행동 변화라는게 예를 들어 개학이라든가 외국으로부터의 유입/차단조치, 그밖의 사회적 거리두기 정도 등등 방역과 정책적 수단에 따라 크게 달라질 수밖에 없을텐데, 이런것까지 미리 예측해서 반영할 수가 있을까요? (무슨 마이너리티 리포트도 아니고...^^)   

연구야 당연히 해야하는 거지만, 언론에 발표하는건 정말 신중해야하는데...    (좀 죄송한 얘기지만) 이번 기회에 이른바 매스컴 좀 타고 떠보려는 것이 아니라면 상당히 경솔하다는 생각이 듭니다...

예린아빠님의 댓글

예린아빠

독립된 계에서  자연발생...자연소멸 과정을  시계열로  분석..예측 할수는 있겠지요.
현재 지구는  지구적  차원으로서만  독립된 계라고  말할수 있을 겁니다.

저런  분석글(?)들이  나오는 이유가  있을겁니다.
사람들을  공포에서  벗어나게  하려는  의도가  있을 수 있겠고
증권..금융시장에서는  돈이  되는  글이기도 할겁니다.

순수하게  (자연)과학적으로  접근하려면은
스웨덴이나  인도의  경우를  분석하는것이  올바를 것입니다.

인간은  이 역병이  뭔지를 알고
이걸  극복하는 방법도  알고
그러기 위해서  인간을  조직하는  능력도 있으니깐요.

스웨덴은  이 역병을  극복하기 위해서  특별한  사회적 행동을  하지 않는 경우이고
인도는  할수 없는  경우이죠.
둘다  걸릴 사람들은  다 걸리고  끝날 것입니다.
물론  희생자의  숫자는 많은 차이가  나겠지만요.

ourdream님의 댓글

ourdream

복잡계 물리학, 혹은 유사한 통계 물리는 각 입자계의 움직임이나 성질이 랜덤할 때, 군집의 움직임이나 성질을 예측하려고 하는 겁니다. 그런데 보통 각 입자계의 통계적 성질을 stationary 하다고 가정합니다. 만약 입자들이 non-stationary한 통계적 성질을 가지면 (안 그래도 복잡한데) 엄청나게 복잡해집니다. 그리고 (어떤 과학이나 공학도 마찬가지이지만) 문제를 풀기 전에 가정을 하게 되는데 그 가정의 진위나 신뢰성을 측정하기가 매우 힘듭니다. 예를 들어, 각 입자계가 stationary Gaussian이라고 할 때, 그 Gaussian의 평균값과 분산값을 어느 정도 가정하에 범위를 정해주어야 하는데 이것이 정확하게 맞지 않지요.

입자를 인간 하나로 보고 입자계 전체에 복잡계 물리적 기법들을 적용하는 것인데, 실제는 각 입자들의 통계 확률적 성질이 전부 stationary 하지 않습니다. 인간이 유기적으로 자의적으로 움직이는 존재이기 때문이죠. 수십 명 중에 한 두명 튀는 행동을 하거나 각 사람들의 면역성 등이 다 다릅니다.

복잡계 물리학 기법 비슷한 방식을 적용하여 코비드19가 이러저래해서 이러할 것이다는 그냥 걸러들으면 됩니다. 천문학보다 더 오차율이 큽니다. 미국 정부에서 계속해서 예측치를 바꾸고 있는 것만 봐도 알 수 있지요. 차라리 실제로 발생한 다른 나라들의 경험적인 데이터를 가지고 예측하는 것은 그나마 들어줄만한 것이죠.

과학기술칼럼

SLIDE UP

모바일에서는 읽기만 가능합니다.
PC 버전 보기
© 2002 - 2015 scieng.net