국제신문

menu search

“데이터 네트워킹, 코로나 방역·선거결과 예측 도와”

‘뭐라노’ 애독자 초청 콘서트- 정하웅 카이스트 교수 강연
김민정 기자 min55@kookje.co.kr | 2021.06.23 19:55
- 많은 네트워크 내부 항공망 닮아
- ‘허브’ 연구 땐 다양한 정보 얻어

- 데이터 조작 대비 내용검토 필수
- 딥러닝, 의학 분야 등에서 일조
- AI, 인간의 경쟁자 아닌 보완재

4차산업혁명 시대의 ‘쌀’은 데이터. 데이터가 개별적으로 흩어져 존재하면 어떤 의미도 얻을 수 없다. 각각의 데이터를 인과관계에 맞게 연결해 숨은 의미를 찾아내는 복잡계 네트워크 과학이 각광받는 이유다.

‘뭐라노’ 콘서트에 초대된 정하웅 카이스트 석좌교수가 네트워크 과학에 대해 강연하고 있다. 전민철 기자
정하웅 카이스트 석좌교수는 22일 국제신문이 주최한 뉴스레터 ‘뭐라노’ 독자 초청 콘서트에서 ‘구글신은 모든 것을 알고 있다 : 복잡계 네트워크와 데이터 과학’을 주제로 강연했다. 그는 “뉴런이 서로 연결돼 뇌를 이루는 것처럼 개별 데이터를 네트워크화 하면 의미 있는 가치를 발견을 할 수 있다”면서 네트워크의 종류를 크게 2가지로 분류했다. 첫째는 어느 도시든 비슷한 규모로 깔리는 고속도로망과 닮은 네트워크. 둘째는 유동인구가 많거나 입지여건이 뛰어난 도시(허브)를 집중적으로 취항하는 항공망과 닮은 네트워크.

정 교수는 “많은 네트워크의 내부를 들여다봤더니 대부분 항공망 형태를 띄었다. 연결이 집중된 ‘허브’를 연구하면 다양한 정보를 얻을 수 있다”고 말했다. “한 연구자가 2001년 스웨덴 성인 3000명을 대상으로 설문조사 해 ‘성관계 네트워크’를 만들었습니다. 에이즈 차단을 위해서였습니다. 가장 성관계를 많이 한 ‘허브’를 먼저 치료하면 에이즈 확산을 쉽게 막을 수 있다는 결론이 도출됐습니다. 우리나라도 코로나19 차단을 위해 허브(최초 감염자)와 접촉한 사람을 역추적해 K-방역에 성공했습니다.”

세계에서 데이터가 가장 많이 모이는 플랫폼은 구글. 검색량을 보여주는 구글 트렌드만 이용해도 알 수 있는 것이 많다. 정 교수는 “2012년 미국 대통령선거를 앞두고 버락 오바마(민주당)와 밋 롬니(공화당) 후보를 다룬 구글 웹페이지를 검색했더니 각각 1350만 건(51%)과 1290만 건(48%)이 나왔다. 이는 두 후보의 최종 득표수와 정확하게 맞아떨어졌다”고 소개했다.

비슷한 원리로 구글은 2003~2008년 미국 질병관리청 대신 독감 발병지를 예측하기도 했다. 독감 증세를 보이는 사람들이 독감 정보를 검색할 가능성이 높다는 점을 이용한 것이다. 정 교수는 “사람들이 검색할 때는 거짓말을 하지 않기 때문에 검색 데이터는 어떤 설문조사보다 정확하다”면서도 “요즘은 광고나 댓글 조작으로 데이터가 오염되는 경우도 많기 때문에 데이터의 내용을 잘 검토해야 한다”고 덧붙였다.

정 교수는 데이터나 인공지능이 인간의 대체재가 아니라 보완재라고 했다. “딥러닝을 한 인공지능이 암 조직 판별 검사를 했더니 92%의 정확성을 자랑했습니다. 인간 의사의 판단과 딥러닝 결과를 합친 결과 정확도가 99.5%로 상승했습니다. 과학은 인간의 대체재나 경쟁자가 아니라 보완재라고 보는 게 맞습니다.” 정 교수는 카이스트 우수강의상·우수강의 대상을 받은 명강사. 공동저서 ‘구글 신은 모든 것을 알고 있다’를 통해 네트워크 과학 대중화에 앞장서고 있다.

김민정 기자 min55@kookje.co.kr
카카오톡 카카오스토리 트위터 페이스북
관련기사
국제신문 뉴스레터