헨리 응우옌 호주 그리피스 대학교 정보통신학과 교수, DATA가 미래다! 가짜뉴스와 가짜정보가 판치는 세상, K-DATA를 위해 필요한 것은?

2022.09.08 13:34:55

K-팝, K-방역은 대한민국의 위상을 전 세계에 알렸다!

하지만 이 외에도 한국이 세계 1등을 할 수 있는 영역이 존재하는데….

그것은 바로 DATA 이다! 가면 갈수록 가짜뉴스, 가짜정보가 판치는 세상에서 대한민국의 미래를 이끌 K-DATA! 데이터 강국이 되기 위해 필요한 점을 세계적 석학 응우옌 교수에게 물어보았다!

 

최원재 리포터_ 안녕하세요, 응우옌 교수님. 이렇게 세계적인 데이터 분석 전문가를 만나 뵙게 돼 영광입니다. 자기소개 부탁드립니다.

헨리 응우옌 교수_ 안녕하세요. 저는 스위스 로잔 연방 공과대학교(EPFL)에서 박사학위를 딴 후 데이터 사이언스로 유명한 호주 그리피스 대학교에서 데이터분석학 교수를 맡고 있습니다.

저희 연구실에서는 현재 다양한 데이터, 예를 들면 보안 데이터, 문서 데이터 등을 다루고 있죠. 머신러닝 기술을 바탕으로 가공되지 않은 데이터를 활용될 수 있는 데이터로 바꾸는 작업을 합니다. 예를 들어 정부가 제공하고 또 보유하고 있는 데이터가 방치되는 경우가 많은데, 이러한 데이터는 사회를 위해 활용할 수 있는 부분이 무한대입니다.

 

가짜뉴스와의 끝없는 전쟁!

 

최원재_ 가공되지 않은 데이터를 활용할 수 있게 만든다? 정말 흥미로운데요.

혹시 교수님이 진행하신 연구 중에 한국이 알면 좋을 예시가 있을까요?

응우옌_ 가짜뉴스! 저희 연구실에서는 현재 가짜뉴스를 탐지할 수 있는 기술을 연구 중입니다.

아시다시피 루머나 가짜뉴스가 SNS에 만연하고 있습니다. 어떤 정당에 편파적인 뉴스 혹은 아예 사실과 다른 가짜뉴스로 인해 피해입는 사람이 많습니다. 예를 들면 2013년 백악관에 폭탄이 설치됐다는 가짜뉴스로 미국 증시가 한때 폭락한 사건이 있었습니다. 이로 인해 8,000억 달러(약 1,050조 원) 손실을 보게 됐죠. 우리는 이러한 부정확한 정보로부터 자유로워야 합니다. 흔히 가짜뉴스는 사람이 아닌 기계에 의해 생산되는데요, 저희 연구실은 AI 기술을 통해 기계가 생산하는 가짜뉴스를 판별하는 기술을 개발 중입니다.

 

최원재_ 기계가 가짜뉴스를 생산한다니 놀랍습니다. 그러면 이를 어떻게 판별하죠?

응우옌_ 첫째, 데이터의 출처를 알아야 합니다. 누가 작성했는지, 누가 올렸는지, 어디서 데이터가 왔는지 등등이죠. 둘째, 데이터가 어떻게 전파됐는지를 봅니다. 예를 들면 어떠한 데이터가 아주 빨리 전파됐다면 중요한 뉴스일 수도 있고, 가짜 뉴스일 수도 있습니다. 혹여 가짜뉴스가 빨리 전파된다면 사회에 큰 영향을 끼칠 수 있기 때문에 데이터 전파력을 판별해야 합니다. 마지막으로 데이터의 일관성을 봅니다. 보통 가짜뉴스들은 이전에 이런저런 뉴스를 짜깁기하기 때문에 데이터가 일관되지 못합니다. 저희 연구실에서는 이런 점들을 판별해 가짜뉴스를 없애는 AI를 만드는 것이죠.

 

최원재_ 정말 대단합니다. 어떻게 보면 기계와 기계가 싸우는 것이네요?

응우옌_ 이 점이 중요합니다. 끝나지 않는 싸움이죠. 예를 들어 지금 컴퓨터 바이러스가 있고 백신도 있습니다. 하지만 계속 새로운 바이러스가 생기고 이에 대한 새로운 백신이 또 생기죠. 이와 비슷하게 가짜뉴스도 지속적으로 싸워야 한다는 점을 정부는 확실히 인지해야 합니다.

 

대한민국 정부의 올바른 데이터 사용법은?

 

최원재_ 매일 보는 뉴스처럼 데이터는 일상에 깊숙이 스며들었는데요, 우리가 데이터를 다룰 때 필요한 팁이 있을까요?

응우옌_ 사실 사용자들은 게으릅니다. 데이터에 대해 크게 신경 쓰지 않아요. 무의미하게 추천하는 것을 따라가기 쉽죠. 따라서 정부가 중요시 여겨야 할 점은 이러한 데이터 추천에 대한 설명입니다. 예를 들어 이러한 데이터가 왜 추천에 뜨는지 설명한다면 이용자들이 편향된 데이터를 알아서 가려낼 수 있고 또 투명성도 높아지죠.

 

최원재_ 이러한 점은 정부가 확실히 주도해서 이루어지면 좋을 것 같습니다. 혹시 또 대한민국 정부가 데이터 관리에 대해 노력해야 할 점이 있을까요?

응우옌_ 전 세계적으로 데이터 관리, 데이터 행정에 대한 관심이 높아지고, 데이터 컨트롤 타워를 만들고 발전시키고 있습니다. 이러한 과정에서 중요한 점은 결국 데이터를 관리하는 직원들에 대한 교육입니다. 컴퓨터가 상용화돼 컴퓨터 공학이라는 분야가 생겼죠? 이와 비슷하게 이제는 데이터 공학이라는 분야가 새로 생겼습니다. 새로운 분야가 생긴 만큼 전문적인 인력이 더 많아져야 하고 인력이 더 많아지려면 현재 있는 직원들에 대한 데이터 교육이 강력하게 필요합니다. 물론 대중을 위한 데이터 교육도 필요합니다.

 

최원재_ 네, 맞습니다. 그래도 한국은 다른 나라에 비해 교육이 잘됐다고 생각합니다. 한국 통계청이 제공하는 데이터만 봐도 알 수 있죠. 정말 한국 통계청 데이터는 세계 최고 수준이라고 장담합니다. 그만큼 교육된 전문 인력도 많다는 뜻이겠죠?

 

프라이버시! 개인정보

 

응우옌_ 맞습니다. 하지만 한 가지 더 말씀드리고 싶은 점은 바로 프라이버시입니다. 사실 정부 관계자든 일반 시민이든 프라이버시에 대한 걱정이 큽니다. 특히 보건 쪽이 심하죠. 그러다 보니 이에 대한 데이터를 사용하고 또 공유될 때 매우 제한적이죠.

우리 모두 프라이버시를 대할 때 항상 조심해야 합니다. 하지만 반대로 이러한 프라이버시 문제를 개선시키려면 연구할 때 연구자에게 데이터가 공유돼야 합니다. 하지만 저의 연구만 봐도 데이터를 얻는 데 2년이 걸렸죠. 이러한 부분이 정책적으로 좀 바뀌어야 할 것 같습니다.

 

최원재_ 정말 오래 걸렸네요. 프라이버시 데이터 공유에 대해 어떻게 바뀌면 좋을까요?

응우옌_ 현재는 프라이버시 데이터는 못 보게 막아놓습니다. 당연합니다. 하지만 데이터 분석은 데이터가 많으면 많을수록 더 좋은 연구가 될 수 있습니다. 따라서 두 진영을 모두 만족할 방법을 찾아야 합니다.

현재는 기술의 한계로 인해 이러한 사적인 데이터를 정보 노출의 문제가 되지 않게 사용할 수 없습니다.  프라이버시 데이터를 다루는 기술에 대한 연구가 더 필요합니다.

 

최원재_ 교수님, 미래에 계획하고 계신 연구가 있다면 소개 부탁드립니다.

응우옌_ 저는 현재 데이터의 질을 연구하고 있습니다. 호주 정부가 이 연구를 위해 5억 원 정도 투자했고 더 많은 예산을 추가로 투자할 계획입니다.

데이터 질에 대한 연구의 연장선상으로 ‘책임 있는 데이터 공학’이라는 연구를 계획하고 있습니다. 말 그대로 데이터를 책임 있게 활용하는 방안을 연구하는 것입니다. 책임 있게 데이터를 활용하는 방법을 설명드리자면, 데이터는 공정해야 하고 데이터는 투명해야 합니다. 그리고 사생활 데이터는 지켜져야 합니다. 따라서 저희 연구는 이러한 요소가 어떻게 지켜져야 하는지 연구하는 것입니다.

 

최원재_ 네, 정말 중요한 연구가 아니지 않을까 생각됩니다.

교수님, 마지막으로 지방정부 구독자분들에게 하시고 싶은 말씀이 있다면?

응우옌_ 네, 우선 이렇게 저와 저의 연구에 대해 소개할 수 있는 자리를 마련해주셔서 감사합니다. 저는 지속적으로 데이터에 대해 연구할 것이기 때문에 다음에 또 좋은 연구를 하게 된다면 꼭 여러분께 다시 소개할 수 있으면 좋겠네요. 감사합니다.

최원재 리포터 nlncm@naver.com
tvU의 모든 콘텐츠(기사)는 저작권법의 보호를 받으며,무단복제 및 복사 배포를 금합니다.


지방정부 tvU(티비유) | 발행인 겸 편집인 : 이영애 | (본사) 서울 종로구 자하문로16길 1, (분원) 서울 종로구 경희궁3나길 15-4 | Tel : 02-737-8266, 02-739-4600| E-mail nlncm@naver.com 등록번호 : 서울, 아04111 | 등록일ㆍ발행일 : 2016.07.19 | 사업자정보 : 101-86-87833 청소년 보호 관리 담당자: 편집부 차장 /청소년 보호 관리 책임자: 발행인 지방정부 tvU의 모든 콘텐츠(기사)는 저작권법의 보호를 받으며,무단복제 및 복사 배포를 금합니다.