데이터는 진실해야 한다
데이터는 진실해야 한다
  • 안태희 기자
  • 승인 2017.06.21 20:15
  • 댓글 0
이 기사를 공유합니다

데스크의 주장
▲ 안태희 취재2팀장(부국장)

최근 충북연구원이 잘못된 인포그래픽을 내놓았다가 망신을 샀다. 충북지역 개인사업자의 창업률과 폐업률 등을 다룬 내용이었는데, 그래프의 수치가 일치하지 않았고 제목과 내용이 달랐다.

이 자료를 접하자마자 충북연구원 연구원과 통화를 했다. 그는 틀린 부분이 있어 수정하겠다고 했다. 그런데 오후 6시가 지나 다시 살펴보니 수정된 부분 말고도 그래프에 적힌 폐업률 합산이 기술된 수치와 틀린 게 발견됐다. 담당연구원은 퇴근했고, 그래프 비율 합산으로 기사를 쓰는 모험을 해야만 했다.

다행히 기사는 틀리지 않았지만, 가슴을 쓸어내렸다. 결국 이런 엉터리 자료를 낸 데 대한 비판성 기사가 다른 신문에 실렸다.

이번 일은 몇 가지 중요한 문제제기를 해야 할 필요성을 불러온다.

우선 이 인포그래픽을 제작한 것은 지난 1월이었다. 그런데 발표는 5개월 후에 했다. 도대체 5개월 동안 이 자료를 공표하지 않은 이유가 뭘까. 신문도 아니고 구문을 내놓은 것 자체, 즉 데이터 발표 시기를 늦춘 까닭을 알 수 없다. 행정편의주의적이라고 생각한다.

또한 이 인포그래픽이 발표될 때 아무런 게이트 키핑이 없었다는 걸 알 수 있다. 연구자가 처음 작성한 그대로 대중에게 이메일로 발표됐는데, 문제제기 이전에 무엇이 잘못된 지 몰랐다는 게 문제다. 충북연구원의 연구윤리가 잘 지켜지고 있을까, 연구자의 연구자세에 대한 중대한 의문이 제기되는 대목이다.

이제 데이터(DATA)는 언론뿐만 아니라 모든 업종에서 `노다지'가 되고 있다. 4차산업혁명 시대, 초연결사회에서 기반이 되는 게 데이터다. 그렇기 때문에 여기저기 산재하고, 무수히 쏟아지는 데이터를 취합하고 가공하고, 정보와 지식으로 변환시키는 일은 빅데이터 분석가와 연구자, 저널리스트들에게 새로운 숙명이 되고 있다.

예전에는 연구자와 기자 몇 명이 독점적으로 확보할 수 있는 데이터가 관심만 있으면 누구나 구글에서 거의 무제한으로 찾아볼 수 있는 시대가 됐다. 그렇기 때문에 데이터의 오독, 데이터의 시각화 실패는 연구기관이나 언론사, 공공기관의 신뢰에 치명타를 가할 수 있다.

더욱이 이번 사건은 아직 정보공개가 활발하지 않은 우리나라 사정과 맞물리면서 묘한 파장을 불러오고 있다. 정부 3.0을 통해 더 많은 데이터가 공개되고 있으나 데이터 과학자들에게 골치덩어리인 PDF 등으로 제공되는 게 부지기수다.

청주시가 전국에서 가장 먼저 정보공개조례를 제정한 도시라고는 믿을 수 없을 정도로 지역 데이터는 빈약하다. 연구할 대상, 보도할 원본을 찾기부터 쉽지 않은 게 현실이다.

다만 충북연구원은 나중에 원 데이터와 수정 인포그래픽을 나에게 제공했다. 매우 타당한 후속조치다. 원데이터를 공개한 자세 또한 평가할만하다.

또한 이번에 알게 됐는데 충북연구원에 빅데이터 전문연구원이 있다는 것이다. 이 분야가 앞으로 충북의 경쟁력을 좌우하는 중요한 분야가 될 것으로 믿는다.

이번 일이 충북대를 비롯한 선구적인 교수 및 연구진과 지역의 기자들, 데이터 과학자들이 함께 데이터 저널리즘, 빅데이터와 공공성에 대해 더 깊게 생각하고 토론하는 문화로 전화위복 되기를 바란다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.