공공데이터는 보다 많은 이들에게 영향을 끼치고, 사회 각 부문과 개인에 삶에 도움을 줄수록 가치가 증가한다. 정부와 개발자 커뮤니티에서 아무리 좋은 툴과 어플리케이션을 선보여도 대중이 이해하고 데이터를 활용하는 것에 어려움을 느낀다면 모두가 헛수고가 되는 셈이다. 이 지점에서 우리는 어떤 데이터를 어떻게 사람들에게 보일 것인지에 대한 문제에 봉착하게 된다.

다행히도 우리 사회에는 '저널리즘'이라는 독특한 분야가 있다. 저널리즘은 신문으로 대표되는 오랜 세월 동안 사회 구성원들에게 각종 사건과 사고, 그리고 집단과 조직이 생산하는 숫자와 데이터들을 읽고 이해하기 편하게 가공하는 노하우를 축적해왔다. 저널리스트들이 말하는 '뉴스거리'는 시의적절하며 대중들의 니즈에 부합하는 '데이터'를 의미한다. 그들에게 있어서 데이터는 다이아몬드 원석과 같은 존재다. 문제는 저널리스트는 데이터에서 사회적 맥락을 읽어내는 것에는 뛰어나지만 데이터를 직접 가공하거나 정제하는 능력이 많이 부족하다.

따라서 개발자 그룹과 저널리스트 그룹의 협력을 통해 보다 대중 친화적이며, 공공의 이익에 부합하는 '새로운 이야기'를 만들어 낼 수 있다. 일련의 시도들은 OpenDataJournalism, BigData Journalism, 혹은 Data-Driven Journalism이라는 이름으로 미국의 비영리저널리즘 ProPublica와, 유럽의 EJC(European Journalism Centre)를 중심으로 빠르게 확산되고 있으며, 영국의 유력 일간지 The guradian은 자사 핵심역량으로 키워나가고 있다. The guardian은 Simon Rogers를 중심으로한 Data Journalism 전담 편집국을 꾸렸으며, 다음과 같은 저널리즘을 위한 Open Data Journalism 지침을 내놓았다.

 

저널리스트를 위한 오픈 데이터 저널리즘 적용 지침

1. 데이터 너머의 이야기를 뽑아내야 한다
저널리즘은 사회에 대한 현 시점의 시의적절한 새로운 이야기를 발굴하는 것을 최고의 가치로 삼는다. 데이터 저널리즘은 그 과정 자체로 의제에 주입되고, 뉴스를 만들어 낸다. '시의적절함'은 사람들의 관심을 끌어낼 수 있으며 화제거리가 될 수 있음을 의미한다.

2. 대중이 원하는 '열쇠'를 제공해야 한다
의미가 불명확할 수 있다. 수용자로서는 정보가 필요한 시점에 난해하지 않고 너무 오래되지 않은 핵심 데이터 셋을 찾아내기란 어렵다. 이 점이 데이터 저널리즘이   That's where data journalism's role in curating the key numbers can come in. 리서치 기술은 취재기자와 편집기자의 핵심 역량이며, 이 역량은 독자들이 진정으로 찾고자 하는 핵심 데이터를 선별하는 것에 사용된다. 저널리스트는 정보제공자와 정보 소비자의 가교이자, 해석자로서 데이터를 검증하고 가치를 부여하는 지위에 서있다.

3. 피부에 와 닿게 하라.
모든 데이터는 각 개인의 눈높이에 있어야 하며, 인터렉티브와 시각화를 최대한 활용하여 각 사람들의 일상에 어떤 영향을 줄 수 있는지 보여야 한다.

4. 누구나 할 수 있다.
정말이다. '이야기'가 될 수 있는 것인지 아닌지를 판별하는 능력이 가장 중요하다. 데이터를 시각화하고 분석하는 공개된 툴들이 이미 존재하며, 쉽고 단순하다.

5. 데이터를 개방하자
공공데이터는 무엇인가? 공공데이터는 모든 사람들이 사용가능하며 기계가 판독할 수 있는 포맷(메타 데이터 포맷)으로 배포된 데이터를 의미한다. 유념해야할 점은 Stephen Messer가 말한 바와 같이PDF류의 포맷은 쓸모 없는 데이터 포맷의 대표적인 예이다. 따라서 데이터를 공개할 때에는 CSV, Excel, RDF과 같은 누가 가공하고 활용할 수 있는 방법을 이용해야 한다.

6. 최선을 다하되, 연결을 위한 여백을 남겨라. 
Jeff Jarvis가 제안한 이 지침은 간단하다.  데이터 접근을 가로막는 장애물이 있다는 것 자체가 이상한 것이다. 공개를 한다면서 이점에 의아해하는 이유가 무엇인가?

7. 부담없이 이용하는 데이터 Free data – now
단순히 데이터를 모으는 것으로는 부족하다. 대중교통부터 선거 결과에 이르기까지 모든 것 뒤에 감춰져 있는 가동되지 않았으며, 가치가 있는 실시간 데이터를 대상으로 해야 한다.

8. 우리는 전문가가 아니다.
우리는 모든 분야에 걸친 전문가가 될 수 없기에, 프로세스 각 부분에 도움이 될 수 있는 이들과의 협업을 해야 한다.

9. 빅데이터 읽어내기
다뤄야 할 데이터 셋(Data Set)이 커짐에 따라, 데이터를 더 단순하고 세부적인 이해를 가능하게 하는 것이 가장 중요하다.

10. 엮어내기
일련의 작업들은 결국 '이야기'를 위한 것이다.

 

원문: The guardian_ Open data journalism -Why does data journalism need to be open journalism too? http://www.guardian.co.uk/news/datablog/2012/sep/20/open-data-journalism?INTCMP=SRCH