전세계인들이 관심 있게 지켜보고 있는 미 오바마 정부의 열린 정부 행보. 최근 '공공데이터 (Open Data) 정책'을 발표했습니다. 공공데이터는 이래야 한다, 하는 기준을 정하는 데에서 의미가 크고, 우리도 주목할만 합니다.
미국, 열린 정부 완성할 `오픈 데이터 정책` 발표 (etnnews 안호천기자)
아래는 해당 정책의 Memorandum 내용입니다. 원문은 여기를 클릭하세요
(※ 읽는 분들의 편의를 위해 간단한 의역(^^;)을 덧붙였습니다. 권위 없는 막번역이니 재이용 여부는 읽는 분의 판단에 맡깁니다.)
Open data: For the purposes of this Memorandum, the term "open data" refers to publicly available data structured in a way that enables the data to be fully discoverable and usable by end users. In general, open data will be consistent with the following principles:
공공데이터의 뜻: 일반 사용자 (엔드 유저) 가 완전하게 찾을 수 있고 이용할 수 있는 체계가 갖춰진 공공 접근 가능 데이터를 말한다. 대개, 공공데이터는 아래의 특성을 일정하게 가지고 있다.
• Public. Consistent with OMB's Open Government Directive, agencies must adopt a presumption in favor of openness to the extent permitted by law and subject to privacy, confidentiality, security, or other valid restrictions.
공공. 오바마 정부의 열린정부 방향성에 따라, 에이전시에서는 프라이버시, 비밀성, 보안, 또는 적절한 규제가 허용하는 범위 내에서 개방을 위한 선행 작업을 한다.
• Accessible. Open data are made available in convenient, modifiable, and open formats that can be retrieved, downloaded, indexed, and searched. Formats should be machine-readable (i.e., data are reasonably structured to allow automated processing). Open data structures do not discriminate against any person or group of persons and should be made available to the widest range of users for the widest range of purposes, often by providing the data in multiple formats for consumption. To the extent permitted by law, these formats should be non-proprietary, publicly available, and no restrictions should be placed upon their use.
접근가능성. 공공데이터는 검색, 다운로드, 지표화가 가능하도록 편리하고 수정가능하고 오픈된 포맷으로 만들어져있다. 머신-리더블 포맷이다. (예: 자동화 과정이 가능하도록 적절하게 만들어져있다) 공공데이터는 그 어느 개인이나 단체를 차별하지 않고, 가능한 한 최대치의 이용자 범위와 목적을 고려해 만들어지는데, 따라서 여러 가지 다른 포맷으로 배포되는 경우가 많다. 법이 허락하는 한, 이 포맷들은 전매특허가 없으며 공공적으로 접근 가능하고, 이용에 규제가 없어야 한다.
• Described. Open data are described fully so that consumers of the data have sufficient information to understand their strengths, weaknesses, analytical limitations, security requirements, as well as how to process them. This involves the use of robust, granular metadata (i.e., fields or elements that describe data), thorough documentation of data elements, data dictionaries, and, if applicable, additional descriptions of the purpose of the collection, the population of interest, the characteristics of the sample, and the method of data collection.
충분한 설명. 공공데이터는 소비자가 데이터를 어떻게 공정해야 하나 뿐만 아니라 데이터의 강점, 약점, 분석적 한계, 보안 요구사항 등에 대해 모두 알 수 있도록 적절한 정보를 제공 받을 수 있도록 충분하게 설명한다. 이는 견고하고 자잔한 메타데이터(예: 데이터를 설명하는 필드나 요소)의 이용, 데이터 요소에 대한 충실한 도큐먼트, 데이터 사전, 그리고 가능하다면 콜렉션의 목적에 대한 추가 설명, 흥미 인구, 샘플의 특징, 데이터 콜렉션의 메소드 등을 포함한다.
• Reusable. Open data are made available under an open license that places no restrictions on their use.
재사용성. 공공데이터는 오픈 라이선스로 배포되어 이용에 규제가 없다.
• Complete. Open data are published in primary forms (i.e., as collected at the source), with the finest possible level of granularity that is practicable and permitted by law and other requirements. Derived or aggregate open data should also be published but must reference the primary data.
완전성. 공공데이터는 초기 형태로, (예: 수집된 소스 단계) 가능한한 실행 가능하고 법이나 다른 요구들이 허락하는 가장 훌륭한 레벨의 입도로서 공개된다. 2차 저작됐거나 종합 데이터도 공개되어야 하지만, 이 경우 반드시 최초 데이터를 명시해야 한다.
• Timely. Open data are made available as quickly as necessary to preserve the value of the data. Frequency of release should account for key audiences and downstream needs.
시의적절성. 공공데이터는 데이터의 가치를 지키기 위해 필요한한 빠르게 만들어져 배포된다. 배포의 빈도는 중요 이용자와 엔드유저의 필요에 따라야 한다.
• Managed Post-Release. A point of contact must be designated to assist with data use and to respond to complaints about adherence to these open data requirements.
배포 후 관리. 데이터 이용 문의와 위의 요구사항에 대한 적합성 컴플레인 등에 응대할 수 있는 담당자 연락처가 명시되어야 한다.