데이터가치연구소 공식 블로그

공공데이터 주요 용어 정리

공공데이터 업무는 전문적인 지식이 필요한 분야입니다.
그러다보니 사용되는 용어도 다소 생소한 것이 많습니다.
공공데이터 업무를 시작하는 분들을 위해 주요 용어를 쉽게 설명하였습니다.

해당 글에서 설명한 용어는 다음과 같습니다.

  • 데이터표준
  • 공통표준용어
  • 도메인
  • 행정표준코드
  • 표준화
  • 메타데이터
  • 메타시스템
  • 오픈API
  • 오픈포멧
  • 개방DB

  • 데이터표준

공공데이터를 구성하는 용어, 코드 등을 작성하는 규칙을 말합니다.
표준을 지킨 데이터는 어떤 특징을 가질까요?
동일한 대상을 동일하게 표현할 수 있습니다.
예를 들어, ‘휴대전화’를 ‘휴대폰’, ‘전화기’, ‘스마트폰’ 등 다양하게 부를 수 있습니다.
표준이 없다면 사람마다 다양한 단어를 쓰게 됩니다.
그러나 ‘휴대전화’를 표준으로 정한다면 ‘휴대하여 전화할 수 있는 기기’는 모두가 ‘휴대전화’로 부릅니다.
단어, 용어, 도메인, 코드 등 데이터와 관련되었다면 모든 것이 ‘표준’을 가질 수 있습니다.

데이터표준과 관련하여 다음의 글이 도움이 될 것입니다.
데이터 표준이란 무엇인가요?

  • 공통표준용어

행정안전부에서 제공하는 표준용어입니다.
모든 공공기관은 공통표준용어를 우선적으로 적용해야 합니다.
2023년 11월 기준으로 5,386개의 표준용어가 정의되었습니다.

  • 도메인

데이터를 저장하는 값의 종류와 크기를 말합니다.
값의 종류는 데이터가 문자인지, 숫자인지, 날짜인지를 의미합니다.

도메인에 관한 자세한 내용은 다음 글을 참고할 수 있습니다.
도메인이란 무엇인가요?

  • 행정표준코드

행정안전부에서 제공하는 표준코드입니다.
동일한 코드라면 행정표준코드를 사용하면 됩니다.

코드에 관한 자세한 내용은 다음 글을 참고할 수 있습니다.
코드란 무엇인가요?

  • 표준화

데이터를 구성하는 속성, 도메인, 칼럼, 코드 등을 표준에 맞게 작성하는 것입니다.
아래는 속성과 칼럼에 표준을 적용한 예시입니다.

표준 적용 예시

다음의 글은 데이터표준화를 이해하는 데 도움이 될 것입니다.
20만 개 칼럼을 표준화한 방법론 공개
데이터 표준화를 꼭 해야만 하는 이유
공공데이터 표준화 프로젝트- 최소 인원으로 수행해야 하는 이유

  • 메타데이터

데이터를 정의한 것을 메타데이터라 합니다.
예를 들어, ‘홍길동’, ‘이순신’, ‘유관순’의 메타데이터는 ‘이름‘이라 할 수 있습니다.
위의 예시처럼 어떠한 것을 더 높은 차원에서 정의하는 것입니다.
메타데이터를 쉽게 이해하려면 다음의 매트릭스를 떠올릴 수 있습니다.

메타데이터 예시

상단의 ‘은행코드‘는 실제 데이터인 ’02’, ’88’, ’03’, ‘···’ 등의 명칭이며, ‘은행명‘은 ‘산업’, ‘신한’, ‘기업’, ‘···’ 등의 명칭입니다.
이러한 ‘은행코드’, ‘은행명’, ‘거래가능시간’, ‘폐쇄여부’와 같은 명칭을 메타데이터라 합니다.

  • 메타시스템

위에서 ‘은행코드’, ‘은행명’, ‘거래가능시간’, ‘폐쇄여부’를 메타데이터라 하였습니다.
이러한 메타데이터를 용어라 합니다.
데이터베이스 시스템에는 용어외에도 메타데이터가 많습니다.
단어, 도메인, 코드, 데이터베이스 객체 등이 모두 메타데이터입니다.
이러한 메타데이터를 관리하는 시스템을 메타시스템이라 합니다.

  • 오픈API
API

API는 위 이미지처럼 시스템과 사용자 사이에서 중간 다리 역할을 하는 서비스를 말합니다.
사용자는 시스템에 직접 접근하지 않고 API 서비스를 사용하여 원하는 정보를 얻을 수 있습니다.
예를 들어, 날씨API는 날씨 정보를 제공하고 교통API는 교통정보를 제공하겠지요.
공공기관에서 국민들 대상으로 공개한 API 서비스를 오픈API라 합니다.

  • 오픈포멧

특정 소프트웨어(excel, hwp, pdf 등) 없이도 파일을 읽고 수정할 수 있는 형식의 데이터를 말합니다.
CSV, XML, JSON 형식의 파일이 대표적입니다.
공공데이터가 엑셀 파일이라면 CSV 형식으로 변환하여 제공해야 합니다.

  • 개방DB

공공기관에서 국민에게 공공데이터를 제공하기 위한 목적으로 구축한 데이터베이스를 말합니다.

author avatar
데이터가치연구소 데이터가치플래너
『공공기관 표준화 전문』 대표 컨설턴트 허 상 철 |
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments