데이터가치연구소 공식 블로그

DA 101

  • 코드란 무엇인가요?

    오래전 이야기입니다.동료 컨설턴트와 ‘코드’에 관해 토론하였습니다.지금처럼 저장 공간이 충분한 시대에 과연 ‘코드’가 필요한가? 여러분은 어떻게 생각하시나요?10, 20, 30, ···이와 같은 코드가 지금도 필요한가요? 당시 제 생각은 ‘필요없다’ 였습니다.코드를 사용하는 대신 ‘값’을 쓰자는 것이지요.‘구매’, ‘발송’, ‘취소’, ···이유는요?저장 공간은 충분하니까요 ㅎㅎ 그로부터 한참의 시간이 흘렀습니다.지금도 ‘코드’가 정말 필요한지 다시 생각해 보았습니다.지금의 결론은요?‘필요하다’ 입니다!생각이 바뀐 이유가 궁금하신가요?‘코드’가 무엇인지…

    더 보기

  • 도메인이란 무엇인가요?

    도메인을 한마디로 정의하면 ‘영역’이라 할 수 있습니다.즉, 전체가 아닌 부분을 가리킵니다. 도메인 = 전체를 구성하는 한 영역 ‘영역’이라는 의미를 염두에 둔다면 ‘도메인’이라는 단어를 들었을 때 의미가 쉽게 와 닿을 것입니다. 도메인의 역할 데이터 표준에서 도메인은 어떤 역할을 할까요?‘용어(속성/칼럼)의 분류어란 무엇인가요?‘ 글에서 용어의 분류어가 도메인으로 등록한다고 하였습니다.용어의 분류어를 보면 어떤 값이 들어가는지 예상할 수 있습니다. 위…

    더 보기

  • 엔터티(테이블)의 분류어란 무엇인가요?

    엔터티* 분류어는 데이터 표준을 수립할 때 항상 고민하는 대상입니다.* 엔터티(Entity) – 논리 데이터 모델에서 사용하는 용어로 테이블을 말합니다.‘데이터 표준은 사람을 위한 도구입니다.‘ 글에서 설명한 바와 같이 표준은 기업마다 다릅니다.그러므로 엔터티 분류어도 기업의 특성을 고려하여 정의합니다.이 글에서는 보편적으로 사용하는 분류어를 다룹니다. ‘용어(속성/칼럼)의 분류어란 무엇인가요?‘ 글에서 분류어는 ‘용어를 구성하는 가장 마지막 단어’라고 정의하였습니다.위의 정의에서 ‘용어’를 ‘엔터티’로 바꾸면…

    더 보기

  • 데이터 표준은 사람을 위한 도구입니다.

    데이터 표준 – 정답이 있을까? 어떻게 생각하시나요?데이터 표준은 ‘정답’이 있을까요?만약 ‘정답’이 존재한다면 우리는 데이터 표준을 고민할 이유가 없겠지요.‘정답’을 외우면 되니까요.그러나 데이터 표준은 사람마다, 기업마다 다릅니다.어떤 사람은 한 글자 단어를 표준으로 허용하지만 어떤 사람은 허용하지 않습니다.그러면 한 글자 단어는 써야 할까요? 아니면 쓰지 말아야 할까요? 한 글자 단어 예시 – 수(數), 고(高), 저(低), 유(有), 무(無), 상(上),…

    더 보기

  • 용어(속성/칼럼)의 분류어란 무엇인가요?

    용어를 구성하는 가장 마지막 단어를 ‘분류어’라고 합니다.몇 가지 예시로 설명하겠습니다. 위의 예시에서 오렌지 색깔의 단어들이 보이시나요?‘수’, ‘일자’, ‘사유’ 처럼 용어의 끝에 사용된 단어들이 바로 ‘분류어’입니다.분류어는 용어가 담는 내용의 특징을 드러냅니다. ‘몇 명’, ‘언제’, ‘이유’ 각각 어떤 특징을 나타내나요? 이처럼 분류어를 보면 용어에 무엇이 담기는지 예상할 수 있습니다. 분류어가 단어이다 보니 이런 궁금증이 생깁니다. ‘모든 단어가…

    더 보기

  • 데이터 아키텍트(DA)란 무엇인가요?

    아키텍트(Architect)는 사람을 지칭합니다.사전에서는 무언가를 계획, 설계, 감독하는 사람 정도의 의미로 정의합니다.그러므로 데이터 아키텍트는 데이터와 관련된 것들을 계획하고 설계하고 감독하는 사람으로 이해할 수 있습니다. 데이터 아키텍트에 대해 다음 세 가지 항목을 구체적으로 다루겠습니다. 1. 데이터 아키텍트의 역할 ‘성공적인 공공데이터 표준화 프로젝트 위해 확인해야 할 사항‘ 글에서 데이터 표준 전문가의 역할을 강조하였습니다.데이터 표준 전문가는 데이터 표준을 관리하고…

    더 보기

  • 성공적인 공공데이터 표준화 프로젝트 위해 확인해야 할 사항

    데이터 표준화 프로젝트를 하면 세 가지 장점이 있다고 설명했습니다.참고 글: 데이터 표준화를 꼭 해야만 하는 이유 표준화 프로젝트는 수천에서 수억까지 큰 비용이 투자되는 프로젝트입니다.이러한 프로젝트에서 좋은 결과를 얻으려면 다음의 조건을 점검해야 합니다. 위의 4가지 항목에서 모두 ‘예’라는 대답을 하셨다면 귀사의 표준화 프로젝트는 성공할 수 있습니다! 하나씩 구체적으로 설명하겠습니다. 테이블/칼럼의 코멘트는 ‘표준화 방법론‘ 글에서 단어나 용어의…

    더 보기

  • 데이터 표준화를 꼭 해야만 하는 이유

    데이터 표준화 프로젝트를 수행하다 보면 데이터 표준화 교육을 요청하는 경우가 많습니다.아마도 데이터 표준이 정말 필요한 것인지 공감대를 갖기 위한 것이겠지요.그러면 데이터 표준화, 정말 필요한가요? 결론부터 말씀드리면 ‘필요하다’ 입니다. 그 이유를 다음의 세 가지 관점에서 설명하겠습니다.​ 데이터 표준이 있으면 개발 생산성이 올라간다고요???네, 맞습니다!데이터 표준이 있으면 개발 생산성이 올라갑니다.많은 분들이 오해하는 부분입니다.데이터 표준을 지키느라 개발이 늦어진다고 생각하기…

    더 보기

  • 20만 개 칼럼을 표준화한 방법론 공개

    대량의 대상을 수행하려면 전체적인 관점에서 접근해야 합니다.그러므로 전체를 아우르는 틀을 갖춘 상태에서 표준화를 수행합니다. 아래는 데이터 표준화 프로젝트 수행 시 설계했던 리파지토리 테이블입니다. 리파지토리 (*리파지토리: 대상의 테이블 정보를 담는 저장소) 소량의 테이블은 정밀한 방법론이 없어도 괜찮습니다.한 땀 한 땀 정성스럽게 단어/용어/도메인/코드를 정의하면 되니까요. ​대량의 대상을 수행하려면 하나씩 수행하는 방법으로는 비용과 물량을 감당하기 어렵습니다.그래서 대량의 대상은…

    더 보기

  • 공공데이터 표준화 프로젝트 공수 산정 팁

    6개 기업에서 표준화 프로젝트를 수행한 경험으로 해당 주제를 다루려고 합니다.6개의 프로젝트 중 3개는 2명의 인원으로 진행하였고 나머지는 10명 이상의 인원으로 대규모로 진행하였습니다.이러한 경험으로 한 달에 몇 개 정도의 테이블을 수행할 수 있는지를 설명합니다. 앞서 포스팅한 “한 사람이 한 달 동안 표준화할 수 있는 테이블 수“에서는 한 사람이 한 달에 수행할 수 있는 테이블 수를 128개로…

    더 보기