6개 기업에서 표준화 프로젝트를 수행한 경험으로 해당 주제를 다루려고 합니다.
6개의 프로젝트 중 3개는 2명의 인원으로 진행하였고 나머지는 10명 이상의 인원으로 대규모로 진행하였습니다.
이러한 경험으로 한 달에 몇 개 정도의 테이블을 수행할 수 있는지를 설명합니다.
앞서 포스팅한 “한 사람이 한 달 동안 표준화할 수 있는 테이블 수“에서는 한 사람이 한 달에 수행할 수 있는 테이블 수를 128개로 산출하였습니다.
그러나 글의 말미에서 실제 프로젝트에서는 128개보다 훨씬 더 많은 양의 테이블을 수행한다고 언급하였습니다.
그 이유를 이제 설명드리겠습니다.
가장 큰 차이는 ‘방법론’ 때문입니다.
이것은 마치 일반 주택을 짓는 것과 아파트를 건축하는 것의 차이와 유사합니다.
일반 주택은 하나의 집을 건축하는 것을 목표로 설계를 하여 진행합니다.
그러나 아파트의 경우는 적게는 수백 채, 많게는 수만 채의 집을 목표로 설계를 하고 시공을 합니다.
표준화를 수행하는 경우 방법론은 크게 두 가지로 접근할 수 있습니다.
1. 개별 테이블 단위 수행
2. 시스템 단위 테이블 수행
- 개별 테이블 단위 수행
개별 테이블 단위 수행은 일반 모델링을 수행하는 경우에 진행하는 방식입니다.
이미 데이터 표준이 잘 갖춰져 있는 상태에서 접근이 가능한 방식입니다.
잘 갖춰진 데이터 표준이란 표준단어, 표준용어, 표준도메인, 표준코드 등이 준비된 상태입니다.
그러므로 이미 존재하는 표준틀에 맞춰 표준화를 진행합니다.
물론 이때에도 새로 등록하는 표준단어, 표준용어, 표준도메인, 표준코드는 발생합니다.
이 중에서도 표준용어를 제외한 나머지 항목들은 대부분 기존 단어/도메인/코드를 사용합니다.
만약 데이터 표준이 없는 상태에서 개별 테이블 단위로 수행한다면 어떤 어려움이 있을까요?
작업의 속도 문제는 무시해도 매우 심각한 문제가 발생합니다.
한두 개 대상의 테이블을 기준으로 도메인을 결정하거나 단어를 결정했다고 가정해 보겠습니다.
‘협력업체명’이라는 용어를 정의하였고 도메인은 ‘문자 20자리’로 정의했습니다.
그런데 이후에 다른 테이블에서 동일한 용어를 사용하고 있으며 ‘문자 30자리’가 필요합니다.
이 경우 도메인의 변경이 불가피합니다.
그러므로 개별 테이블 단위 표준화는 데이터 표준이 갖춰진 상태에서 진행하는 것이 바람직합니다.
- 시스템 단위 테이블 수행
데이터 표준이 없거나 부실하여 새롭게 표준을 수립하는 경우에 접근하는 방식입니다.
대부분의 표준화 프로젝트가 이에 해당합니다.
고객사에서 데이터 표준화를 요청하는 경우 경험상 90%는 표준이 없는 상태였습니다.
시스템 단위라 하여도 경우에 따라서는 여러 시스템을 하나의 단위로 표준화를 합니다.
이것은 시스템별로 표준을 각각 정의할 것인지 아니면 여러 시스템을 하나의 표준으로 정의할 것인지에 따라 다릅니다.
그러므로 데이터 표준 단위로 대상을 선정합니다.
‘온라인쇼핑몰’ 시스템과 ‘정산’ 시스템이 있다고 가정하겠습니다.
만약 ‘온라인쇼핑몰’ 시스템과 ‘정산’ 시스템이 동일한 표준을 사용한다면 표준화는 어떤 단위로 수행해야 할까요?
네, ‘온라인쇼핑몰’ 시스템과 ‘정산’ 시스템을 하나의 단위로 수행합니다.
만약 ‘온라인쇼핑몰’ 시스템과 ‘정산’ 시스템이 다른 표준을 사용한다면 시스템별로 수행합니다.
동일한 표준을 사용하는 단위로 수행하는 근본적인 이유는 무엇일까요?
표준단어/표준도메인/표준용어/표준코드를 결정할 때 전체 대상을 고려하여 결정해야 하기 때문입니다.
특히 표준도메인을 결정할 때는 전체 대상의 데이터 타입과 길이를 고려하여 결정해야 합니다.
이 과정에서 표준코드의 정체도 어느 정도 드러납니다.
즉, 표준코드의 명칭은 동일하지만 실제 의미하는 바가 다른 경우를 말합니다.
예를 들어, ‘구매진행상태코드’가 어떤 테이블에서는 ‘고객이 상품을 구매하는 진행 상태코드’이지만, 다른 테이블에서는 ‘구매팀에서 거래처를 통해 상품을 구매하는 진행 상태 코드’일 수 있습니다.
이 경우 ‘구매진행상태코드’는 다음과 같이 두 개의 코드로 다시 정의합니다.
- ‘고객이 상품을 구매하는 진행 상태코드’ → ‘고객상품구매진행상태코드‘
- ‘구매팀에서 거래처를 통해 상품을 구매하는 진행 상태코드’ → ‘구매팀상품구매진행상태코드‘
시스템 단위로 테이블을 표준화하는 경우 가장 큰 장점은 역시 ‘생산성’입니다.
실제로 이러한 방식으로 표준화를 수행하는 경우는 한 명의 컨설턴트가 한 달에 500개 정도 수행 가능합니다.
다음 글에서는 표준화 방법론을 구체적으로 다루도록 하겠습니다.
다음 글: 20만 개 칼럼을 표준화한 방법론 공개
AI를 활용하여 표준화를 자동으로 수행하는 방법은 다음 글을 참고하시기 바랍니다.
참고 글: AI 데이터 표준화 자동화 서비스 – S코파일럿