본문 바로가기

데이터 Story/데이터 표준

두 가지 종류의 표준 도메인 표준 단어와 표준 도메인, 표준 용어는 서로 엮어 있어 각자 별개의 것으로 설명하기 힘듭니다. 하지만 각자의 내용이 길고, 구분이 필요하기 때문에 별도의 장에서 설명하고 있습니다. 서로 밀접하게 연관되다 보니 중복 설명이 될 수 있습니다. 도메인의 의미는 다소 포괄적입니다. 데이터 모델링에서 도메인(domain)의 일반적인 의미는 ‘데이터 타입과 길이, 포멧 등이 같은 값의 집합’입니다. 이는 표준 도메인에도 유사하게 적용되는 의미입니다. 결국 의미가 같고, 데이터 타입과 자릿수가 같은 것을 표준 도메인이라고 합니다. 실제로 표준 도메인은 속성 명의 끝에 붙는 것으로 사용되고 있습니다. 분류어라는 용어로도 사용됩니다. 표준 도메인의 역할 표준 도메인의 사용 목적은 크게 세가지 정도가 있습니다. 하나는 데.. 더보기
복합어에 대한 정리 이번 글은 복합어에 대한 내용입니다. 이미 복합어에 대한 글을 게시한 적이 있지만, 이번 기회에 더 자세하게 설명하겠습니다. 먼저 표준 단어에 대한 이전 글을 읽어보시길 권합니다. http://dataprofessional.tistory.com/172 위 글에서 설명했지만 복합어는 표준 단어의 일종입니다. 즉, 표준 단어는 단일어와 복합어로 나눌 수 있습니다. 복합어가 필요한 이유를 간단히 설명한다면, 애매한 사용을 줄이고 컬럼 명을 줄이기 위해서라고 하겠습니다. 표준화지침서에 복합어의 사용을 지양하라는 지침이 많은데, 제 생각은 반대입니다. 애매한 사용을 줄이고 컬럼 명을 줄이기 위해서는 복합어가 많아야 한다고 생각하기 때문입니다. 복합어를 사용해야 하는 경우 그럼, 어떤 경우에 복합어를 만들면 될까요.. 더보기
표준 단어에 대해서 제가 최근에 표준화에 대한 글을 간혹 올리는데요. 잠깐 언급한 적도 있지만, 그동안 표준화에 대한 내용은 자세히 다루지 않았습니다. 여러 이유가 있었지만, 어쨌든 최근 생각은 제 경험을 공유하는 게 좋겠다고 생각해서 하나씩 공유하고 있습니다. 그동안 속성 명을 정한 게 10만 개는 훌쩍 넘는 거 같습니다. 모델링할 때 아직까지는 속성 명 정하는 게 재미있습니다. 재미 없으면 힘들 텐데, 재미 있으니 누가 뭐라 하든 열심히 정하고 있습니다. 다만 개수에 압도당할 뿐이죠. 모델링 자체로만 봤을 때 재미 없는 게 한 가지 있습니다. 양이 압도적으로 많고, 중요한 부분이지만 정성을 들이기 쉽지 않은 부분인데요. 눈치 채셨을 거 같은데, 속성 설명 적는 것입니다. 가끔 50자 이상 적으라는 식의 가이드가 있으면 .. 더보기
속성 명 정하는 방법 엔터티 명은 상당히 중요합니다.제가 매우 강조하는 부분이에요.속성 명도 중요하긴 한데, 중요하게 취급하기에는 개수가 너무 많고 잘못됐을 때 치명적이지 않습니다. 그래도 잘못 정했을 때의 부작용이 없는 건 아닙니다.속성 명과 데이터가 전혀 다른 경우가 많습니다.변용해서 사용했거나 처음부터 잘못 사용한 경우죠. 제 책에서 속성 명에 대한 설명은 많지 않습니다.더욱이 방법을 소개하진 않았는데, 이 글에서 간단한 방법을 소개하겠습니다. 속성은 도메인 자체가 중요합니다.금액, 날짜, 내용, 명, 번호, 여부, 코드 등의 도메인이 속성의 성격을 바로 나타내죠.속성에서 관리하는 데이터의 성격을 구분하게 하는 게 도메인입니다.그래서 우선 도메인의 종류와 의미를 파악해야 합니다.도메인은 사이트마다 조금씩 다를 수 있습니.. 더보기
도메인 개념과 대표 속성 표준화 관련된 글을 간혹 올릴 생각입니다. 티가 안 나서 그렇지 제 책에 표준화에 대한 내용이 다소 있습니다. 표준화에 대한 언급을 자제한 이유가 있는데요. 그렇지 않아도 속성 표준화 위주로 모델링을 하는 실정이라 더 그렇게 될까 우려되기 때문입니다. 하지만 어차피 표준화는 모델링에서 빠질 수 없는 부분입니다. 잘 하면 본전이고, 제대로 못 하면 타격을 받을 수 있는 부분이라 중요합니다. 표준화에만 매달리는 것도 문제지만, 표준화를 가볍게 보는 것도 문제입니다. 사설이 길어지고 있는데, 표준화는 속성 명을 정하는 것과 연관되기 때문에 숙고해야 하니다. 댱연히 모델러도 양질의 표준 컨텐츠를 만들기 위해 노력해야 합니다. 표준화는 메타시스템과 연관될 수밖에 없어 매타시스템 기능을 일부 언급했지만, 모델러가개.. 더보기
화면 용어를 관리하려면 엔터티에 속할 속성 명에 사용되는 용어를 소위 표준화하는 것은 이제 일반적이다. 표준 용어를 정해 속성 명으로 사용한다. 표준 용어는 메타 시스템에서 관리한다. 최근에는 속성에 사용될 표준 용어 외에도 화면 용어를 관리하려는 요건이 있다. 10년 전에도 들었지만 그 당시에는 바람 정도였다. 하지만 지금은 구현하려는 시도를 한다. 아마 지금은 DA라면 듣게 되는 것 중의 하나일 것이다. 화면 용어이기 때문에 AP 영역(AA)에서 이 기능을 구축해야 할 거 같지만, DA 영역에서 이 기능을 구축할 수 있다. 속성 명과 연관이 돼서 메타 시스템에서 구현하는 게 가장 효과적이다. 다만 실제 컨텐츠(화면 용어)는 DA에서 관리할 수 없다. 메타 시스템과 연동돼서 DA에서 기능은 구현하지만 컨텐트는 사용하려는 각 .. 더보기
복합어에 대한 상념(想念) 복합어를 사용하는 이유는 크게 두 가지입니다. 첫째, 관용화된 용어를 사용하기 위해서입니다. 대상이 많지는 않지만 단어와 단어가 합쳐져서 뉘앙스가 달라지는 경우가 있습니다. 용어에 민감한 사람들은 이를 관리하고 싶어 합니다. 여기서, ‘용어’란 주로 영문 단어를 의미할 것입니다. 한글 단어 조합의 의미를 따지기도 하지만 주로 영문 조합의 의미를 따집니다. 예를 들어, 부가가치세는 ‘부가+가치+세’이지만 영문은 ‘VAT’로 쓰는 게 명확하다는 것이죠. 복합어를 사용하는 둘째 이유는 영문(컬럼 명)의 길이가 길어지는 것을 막기 위해서입니다. ‘부가가치세’를 복합어로 만들지 않으면 영문이 ‘VL_AD_TX’ 정도가 됩니다. 단어별로 두 자리의 약어를 사용해도 8자리가 되죠. 이를 복합어로 만들어 ‘VAT’로 .. 더보기
테이블 명을 정하는 방법 엔터티 명을 정하는 것은 사실 매우 어렵습니다. 상황에 맞는 수 많은 방법을 정해 놓고 따라야 해서 쉽지 않습니다. 그래서 논란이 많은 부분이기도 합니다. 엔터티 명만 정말 잘 정해도 좋은 모델러라고 할 수 있습니다. 반면에 테이블 명을 정하는 방법은 간단합니다. 대개 두 가지 방법 중에서 하나를 택해서 사용합니다. 방법을 결정하는 것은 대개 DBA가 합니다. 테이블 명은 DB 오브젝트에 포함되는데 전체 오브젝트를 감안해야 하기 때문에 DBA가 큰 틀을 정하는 것이죠. 차세대 프로젝트에서도 대개 DBA 쪽에서 테이블 명을 정하는 규칙을 정합니다. 이 과정에서 DA나 모델러에게 조언을 구하기도 하지만, 그렇지 않은 경우도 많죠. 테이블 명을 정하는 방법은 크게 두 가지입니다. 하나는 영역별 번호를 사용하는.. 더보기