본문 바로가기

데이터 Story

관계선이 의미하는 것 관계선(Relationship Line)에는 여러 가지 의미가 포함돼 있습니다. 그으면 멋있을 거 같아서 관계선을 표현하진 않죠. 가장 중요한 의미는 관계선을 보고 업무 규칙을 알 수 있다는 것입니다. 관계를 정확히 표현했다면 관계선은 어떤 식으로든 두 엔터티 간의 업무 규칙을 보여줍니다. 그 업무 규칙은 기본적으로 종속 관계나 참조 관계냐로 구분할 수 있습니다. 종속 관계라면 두 엔터티는 뗄래야 뗄 수 없는 한 몸과 같은 관계이고요. 참조 관계는 없으면 그냥 허전한 관계입니다. 중요한 정보가 비는 거죠. 툴에서 이 둘을 구분하도록 해 주는 것도 의미가 있을 거 같습니다. 현재는 식별 관계냐 비식별 관계냐로 구분하는데 좀 부족한 거 같습니다. 업무 프로세스에 의해 발생되는 데이터면 관계선이 업무의 흐름을.. 더보기
종속 관계와 참조 관계 [그림1]은 종속 관계입니다. 상품가격 데이터는 상품이 존재하지 않으면 존재할 수 없으므로(존재 존속됐으므로) 두 엔터티의 관계는 완전한 종속 관계입니다. [그림1] 두 엔터티가 종속 관계면 엔터티명도 보통 유사합니다. 그리고 보통 부모 엔터티의 식별자는 자식 엔터티의 식별자로 상속됩니다. [그림2]도 종속 관계이지만 팀은 특정 리그에 속해 있어야 한다는 요건이 있어야 종속 관계로 도출할 수 있습니다. 만약 일반적인 요건이라면 리그와 팀은 별개로 존재할 수 있습니다. [그림2] 팀이 생기면 한 리그에만 속해야 한다는 요건에 따라 종속 관계로 도출됐고 식별자로서 상속했는데요. [그림1] 모델과 약간 다른 면이 있습니다. 요건이 바뀔 가능성이 있다는 것이고요. 팀 엔터티는 실체 엔터티라 식별자를 단순하게 만.. 더보기
관계란? 관계(Relationships)가 두 개 이상의 엔터티 간에 존재하는 연관성이라는 정의 자체는 어렵지 않습니다. 하지만 관계는 모델링에서 가장 잘못 사용하고 있는 것 중에 하나입니다. 제가 관계를 따질 때 중요하게 생각하는 것은 두 가지입니다. 하나는 참조 무결성(Referencial Integrity) 관계가 있느냐이고, 다른 하나는 바로 위의 관계만을 표현하고 있느냐입니다. 사실 두 개는 비슷한 얘기입니다. RI 관계와 1촌 관계를 우선 기억했으면 합니다. 엔터티 간의 연관성에는 두 가지 종류가 있습니다. 하나는 종속 관계(Dependent Relationships)이고 다른 하나는 참조 관계(Referential Relationships)입니다. 종속 관계는 종속 엔터티(Dependent Entit.. 더보기
엔터티 도출 원칙 2 - 데이터 정체성 - 엔터티 무결성 - 엔터티 유일성 - 데이터 혼용 배제 - 타 엔터티와 관계 존재 - 프로세스 도출 지양 - 화면 도출 지양 - 데이터 관리 요건 관계(Relationship)도 엔터티 도출의 중요한 요소인데요. 엔터티는 보통 타 엔터티와 관계가 존재하는 것이 일반적입니다. 그래서 표현상의 약속을 제외하고 다른 엔터티와 관계가 존재하지 않으면 그 엔터티의 성격에 대해서 다시 한 번 살펴야 합니다. 하지만 이 부분이 지나치게 강조돼 전체 엔터티가 관계선으로 연결돼 있지 않으면 잘못된 모델이라고 단정하는 때가 있습니다. 잘못된 생각입니다. 관계 장에서 자세하게 설명하겠지만 관계가 무조건 존재해야 하는 것은 아닙니다. 기준 엔터티 등은 관계가 존재하지 않을 수 있으며 참조 무결성을 엄격히 .. 더보기
엔터티 도출 원칙 1 가장 중요한 원칙은 성격·본질·주제에 따른 정체성이 분명한 엔터티로 도출해야 한다는 것입니다. - 데이터 정체성 - 엔터티 무결성 - 엔터티 유일성 - 데이터 혼용 배제 - 타 엔터티와 관계 존재 - 프로세스 도출 지양 - 화면 도출 지양 - 데이터 관리 요건 엔터티를 명확하게 정의하는 것은 데이터 모델링을 수행할 때 가장 중요한 부분이면서 동시에 가장 간과되는 부분이기도 합니다. 엔터티만 명확하게 정의하면 모델링의 많은 문제는 해결될 것입니다. 엔터티 정의가 불분명하면 발생할 수 있는 가장 커다란 부작용은 엔터티를 임의대로 사용하는 것입니다. 여러 데이터가 혼합된 형태의 엔터티가 많이 사용되는데 이는 엔터티가 아니라 뷰(View)로 사용돼야 합니다. 성격이 불명확한 엔터티로 모델 구조가 정해지면 확장성.. 더보기
기준 엔터티란? 기준 엔터티는 코드와 같이 업무의 기준이 되는 데이터를 관리하는 엔터티입니다. 업무를 수행하며 참조하는 데이터를 관리한다는 의미로 참조(Reference) 엔터티라고도 합니다. 일부 솔루션에서 고객·상품 엔터티 등을 기준 엔터티로 보는데 제 책에서의 기준 엔터티는 환율·우편번호·이자율·코드 등의 기준 데이터를 관리하는 엔터티를 의미합니다. 기준 엔터티를 사용하면서 주의할 점은 이자율 등의 기준 엔터티와 이자율을 사용하는 엔터티와의 관계입니다. 실제 참조 무결성(Referencial Integrity) 제약이 존재하는지 아닌지를 숙고해야 합니다. 기준 엔터티의 데이터가 바뀌면 그 기준 데이터를 참조해 사용했던 데이터를 전부 바꿀 것인지, 아니면 기준 데이터는 선택할 당시의 데이터이므로 시점 데이터로서 개별.. 더보기
가공 엔터티란? 가공 엔터티는 원천(Raw) 데이터가 아닌 데이터를 관리하는 엔터티입니다. 원천 데이터인 실체 엔터티와 행위 엔터티의 데이터를 가공한 데이터를 관리하는 엔터티로 주로 집계, 요약, 임시 데이터를 관리하는 엔터티가 가공 엔터티입니다. 가공 엔터티는 다양한 방법으로 사용됩니다. 업무에서 많이 쓰이는 것은 DW 시스템에서는 많은 부분을 차지하는 집계 데이터를 관리하는 엔터티입니다. 집계 엔터티를 사용하는 이유는 조회 시간을 줄이기 위해서입니다. 만약 바로 원천 데이터를 집계해도 크게 불편하지 않다면 굳이 집계 엔터티를 사용할 이유는 없습니다. 이 판단도 매우 중요합니다. 그리고 업무 처리 대상을 한정시키기 위해 대상 데이터만 별도로 보관하는 작업용 엔터티가 많이 존재합니다. 처리 예정 내역을 관리하거나 오류를.. 더보기
행위 엔터티란? 행위 엔터티는 많이 알려진 엔터티입니다. 어떤 실체의 업무 행위나 활동에 의해서 생긴 원천(Raw) 데이터입니다. 엔터티 중에 많은 엔터티가 행위 엔터티입니다. 가공 엔터티가 더 많을 때도 있지만요. 행위 엔터티만의 특징은 엔터티 발생 순서가 존재한다는 것입니다. 일반적으로 데이터에는 순서의 개념이 없습니다(생성 순서가 중요하지 않다는 것이 더 정확한 표현이겠네요). 하지만 일부 행위 엔터티는 발생 순서가 중요합니다. 발생해서 소멸하는 비교적 짧은 라이프사이클이 존재합니다. 행위 엔터티는 관리하는 속성도 대부분 많습니다. 본질 보다는 행위가 더욱 많은 요소를 가지니 속성도 복잡합니다. 엔터티도 많고 속해있는 속성도 많으니 모델링 시 가장 많은 시간이 소요되는 엔터티입니다. 제가 생각하는 행위 엔터티의 가.. 더보기
실체 엔터티란? 실체의 정의를 사전에서 찾아보면 ‘실제의 물체(物體) 또는 외형에 대한 실상(實相)’이라고 나옵니다. 간단히 만질 수 있는 것(Tangible)을 관리하는 엔터티입니다. 주의할 점은 만질 수 있는 것에 대한 모든 데이터를 관리하는 것이 아니라 본질적인 데이터를 관리한다는 것입니다. 실체의 존재(Existence)와 연관된 데이터를 관리합니다. 이름이나 주민등록번호, 나이 등을 관리하는 엔터티이지 그 실체가 발생시킨 데이터를 관리하는 엔터티는 아닙니다. 예를 들면 그 실체가 어떤 계약을 했는지, 어떤 불만을 얘기했는지, 얼마나 출금했는지 등을 관리하면 실체 엔터티가 아닙니다. 실체 엔터티는 도출이 용이하지만 잘못 도출하면 업무 전체적으로 심각한 영향을 끼칩니다. 행위 엔터티는 실체가 발생시킨 엔터티이고 가.. 더보기
엔터티 분류(실체/행위/가공/기준) 엔터티를 분류하는 목적은 크게 두 가지가 있습니다. 엔터티의 성격을 파악하는 데 도움이 되기 때문이고요. 모델링 작업 순서를 정하는 데 도움이 되기 때문입니다. 상향식 방법으로 모델링을 수행할 때는 단계적으로 접근하기 위해 엔터티를 분류하는 게 의미가 있습니다. 저는 모델링을 수행하면서 전체 엔터티를 체계적으로 분류했던 적은 없었던 거 같습니다. 업무에서 핵심적으로 사용하는 소수의 엔터티만 선정합니다. 워낙 기간에 쫒겨 일을 해서 그런 것도 같지만 사실 분류 자체를 중요하게 생각하지 않습니다. 엔터티를 분류하는 것 자체가 중요한 것은 아닙니다. 그건 부가적인 것일 뿐 본질적인 것이 아니기 때문입니다. 진짜 본질인 엔터티 정의가 정확하면 잘못 분류하는 것은 문제되지 않습니다. 저는 엔터티를 분류할 때의 기.. 더보기