본문 바로가기

데이터 Story/모델링 이론

관계란? 관계(Relationships)가 두 개 이상의 엔터티 간에 존재하는 연관성이라는 정의 자체는 어렵지 않습니다. 하지만 관계는 모델링에서 가장 잘못 사용하고 있는 것 중에 하나입니다. 제가 관계를 따질 때 중요하게 생각하는 것은 두 가지입니다. 하나는 참조 무결성(Referencial Integrity) 관계가 있느냐이고, 다른 하나는 바로 위의 관계만을 표현하고 있느냐입니다. 사실 두 개는 비슷한 얘기입니다. RI 관계와 1촌 관계를 우선 기억했으면 합니다. 엔터티 간의 연관성에는 두 가지 종류가 있습니다. 하나는 종속 관계(Dependent Relationships)이고 다른 하나는 참조 관계(Referential Relationships)입니다. 종속 관계는 종속 엔터티(Dependent Entit.. 더보기
엔터티 도출 원칙 2 - 데이터 정체성 - 엔터티 무결성 - 엔터티 유일성 - 데이터 혼용 배제 - 타 엔터티와 관계 존재 - 프로세스 도출 지양 - 화면 도출 지양 - 데이터 관리 요건 관계(Relationship)도 엔터티 도출의 중요한 요소인데요. 엔터티는 보통 타 엔터티와 관계가 존재하는 것이 일반적입니다. 그래서 표현상의 약속을 제외하고 다른 엔터티와 관계가 존재하지 않으면 그 엔터티의 성격에 대해서 다시 한 번 살펴야 합니다. 하지만 이 부분이 지나치게 강조돼 전체 엔터티가 관계선으로 연결돼 있지 않으면 잘못된 모델이라고 단정하는 때가 있습니다. 잘못된 생각입니다. 관계 장에서 자세하게 설명하겠지만 관계가 무조건 존재해야 하는 것은 아닙니다. 기준 엔터티 등은 관계가 존재하지 않을 수 있으며 참조 무결성을 엄격히 .. 더보기
엔터티 도출 원칙 1 가장 중요한 원칙은 성격·본질·주제에 따른 정체성이 분명한 엔터티로 도출해야 한다는 것입니다. - 데이터 정체성 - 엔터티 무결성 - 엔터티 유일성 - 데이터 혼용 배제 - 타 엔터티와 관계 존재 - 프로세스 도출 지양 - 화면 도출 지양 - 데이터 관리 요건 엔터티를 명확하게 정의하는 것은 데이터 모델링을 수행할 때 가장 중요한 부분이면서 동시에 가장 간과되는 부분이기도 합니다. 엔터티만 명확하게 정의하면 모델링의 많은 문제는 해결될 것입니다. 엔터티 정의가 불분명하면 발생할 수 있는 가장 커다란 부작용은 엔터티를 임의대로 사용하는 것입니다. 여러 데이터가 혼합된 형태의 엔터티가 많이 사용되는데 이는 엔터티가 아니라 뷰(View)로 사용돼야 합니다. 성격이 불명확한 엔터티로 모델 구조가 정해지면 확장성.. 더보기
기준 엔터티란? 기준 엔터티는 코드와 같이 업무의 기준이 되는 데이터를 관리하는 엔터티입니다. 업무를 수행하며 참조하는 데이터를 관리한다는 의미로 참조(Reference) 엔터티라고도 합니다. 일부 솔루션에서 고객·상품 엔터티 등을 기준 엔터티로 보는데 제 책에서의 기준 엔터티는 환율·우편번호·이자율·코드 등의 기준 데이터를 관리하는 엔터티를 의미합니다. 기준 엔터티를 사용하면서 주의할 점은 이자율 등의 기준 엔터티와 이자율을 사용하는 엔터티와의 관계입니다. 실제 참조 무결성(Referencial Integrity) 제약이 존재하는지 아닌지를 숙고해야 합니다. 기준 엔터티의 데이터가 바뀌면 그 기준 데이터를 참조해 사용했던 데이터를 전부 바꿀 것인지, 아니면 기준 데이터는 선택할 당시의 데이터이므로 시점 데이터로서 개별.. 더보기
가공 엔터티란? 가공 엔터티는 원천(Raw) 데이터가 아닌 데이터를 관리하는 엔터티입니다. 원천 데이터인 실체 엔터티와 행위 엔터티의 데이터를 가공한 데이터를 관리하는 엔터티로 주로 집계, 요약, 임시 데이터를 관리하는 엔터티가 가공 엔터티입니다. 가공 엔터티는 다양한 방법으로 사용됩니다. 업무에서 많이 쓰이는 것은 DW 시스템에서는 많은 부분을 차지하는 집계 데이터를 관리하는 엔터티입니다. 집계 엔터티를 사용하는 이유는 조회 시간을 줄이기 위해서입니다. 만약 바로 원천 데이터를 집계해도 크게 불편하지 않다면 굳이 집계 엔터티를 사용할 이유는 없습니다. 이 판단도 매우 중요합니다. 그리고 업무 처리 대상을 한정시키기 위해 대상 데이터만 별도로 보관하는 작업용 엔터티가 많이 존재합니다. 처리 예정 내역을 관리하거나 오류를.. 더보기
행위 엔터티란? 행위 엔터티는 많이 알려진 엔터티입니다. 어떤 실체의 업무 행위나 활동에 의해서 생긴 원천(Raw) 데이터입니다. 엔터티 중에 많은 엔터티가 행위 엔터티입니다. 가공 엔터티가 더 많을 때도 있지만요. 행위 엔터티만의 특징은 엔터티 발생 순서가 존재한다는 것입니다. 일반적으로 데이터에는 순서의 개념이 없습니다(생성 순서가 중요하지 않다는 것이 더 정확한 표현이겠네요). 하지만 일부 행위 엔터티는 발생 순서가 중요합니다. 발생해서 소멸하는 비교적 짧은 라이프사이클이 존재합니다. 행위 엔터티는 관리하는 속성도 대부분 많습니다. 본질 보다는 행위가 더욱 많은 요소를 가지니 속성도 복잡합니다. 엔터티도 많고 속해있는 속성도 많으니 모델링 시 가장 많은 시간이 소요되는 엔터티입니다. 제가 생각하는 행위 엔터티의 가.. 더보기
실체 엔터티란? 실체의 정의를 사전에서 찾아보면 ‘실제의 물체(物體) 또는 외형에 대한 실상(實相)’이라고 나옵니다. 간단히 만질 수 있는 것(Tangible)을 관리하는 엔터티입니다. 주의할 점은 만질 수 있는 것에 대한 모든 데이터를 관리하는 것이 아니라 본질적인 데이터를 관리한다는 것입니다. 실체의 존재(Existence)와 연관된 데이터를 관리합니다. 이름이나 주민등록번호, 나이 등을 관리하는 엔터티이지 그 실체가 발생시킨 데이터를 관리하는 엔터티는 아닙니다. 예를 들면 그 실체가 어떤 계약을 했는지, 어떤 불만을 얘기했는지, 얼마나 출금했는지 등을 관리하면 실체 엔터티가 아닙니다. 실체 엔터티는 도출이 용이하지만 잘못 도출하면 업무 전체적으로 심각한 영향을 끼칩니다. 행위 엔터티는 실체가 발생시킨 엔터티이고 가.. 더보기
엔터티 분류(실체/행위/가공/기준) 엔터티를 분류하는 목적은 크게 두 가지가 있습니다. 엔터티의 성격을 파악하는 데 도움이 되기 때문이고요. 모델링 작업 순서를 정하는 데 도움이 되기 때문입니다. 상향식 방법으로 모델링을 수행할 때는 단계적으로 접근하기 위해 엔터티를 분류하는 게 의미가 있습니다. 저는 모델링을 수행하면서 전체 엔터티를 체계적으로 분류했던 적은 없었던 거 같습니다. 업무에서 핵심적으로 사용하는 소수의 엔터티만 선정합니다. 워낙 기간에 쫒겨 일을 해서 그런 것도 같지만 사실 분류 자체를 중요하게 생각하지 않습니다. 엔터티를 분류하는 것 자체가 중요한 것은 아닙니다. 그건 부가적인 것일 뿐 본질적인 것이 아니기 때문입니다. 진짜 본질인 엔터티 정의가 정확하면 잘못 분류하는 것은 문제되지 않습니다. 저는 엔터티를 분류할 때의 기.. 더보기
종속 엔터티의 식별(Identifying) 관계 식별(Identifying) 관계와 비식별(Non-Identifying) 관계는 단순한 개념입니다. 언제 적용해야 하는지를 결정하기가 어렵죠. 상위 엔터티의 주 식별자가 하위 엔터티에 주 식별자로 상속되면 식별(Identifying) 관계입니다. 엄밀히 말해 종속 엔터티와 무관합니다. 하지만 부모 엔터티에 존재 종속(Existence Dependency)된 종속 엔터티는 대부분 식별 관계로 상속받습니다. 이 원칙은 지켜주는 게 좋습니다. 두 엔터티가 관계가 있고 하위 엔터티가 종속 엔터티라는 것이 분명하다면, 식별 관계로 상속 받는 것이 좋습니다. 문제는 예외인데요. 나중에 설명하겠지만 업무 식별자를 주 식별자로 채택하는 것을 원칙으로 불가피할 경우 인조 식별자를 채택해야 하는데요. 인조 식별자를 사용해.. 더보기
종속 엔터티의 종류 종속 엔터티에는 몇 가지 종류가 있습니다. - [그림1] 부모 엔터티의 추가 데이터를 관리하는 엔터티 - [그림2] 1정규화에 의해서 발생한 엔터티 - [그림3] 이력 데이터를 관리하는 엔터티 - [그림4] 다대다(M:M) 관계에서 발생한 교차 엔터티 - [그림5] 슈퍼타입과 관계된 서브타입 엔터티 - [그림6] 엔터티 분해에 의한 일대일(1:1) 엔터티 [그림1]의 상품가격 엔터티는 상품 엔터티의 일부 데이터를 더욱 상세하게 관리하는 엔터티입니다. 상품 가격은 상품이 존재하지 않는 한 존재할 수 없는 데이터이므로 상품가격 엔터티는 종속 엔터티입니다. 부모 엔터티의 일부로서 성격이 동일한 데이터라고 할 수 있습니다. [그림1] [그림2] 주문상품 엔터티는1정규화에 의해서 발생한 엔터티입니다. 주문상품 엔.. 더보기