본문 바로가기

이력 데이터와 내역 데이터 1 지난 글에서 이력 데이터의 성격에 대해 간략하게 설명드렸습니다. 다시 정리하면 변경되는 데이터가 이력 데이터이고요. 쌓이는 데이터는 내역 데이터입니다. 그리고 원천(본질) 데이터인지를 구별하는 것이 중요합니다. 원천 엔터티를 도출하고 이력엔터티를 분석해야 하고요. 발생 내역인 원천 데이터가 변경되면, 변경 전의 데이터를 관리해야 이력 데이터 관리라고 합니다. 저는 ‘변경이력’과 ‘발생내역’이라는 용어로 구분합니다. 지난 번에 언급했듯이 이력이라는 용어는 상당히 애매합니다. 과거 데이터라는 포괄적인 의미를 지니고 있습니다. 영어로 표현하면 Time-Dependent Data, Historical Data 정도가 되는데요… 하지만 데이터 모델에서 말하는 이력은 단순히 쌓여있는 과거의 데이터가 아니라 변경된 .. 더보기
데이터를 활용하는 사용자의 불만 오늘날 데이터를 정보로서 활용하는 사용자의 불만과 불신은 널리 퍼져 있습니다. 모델러로서 간혹 현업 사용자와 인터뷰를 하는데 IT에 대한 불만이 심합니다. 물론 IT의 불만도 많습니다. 사실 데이터 품질 문제는 IT의 문제만은 아닙니다. 사용자의 불만을 간단하게 요약하면 아래와 같습니다. 수시로 요청하는 데이터, 화면에서 보여지는 데이터, 리포트 등을 망라해서요. § 요청한 데이터를 선별적으로 받는다 § 요청한 데이터를 늦게 받는다 § 요청해서 받은 데이터가 정확하지 않다 § 필요한 데이터를 관리하지 않는다 사용자 생각에는 만들 수 있는 데이터 같은데 IT 부서에 요청하면 어떤 건 안되고, 어떤 건 된다는 거죠. 지금은 그렇지 않겠지만 예전엔 저도 상대에 따라 후순위로 미뤘던 기억이 납니다. ㅎㅎ IT .. 더보기
이력 데이터에 대한 주절거림 모델링 분야에서 ‘이력’만큼 혼란스러운 용어는 없을 거 같습니다(저만 그런지는 모르겠습니다만). 책을 쓰면서도 가장 고민했던 장이고 ‘이력’이란 용어를 사용하지 않으려 시도해 봤지만 달리 방법이 없었습니다. 어쨌든 이력이라는 용어는 사용했지만 강조하려 했던 것이 우선 이력 데이터입니다. 무엇을 이력 데이터라고 하는지를 설명하려 애를 먹었습니다. 아직도 스스로 만족하지 못하는 부분은 있지만요. 언젠가 저를 잘 아는 어떤 모델러가 아직 연구할 부분이 있냐고 물었을 때 이력 데이터라고 주저없이 답변했습니다. 이력 데이터에 대한 내용은 외국 서적에도 그다지 없는 거 같습니다. 우리만의 고민은 아닐 거 같은데 원서에서 생각보다 많이 찾지 못했습니다. 저는 이력 데이터는 지나간 데이터(Bygone Data)라고 생.. 더보기