태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

'데이터 품질'에 해당되는 글 3건

아래 그림은 데이터 아키텍트가 해야 할 일에 대한 프레임웍입니다. 프레임웍(Framework)이란 전체가 어떻게 구성됐는지를 보여주는 논리적인 틀입니다.



데이터 아키텍트가 해야 할 일은 크게 표준, 구조, 품질 영역으로 구분할 수 있습니다. 각 영역은 업무의 종류에 따라 원칙, 설계, 관리, 시스템으로 구분할 수 있습니다.

 

표준 영역은 데이터에 대한 표준화를 의미합니다. 표준 지침서가 있어야 하고, 표준 단어와 표준 용어와 같은 표준 컨텐츠가 있어야 합니다. 그리고 이런 컨텐츠를 관리하는 메타 시스템이 필요합니다.

 

구조 영역은 데이터 모델을 의미합니다. 마찬가지로 모델링 지침서가 있고, 데이터 주제 영역, 개념 모델, 논리 모델 등이 있습니다. 모델링은 표준 데이터를 이용해서 수행합니다. 모델은 저장소에 저장돼 메타 시스템과 연동되고요.

 

품질 영역은 표준과 구조, 데이터 값에 대한 품질 관리를 의미합니다. 품질을 높일 수 있는다양한 기준(지표)을 관리해서 잘못된 부분을 개선해서 표준, 구조, 값에 대한 품질을 높이기 위한 활동을 하게 됩니다. 이런 활동을 원활하게 하기 위해서는 DQ시스템을 사용하게 됩니다.

 

세로 축인 원칙과 설계, 관리, 시스템은 서로 유기적으로 엮여 있습니다. 원칙에 따라 설계를 해야 하고, 설계 결과를 시스템에 반영해야 합니다. 또한 설계된 결과물은 검토나 승인 과정이 필요하며, 지속적으로 관리돼야 합니다.

 

가로 축인 영역 또한 서로 엮여 있습니다. 데이터 표준에 맞게 데이터 구조를 설계하게 되고, 데이터 구조를 구현한 DB에 저장된 데이터 값과 표준 콘텐츠, 모델 구조 자체에 대한 품질을 높이기 위한 활동을 하게 됩니다.

 

위의 데이터 아키텍트 프레임웍은 DA가 수행해야 할 핵심 요소만을 포함시켰습니다. 데이터 아키텍트는 위에 표현된 일 외에도 많은 역할을 하게 됩니다. 이해 관계자 사이의 의견을 조율하고 DA 조직을 관리하는 일도 하게 됩니다. 데이터와 관련된 각종 이슈를 해결해야 하는 것은 당연한 업무입니다.

 

데이터와 관련된 모든 지식을 총괄하는 사람이 데이터 아키텍트며, 총괄해야 하는 지식을 간단하게 표현한 것이 위의 표입니다.



'데이터 Story > 데이터 상념(想念)' 카테고리의 다른 글

데이터에 대한 개인적인 비전  (0) 2018.06.23
데이터 아키텍트 프레임웍  (0) 2018.03.31
[worst practice 4]  (0) 2017.11.04
worst practice  (0) 2017.10.28
[worst practice 2]  (3) 2017.09.30
모델러의 상처  (0) 2017.09.25
블로그 이미지

블루퍼필

댓글을 달아 주세요


"위즈덤마인드"는 아래와 같은 업무를 수행하는 데이터 모델링 전문 업체입니다.

업계 최고의 품질을 제공해 드립니다.


문의: bluepupi@gmail.com

무료 방문 컨설팅 가능(시간 조정 후 방문)


ㅁ 신규 모델링 구축

 

-기존 ERD의 부분 수정으로는 효과가 없을 시 전면 재구축을 목표로 신규 ERD 설계

-차세대나 고도화와 같이 화면이나 소스까지 변경 필요

-규모에 맞게 모델러가 다수 투입돼 분석/설계 기간에 설계

 

 

ㅁ 리모델링 구축

 

-기존 ERD의 부적절한 부분만을 찾아 재설계

-기존 ERD에 반영 못했던 업무가 반영될 수 있도록 재설계

-소수의 전문 모델러가 길게 수행

-유지보수하면서 반영 가능한 범위 내에서 시행

-유지보수 때보다는 소스 수정이나 데이터 이행이 더 많이 발생

-전면 재개발처럼 한꺼번에 변경하는 게 아니라 점진적으로 변경

-대대적으로 고도화할 수 없는 경우 적절

 

 

ㅁ 데이터 아키텍트(DA) 수행

 

-DA 조직을 이끄는 사람으로 데이터 전체적인 아키텍처를 설계

-표준화. 모델링, 품질, 이행. 튜닝, DBA 등의 데이터 관련 당사자가 많을 경우 반드시 필요한 사람

-작은 프로젝트에서는 표준화와 모델링을 수행하는 사람 중에 리더를 의미

 

 

ㅁ 데이터 모델링 컨설팅

 

-데이터 모델링을 검토하고 가이드하는 통합 모델러 역할

-업무 분석 설계자나 개발자가 모델 설계를 할 경우, 모델을 검증하여 검토 결과서를 작성하고 모델 변경 권유

-소수의 통합 모델러가 통합이나 정규화 위배. 주 시별자 등 핵심적인 부분만을 검토

-데이터 모델링 표준 수립하여 제시

 

 

DA(데이터 아키텍처) 컨설팅

 

-DA 조직 구축이나 DA 업무 범위에 대한 가이드

-단어, 용어 등의 표준 데이터나 ERD에 대한 진단

-ERD와 연관된 표준화나 데이터 값에 대한 진단

 

 

ERD 관리

 

-계정계/업무계 전체 ERD를 통합 관리

-신규 업무에 대해서 TOBE 모델 제시

-엔터티 무결성, 참조 무결성, 도메인 무결성 등 모델의 품질을 높이기 위해 ASIS 모델에 대한 개선 모델 제안

-최소한의 모델링 툴 라이선스로 ERD 관리 가능

 

 

ㅁ 데이터 표준 컨설팅

 

-데이터 모델링과 연관된 표준화 컨설팅 수행

-표준지침. 표준단어. 표준도메인, 표준용어 등 구축 및 가이드

 

 

ㅁ 데이터 품질 컨설팅

 

-표준단어표준도메인 등 표준 컨텐츠 품질 점검

-데이터 모델 구조 품질 점검

-데이터 값 품질 점검

 

 

ISP 컨설팅

 

-EA DA 영역에 대한 컨설팅

-주제 영역 구축, 영역별 개념 모델 설계

-데이터 관리체계 정책 수립

 


블로그 이미지

블루퍼필

댓글을 달아 주세요

오늘날 데이터를 정보로서 활용하는 사용자의 불만과 불신은 널리 퍼져 있습니다.

 

모델러로서 간혹 현업 사용자와 인터뷰를 하는데 IT에 대한 불만이 심합니다. 물론 IT의 불만도 많습니다. 사실 데이터 품질 문제는 IT의 문제만은 아닙니다.

 

사용자의 불만을 간단하게 요약하면 아래와 같습니다. 수시로 요청하는 데이터, 화면에서 보여지는 데이터, 리포트 등을 망라해서요.

 

§   요청한 데이터를 선별적으로 받는다

§   요청한 데이터를 늦게 받는다

§   요청해서 받은 데이터가 정확하지 않다

§   필요한 데이터를 관리하지 않는다

 

사용자 생각에는 만들 수 있는 데이터 같은데 IT 부서에 요청하면 어떤 건 안되고, 어떤 건 된다는 거죠. 지금은 그렇지 않겠지만 예전엔 저도 상대에 따라 후순위로 미뤘던 기억이 납니다. ㅎㅎ

 

IT 입장에서는 너무 오래 걸리거나 연관 관계가 없어서 곤란할 수가 있습니다. 요건이 미리 결정되고 그에 맞게 데이터를 관리해야 결과를 뽑을 수 있죠.

 

데이터를 요청하면 결과가 너무 늦다는 것도 큰 불만입니다. 과거에는 성능과 관련된 불만이 큰 편이었는데요. 최근에는 데이터가 맞지 않는다는 불만이 많습니다.

 

대부분 사용자는 데이터가 늦게 나오는 것은 대략 이해합니다. 데이터량이 많다는 것을 아니까요. 반면에 데이터가 틀린 것은 이해하지 못합니다. 특히 본인이 엑셀로 뽑았을 때와 결과가 달라지면 IT를 더 이상 신뢰하지 않게 됩니다.

 

데이터가 틀려지는 것으로 인해 많은 문제점이 생깁니다. 사용자도 마음 놓고 결과를 사용하지 못하고요. 데이터 품질 저하로 인한 비용도 만만치 않은데 대부분 모른 척 합니다.

 

마지막으로 어떤 데이터를 관리해야 한다고 요청했는데, 요건을 냈는데도 데이터를 관리하지 않았다는 얘기를 가끔 합니다. 미스 커뮤니케이션이 더 큰 문제인 거 같지만 이런 예를 자주 목격합니다. 결국 필요할 때 데이터를 요구하면 뽑을 수 없다는 답변을 듣게 되죠.

 

최근에 전산을 사용하지 않고는 업무 자체가 불가능하게 됐습니다. 업무의 근원인 데이터를 제대로 관리해야 하는 건 이미 불변의 사실입니다.

 

결국 잘못된 데이터 구조가 데이터 품질을 떨어트립니다. 중복 데이터도 사용을 최대한 자제해야 좋은 품질의 데이터가 됨을 유념해야 합니다.

 

 


블로그 이미지

블루퍼필

댓글을 달아 주세요