본문 바로가기

분류 전체보기

[서평] 조훈현 고수의 생각법/조훈현/인플루엔셜/2015년 바둑팬임에도 ‘생각법’이라는 애매한 제목 때문에 크게 관심이 가지 않던 책이었다. 엉뚱하게도 머신러닝 책의 참고문헌에 포함돼 있어 읽게 됐다. 조훈현 고수의 생각법/조훈현/인플루엔셜/2015년 “생각은 반드시 답을 찾는다”는 소재목이 마음에 들었다. 생각의 힘을 믿는 나에게는 절대 공감할 수 있는 문구였다. 첫 페이지에 있는 아래 글이 이 책에서 말하는 전부라고 생각한다. “바둑이 내게 가르쳐준 바에 따르면, 세상에 해결하지 못할 문제는 없다. 집중하여 생각하면 반드시 답이 보인다.” 조훈현이라는 고수의 생각법은 집중해서 생각하는 것이다. 문제가 생기면 회피하거나 외면하지 말고 적극적으로 해결하려 노력해서 최상을 찾고, 최선을 찾고 아니면 차선을 찾는 노력이 필요하다고 말한다. 바둑 기사는 설사 끝이 보.. 더보기
비인부전 부재승덕(非人不傳 不才承德) 비인부전 부재승덕(非人不傳 不才承德) 사람됨에 문제 있는 자에게 벼슬이나 재능을 전수하지 말며, 재주나 지식이 덕을 앞서게 해서는 안 된다. 더보기
[서평] 빅데이터는 거품이다/김동환/페이퍼로드/2016 빅데이터는 지난 3~4년 동안 나의 머리 속을 어지럽게 만든 단어다.도대체 무엇인가? 데이터를 최전방에서 다루는 DA가 어떤 역할을 할 것인가? 나름 DA로서 경험과 이론이 풍부하다고 자부하지만, 빅데이터에 대해서는 어떠한 방향도 비전도 떠오르지 않았다. 이는 지금도 마찬가지다. 방향이라도 안다면 한 번 파볼 수도 있는데, 그게 없으니 어떻게 할 수가 없다. 애써 외면할 뿐이었다. 이 책은 우연히 제목이 눈에 띄어 뽑아 읽은 책이다. 모두가 빅데이터를 찬양하는데 제목이 참신했다. 솔직히 뭔가 알고 있다는 느낌이 들었다. 자신이 없으면 이 같은 제목으로 책을 낼 수는 없을 것이었다. “빅데이터는 거품이다/김동환/페이퍼로드/2016” 2016년 10월이면 최신 책이다. 1년 동안 썼다고 해도 최신 정보가 들.. 더보기
실체 엔터티의 변경이력 엔터티 설계 원천 엔터티가 실체 엔터티일 때는 변경이력 데이터를 별도의 엔터티에서 관리하도록 설계한다. [그림1] 고객실체 엔터티는 실체인 고객 데이터를 관리하는 실체 엔터티다. [그림1] 만약 고객명 속성이나 전화번호 속성의 변경이력 데이터를 관리할 때, 고객은 실체이기 때문에 아래 모델처럼 별도의 엔터티에서 변경이력 데이터를 관리하도록 설계한다. [그림2] 고객실체 엔터티의 속성 중에서 하나라도 변경되면, 그 시점의 고객실체 엔터티 인스턴스는 고객실체이력 엔터티로 이동한다. 고객실체이력 엔터티는 변경된 과거 데이터이므로 주로 사용되지 않으며, 필요 시에만 참고 용도로 사용하기 위해 보관하는 역할을 한다. 실체 엔터티는 실체에 대한 개별 인스턴스를 관리하는 엔터티다. 실체 엔터티에서 실체의 변경된 데이터까지 관리한.. 더보기
[번역글] 텍스트 분석: 차세대 빅데이터 개인적으론 너무 마케팅에만 치우친 것 같아 텍스트 분석이 그다지 매력적이지는 않은데요.시대의 흐름이고 DQ와도 연관돼 있어 관심을 가질 필요가 있는 거 같습니다.더욱이 모델러는 데이터를 다루는 사람이니 연관 분야입니다. 주로 텍스트 분석의 중요성에 대해서 언급한 기사입니다.특별한 내용은 없지만 참고하세요. 텍스트 분석은 도구를 이해하는 게 중요할 거 같다는 생각이 드네요.DQ 솔루션과 겹치는 부분도 있을 거 같고요. 출처: http://insidebigdata.com/2015/06/05/text-analytics-the-next-generation-of-big-data/ --다니엘 구티에레스. 2015. 6. 15 이 특집 기사에서 Lexalytics의 제프 캐틀린은 텍스트 분석의 사례와 빅데이터의 관심.. 더보기
관계 엔터티 설계 엔터티 간의 관계에서 생기는 관계 속성은 한 엔터티에 여러 개가 있을 수 있으며, 그 관계 속성 중에는 유사한 성격의 속성이 있을 수 있다. 이때 유사한 관계 속성이 두 개 이상이며, 추가될 가능성이 조금이라고 있다면 별도의 관계 엔터티로 설계한다. [그림1] 보험계약 엔터티에는 세 개의 관계 속성이 존재한다. [그림1] 보험을 계약한 고객과 보험의 피보험자 고객, 보험의 연대보증 고객이 누구인지를 관리하는 속성이 관계 속성이다. 따라서 계약고객번호/피보험고객번호/연대보증고객번호 속성은 관계 속성이며, 관계선이 세 개이므로 관계 속성과 마찬가지로 관계 명에도 역할(Role) 이름을 사용한 모델이다. 이미 세 개의 관계 속성이 존재하지만 연대 보증인의 경우에는 여러 명을 관리할 수도 있어서 관계 속성이 더.. 더보기
회사의 기억력? “회사는 기억력이 없다.” 블로그에서 우연히 읽은 문장이다.50이 넘어야 이해되는 말 중 하나란다. 아무 생각 없이 지나쳤지만, 생각하게 만들었다.무슨 의미일까? 회사는 인간이 아니니 당연히 기억력이 없다.기록은 많이 있을 수 있지만 기억력은 없다.아마도 이 문장에서 회사가 의미하는 것은 조직인 회사가 아니라 개인인 사장을 의미하는 것일 게다. 물론 사장은 인간이기 때문에 기억력이 있다.기억력이 없는 게 아니다.다만 기억하고 싶지 않은 것이다. 그럼 왜 기억하기 싫은 것일까?자신과 동일시하는 회사의 이윤 때문일 것이다.기억하고 싶은 것만 기억한다.회사에게, 즉 사장 스스로에게 이윤이 되는 쪽으로 기억한다. 직원의 성과를 기억하는 것은 사장 입장에서는 위험하다.누군가 자신의 성과를 내세워 연봉을 올려달라고.. 더보기
[번역글] 데이터 아키텍트(Data Architect)의 삶 데이터 아키텍트(DA)에 대한 번역글입니다.당연히 미국의 DA 상황인데요.한국의 DA 역할과 매우 유사하다고 생각되는데, 기술 능력은 너무 광범위하네요. 그래도 빅데이터 관련 기술이 눈에 띄입니다.현재 한국에서는 DA에게 빅데이터 관련 지식을 요구하지 않을 거 같지만 앞으로는 그렇게 될 수도 있다는 생각이 듭니다.데이터 아키텍트의 확장판(?)인 빅데이터 아키텍트가 생길 수도 있고요. 원문: http://www.mastersindatascience.org/careers/data-architect/ -- 데이터 아키텍트는 데이터 관리 시스템을 위한 청사진을 만든다. 데이터 아키텍트는 회사의 잠재적인 데이터 소스(내부 및 외부)를 평가한 후 통합하고 중앙 집중화하며, 보호 및 관리하는 계획을 설계한다. 이를 .. 더보기
[번역글] 데이터 과학자(Data Scientist)란? 데이터 과학자에 대해 조금이나마 알 수 있는 글입니다.데이터 모델러와는 완전 다르네요. ㅎ 원문: https://www.sas.com/en_us/insights/analytics/what-is-a-data-scientist.html# -- 데이터 과학자는 복잡한 문제를 해결할 수 있는 기술적 능력을 갖추고 있고, 해결돼야 할 문제를 찾는 호기심이 있는 새로운 유형의 분석 데이터 전문가다. 그들은 수학자이고, 컴퓨터 과학자이자 유행에 민감한 사람이다. 그리고 비즈니스와 IT 세계를 아우르고 있기 때문에 수요가 많고 급여가 높다. 누가 데이터 과학자가 되고 싶지 않겠는가? 그들은 시대의 상징과 같다. 데이터 과학자들은 10년 전에 많은 관심을 끌지 못했지만, 갑작스런 인기는 기업이 현재 빅데이터에 대해 어떻.. 더보기
모델러가 모델링을 하는 목적은 좋은 모델을 만들기 위함이어야 한다 또 다시 새해를 맞았습니다.자꾸 새해가 밀려오네요. 모델링의 가치가 무엇인지는 최근 2~3년 동안 스스로에게 많이 했던 질문입니다. 한참 전에는 모델링이 재미있어서 했습니다.바둑 둘 때나 농구할 때와 같이 모델링을 하면 시간 가는 줄을 몰랐어요.아무리 많은 일을 맡아도 힘들지 않고 재미있게 했습니다.몰두하면 머리도 맑아지고, 재미있는데 돈까지 벌 수 있으니 좋았어요. 그러다 체력이 떨어지고 건강이 나빠지기 시작하니까 모델링이 힘들어지기 시작했어요.여전히 재미는 있었지만, 힘든 상황에서 무엇을 위해 모델링을 해야 하는지를 자주 생각하게 됐습니다. 사설이 걸어졌네요. 결국, 모델링을 하는 목적은 좋은 모델을 만들기 위함이라고 생각합니다.좋은 모델을 간단하게 설명할 수 없지만, 데이터 자체를 있는 그대로설계하.. 더보기