도서 리뷰 : 데이터 품질의 비밀

nofence 2023. 5. 28. 23:34

데이터가 세상을 집어삼키고 있다. 이 말은 허황된 표현이 아니다. 데이터를 통해 비즈니스의 성패가 좌우되고 이는 곧 비즈니스의 핵심이 바로 데이터라는 데 그 누구도 부정할 수 없는 시대를 목도하고 있다. 빅데이터, AI 와 같은 기술이 나날이 발전하고 더욱 고도화되면서 데이터 중요성은 재차 언급하지 않아도 누구나 인정할 수 밖에 없는 현실과 마주하게 된다. 데이터를 잘 다루는 기업과 그렇지 못한 곳은 단순히 성과를 얼마나 낼 수 있느냐에 문제에 직면하게 되는 게 아니라, 존폐의 기로에서 어떠한 운명을 맞이하게 될지 걱정해야 하는 상황이 기다리고 있을지도 모른다. 그만큼 데이터의 중요성을 다시 역설할 수 밖에 없는 데, 문제는 데이터의 품질로 귀결된다. 데이터를 다루는 모든 개인과 조직은 품질 좋은 데이터를 만들기 위해 노력하고, 최종적으로 그 데이터를 통해 가치를 생성한다. 그저 데이터만 잘 다루는 게 아니라, 이제는 데이터 품질에 대해 진지하게 고민하고 논의해야 하는 시점에 다다른 것이다. 오늘 소개하는 책이 바로 데이터 품질에 대해 이야기 하는 도서로서, 데이터 품질의 비밀에 얽힌 다양하며 흥미로운 주제를 만날 수 있었다. 

 

이 책은 데이터 품질이란 과연 무엇이며, 왜 데이터 품질에 주목해야하는지에 대해 언급하며 이야기를 풀어 나간다. 데이터 다운타임, 데이터 옵스, 데이터 메시, 그리고 데이터 웨어하우스와 데이터 레이크, 레이크하우스 등의 개념과 조우하면서 데이터 품질이 화두가 되는 배경에 대해 다양한 사례를 통해 이해하게 된다. 핵심은 비즈니스 목표에 부합하는 의사 결정을 위해 품질 높은 데이터가 요구된다는 것이다. 그렇다. 데이터는 비즈니스 목표를 달성할 수 있도록 가공되어야 하며, 이를 통해 데이터 업타임이 오랫동안 유지돼야 한다. 

 

이윽고 운영 데이터와 분석 데이터, 데이터 웨어하우스와 데이터 레이크 등의 차이에 대한 담론을 다루며 데이터 품질에 대한 세부적인 논의가 시작된다. 데이터 수집, 정제, 변환, 테스트에 이르는 파이프라인 각각의 여정과 모니터링 및 보다 신뢰성 높은 아키텍처를 위한 측정 그리고 데이터 품질 문제 해결을 위한 구체적이고 실용적인 방안 등을 통해 데이터 품질을 위한 다양한 이론과 지식을 습득하게 된다. 

데이터 품질 민주화 챕터에서 데이터를 프로적트로 취급하는 시각이 참 독특하고 인상적이었는데, 프러덕트화된 데이터가 갖추고 있는 특성과 가치를 통해 데이터 품질에 어떻게 이바지하고 보다 효율적으로 소기의 목적을 달성하게 되는지에 대해 학습하게 된다. 

책의 후반부에서는 데이터 품질에 관한 전문가 대담을 통해 데이터 메시 등을 더욱 심층적으로 다루며, 데이터 메시의 중요성을 다시 한 번 설파하고 있다. 데이터 메시가 앞으로 어떻게 더 확산되고 진화하며 발전할지 자못 기대가 되는 지점이다. 끝으로 저자는 데이터 품질을 위한 미래에 대해 이야기하며 보다 나은 데이터 품질을 위해 어떻게 움직여야 할지에 대해 언명한다. 

 

바야흐로 데이터 품질을 다시금 평가하고 논하는 시대에 접어들었다. 이제 더이상 예전의 그저 그런 데이터를 만들기 위해 시간과 인력, 비용을 쓸모없이 허비할 게 아니라면, 고품질 데이터를 통해 가치를 만들고 비즈니스 목표에 도움되고자 한다면 이 책과 함께 시작해 보는 게 어떨까? 데이터 품질의 비밀을 푸는 열쇠가 당신 손에 쥐어질 것이다. 

 

P.S 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

반응형