도서 리뷰: 실무로 통하는 ML 문제 해결 with 파이썬

nofence 2024. 5. 26. 23:46

세간에는 머신러닝과 관련된 다양한 툴과 도구를 제공하는 생태계가 여럿 조성되어 있지만, 아직까지는 파이썬과 이를 뒷받침하는 풍부한 라이브러리가 여전히 세를 과시하고 있는 중이다. 또한 이와 관련된 도서가 도처에 존재하지만, 레시피 기반의 쿡북 스타일을 지향하는 책은 거의 없는 실정이다. 그런데 파이썬 기반 쿡북 스타일의 머신러닝과 관련된 레시피를 풍부하게 제공하는 도서가 출간되었고, 오늘은 이에 대해 이야기를 하려고 한다. 

본 도서는 수치 데이터를 다루는 데 있어 독보적 라이브러리인 넘파이를 시작으로 내용이 전개된다. 넘파이의 벡터 및 행렬과 관련된 다양한 예제를 통해 기초를 익히고 본격적으로 데이터 분석 최고의 라이브러리인 판다스를 활용한 레시피가 제공된다. 여러 데이터 소스로부터 데이터셋을 적재하기 위한 다양한 사례들을 접하게 되며, 판다스를 활용한 데이터 분석의 여정이 본격적으로 시작된다. 또한 판다스의 가장 기본적인 데이터 타입인 데이터 프레임을 조작하며, 데이터를 능수능란하게 처리할 수 있는 풍부한 도구와 툴을 학습하게 된다. 이윽고 수치형, 범주형 데이터를 다루는 기법을 배우고, 텍스트를 처리하는 다양한 사례를 익히게 된다. 날짜와 시간 타입 데이터에 대한 중요성도 간과할 수 없는데, 이와 관련하여 세부적인 개념과 유용한 테크닉이 제시된다. 한편, 이미지를 다루는 파트에서는 OpenCV 및 파이토치를 통한 이미지 처리와 관련된 흥미로운 경험을 해 볼 수 있었다. 피처 추출 및 피처 선택을 통한 차원 축소와 관련된 레시피를 다루게 되면서 본격적으로 머신러닝에 가까운 발걸음을 내딛게 된다. 모델 평가와 모델 선택을 거쳐 머신러닝에서 다양하게 활용되는 선형 회귀를 위시하여 의사 결정 트리, 랜덤 포레스트, KNN, 로지스틱 회귀, SVM, 나이브 베이즈, 군집 등 주요 머신러닝의 알고리즘과 그와 연관된 개념 및 실전적인 사례 등이 여과 없이 제공된다. 후반부에 접어들면서 파이토치를 세부적으로 다룰 수 있는 기회가 제공되며, 신경망과 관련된 여러 기법들을 배울 수 있게 된다. 끝으로 트레이닝 모델에 대한, 저장에서 서빙 과정에 이르는 일련의 과정을 효율적으로 준비할 수 있는 실질적인 레시피가 제공되면서 책은 마무리 된다. 

풍부한 레시피를 통해 데이터 분석 및 머신러닝, 딥러닝과 관련된 다양한 사례를 접하면서 여러 도구와 툴을 활용하여 문제를 해결하는 기나긴 과정을 흥미롭게 마칠 수 있었다. 이 책의 원서를 읽어 보지는 못했지만, 역자의 번역 작업이 훌륭한 품질을 낳았고 전반적으로 문장과 관련된 문제로 어려움을 겪는 일이 전혀 없었다. 또한 역자께서 부분적으로 내용 이해를 돕기 위해 손수 설명을 곁들이신 것도 개인적으로 참 감사하게 생각한다. 좋은 레시피와 함께, 파이썬 기반의 머신러닝과 관련된 문제 해결 능력을 함양하고자 하는 모든 이들에게 이 책의 일독을 권한다. 

 

P.S 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

반응형