요즘 데이터 과학은 매우 인기가 많은 전문 분야며 데이터 처리, 정보 검색, 머신 러닝, 자연어 처리, 빅데이터, 심층 신경망(deep neural networks), 데이터 시각화와 같이 인공 지능의 넓은 범위를 다루고 있다. 이 책은 현대적이고 스마트한 기술을 이해할 수 있도록 쉽게 따라 할 수 있는 70개 이상의 레시피를 제시한다.
양질의 데이터 과학자에 대한 높은 요구를 고려해, 코어(core) 자바뿐만 아니라 자바로 작성된 고전적인 라이브러리와 함께 최신 데이터 과학용 라이브러리를 사용해 레시피를 작성했다. 우선 데이터 수집과 정제 프로세스부터 시작해 확보된 데이터에 인덱스를 설정하고 검색하는 방법을 알아본다. 그리고 기술 통계(descriptive statistics)와 추론 통계(inferential statistics)를 모두 다루면서 이를 데이터에 적용해볼 것이다. 그 후, 두 장에 걸쳐 스마트 시스템 구축의 기반이 되는 머신 러닝을 다룬다. 현대적인 정보 처리와 자연어 처리 기법도 다룰 것이다. 떠오르는 분야인 빅데이터의 몇 가지 측면을 함께 다루며, 심층 신경망을 이용한 딥러닝의 기초도 다룬다. 마지막으로 시각적 도구 또는 그래프를 사용해 데이터를 표현하고 데이터로부터 정보를 얻는 방법도 학습할 것이다.
이 책은 데이터 과학에 관심을 가진 모두를 대상으로 하며, 데이터를 더 잘 이해하기 위해 자바를 이용해 데이터 과학을 응용해보는 것을 목적으로 한다.