실전 시계열 분석 - 통계와 머신러닝을 활용한 예측 기법
에일린 닐슨 지음, 박찬성 옮김 / 한빛미디어 / 2021년 4월
평점 :
장바구니담기


1장은 고대 그리스부터 현대에 이르기까지 시계열 예측의 역사를 다루고 있습니다. 역사를 통해 앞으로 배울 내용을 예상할수 있고, 이책에서 말하는 전통 학문에 대해서 좀더 이해하는데 도움이 됩니다.


2~5장은 시계열 데이터의 수집, 정리, 시뮬레이션, 저장과 관련된 문제에 대해서 배우게 됩니다. 각 장은 시계열 분석을 실제로 수행하기 전에 필요한 고려 사항들로 서로 강하게 연관되어 있습니다. 실제 데이터 파이프라인과 데이터의 식별, 정리는 시계열 분석가가 수행하는 일의 대부분을 차지 하고 있습니다.


6~10장은 시계열 분석에 사용되는 다양한 모델링 기법을 다룹니다. 6장과 7장에서는 ARIMA 및 베이즈 상태 공간 모델과 같은 표준적인 통계 모델을 다루루는 것으로 시작합니다. 그다음 좀더 최근에 개발된 방법인 머신러닝과 신경망을 시계열 데이터에 적용합니다. 시계열 데이터로 의사결정 트리와 같이 시간을 고려하지 않는 모델을 학습하기 위한 데이터 처리 및 배치에 대해 다룹니다.


11~12장은 시계열 모델링을 처음으로 한 다음 해야 하는 정확성에 대한 계량적 분석과 성능상의 고려 사항에 대한 가이드를 제공합니다.


13~15장은 헬스케어, 금융, 정부 데이터의 연구 사례를 다루고 있습니다.


16~17장은 시계열에 대한 최근의 발전과 앞으로의 예측을 다루고 있습니다. 16장은 자동화된 다양한 시계열 패키지를 살펴봅니다. 여기서 다루는 패키지들은 오픈 소스 프로젝트, 학계 거대 기술 회사 등이 개발한 것입니다. 17장은 시계열 분석의 미래를 예상해보는 내용으로, 계속해서 팽창해온 빅데이터 생태계가 시계열 분석에 어떤 도움을 주었는지 그동안 알게 된 사실을 기반으로 설명합니다.


데이터 분석을 위한 코드를 작성하기 전에 각 장을 순차적으로 먼저 읽어 보는걸 추천 합니다. 각 장별로 소개하는새로운 개념을 먼저 학습한 후 실습 코드를 작성하는데 도움이 됩니다. 또한 특정 모델을 실행하는 코드 작성을 대체로 간단하고 쉽기 때문에, 개념을 정확히 이해하는 데 중점을 두고 학습 하면 됩니다. 마지막으로 시계열 데이터와 모델링의 파이프라인 전체를 실용적인 관점에서 폭넓게 배우고 싶다면 이책에서 인사이트를 얻을수 있을겁니다.



 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo