그림으로 배우는 데이터 과학
히사노 료헤이.키와키 타이치 지음, 김성훈 옮김 / 영진.com(영진닷컴) / 2019년 5월
평점 :
장바구니담기


데이터 과학자란 컴퓨팅 기술을 활용해 데이터 수집 및 처리, 통계학이나 머신러닝으로 분석, 의사 결정과 상품 개발까지 이어지는 일련의 흐름을 효과적으로 처리하는 기술을 가진 사람을 말한다. 데이터 과학자에게 필요한 지식과 기술은 수학, 알고리즘, 하드웨어 지식, 소프트웨어 지식, 통계학, 머신러닝, 비지니스, 과제 응용력 등 다양한 분야에 걸쳐 있다.


데이터 과학은 먼저 무엇을 할 것인지 가설을 수립하고 데이터를 수집한다. 그리고 필요한 지식과 요소 기술을 조합해 데이터 분석을 한다. 피드백 정보를 바탕으로 개선하며 원하는 결과가 나올 때까지 PDCA주기를 반복한다. 데이터를 수집하는 방법에는 크게 세 가지로 나눌 수 있는데 1) 공개 데이터, 2) 오픈 API, 3) 웹 콘텐츠(웹 크롤링 또는 웹 스크레이핑)가 있다.


댓글(0) 먼댓글(0) 좋아요(10)
좋아요
북마크하기찜하기 thankstoThanksTo