-
-
파이썬 데이터 과학 통계 학습
황보현우.정지현 지음 / 정보문화사 / 2021년 5월
평점 :
제 4차 산업혁명 이후 이슈가 되고 있는 빅데이터는 갑자기 나타난 것은 아니다. 컴퓨터 프로그래밍언어를 쓰다보면 데이터를 다루는 것은 기본 중의 기본이다. 단지 프로그래밍 언어에 따라서, 데이터 처리 방식이 바뀔 수 있고, 그 과정에서 새로운 답을 도출하게 된다. 빅데이터를 이해하기 전에 프로그래밍 언어에서 데이터를 어떻게 처리하는지 아는 것이 우선되어야 한다. 데이터 이전에 변수와 상수, 여기에 조건문과 제어문이 필요하다. 즉 이 책을 읽다보면, 나의 겨우 파이썬 이전에 C/C++,V C+를 배운 적이 있어서 어느 정도 충분히 이해될 수 있었다. 단지 데이터를 다룰 때 주로 언급되는 하나하나 개념들을 정석대로 배워 나가는 것이 매우 중요하며, 파이썬에서 다루는 회귀, 분류, 그룹화, 차원축소를 정확하게 배워나갈 필요성이 있다. 책에서 다루는 회귀는 다중 선형회귀가 대표적으로 등장하고 있다. 즉 회귀란 컴퓨터 용어로 쓰여지지만 , '되돌림'의 의미를 지니고 있다. 즉 데이터를 프로그래밍 언어의 수칙과 룰에 따라 처리를 하는 것, 그 하나하나 정리해 나가는 것은 매우 중요하다.
수집된 데이터는 비정형확된 채 놓여지게 된다. 그 비정형화된 데이터를 변환하고, 분류하고, 그룹화하고 차원축소를 한다는 것은 데이터를 다루는데 있어서 매우 중요한 요소이며, 데이터는 예측이나 어떤 목적에 맞게 처리되는 경우가 많다. 그리고 그 하나하나 프로그래밍을 통해서 정리해 나가는 것이 기본이며, 데이터의 연산 처리 과정에서 ,함수를 적절하고 쓰는 과정이 요구되며 , 다양한 방식의 처리과정에 요구되고 있으며, 반복문이나 IF 문을 통해서, 프로그래밍에 있어서 원하는 과정들을 하나하나 처리할 수 있다. 프로그래밍 언어를 공부할 때, 수학 지식이 반드시 필요한 이유는 여기에 있다. 또한 차원 축소를 진행하지 않는다면, 원하는 예측결과물을 도출할 수 없기 때문에 , 변수와 상수, 인자를 활용하여, 표본을 적절하게 활용하는 것이 매우 중요하다.