판다스로 쉽게 배우는 데이터 분석과 시각화
조승근 지음 / 광문각출판미디어 / 2024년 2월
평점 :
장바구니담기


 







석사 박사 논문을 쓸 때, 공공데이터 포털 자료, 통계청자료를 사용한다. 기후예측, 날씨예측 뿐만 아니라, 사회적 지표, 사회적 통계도 마찬가지다. 유투브에 올릴 통계데이터 자료들도 인터넷에 있는 데이터 공유 사이트를 주로 이용하고 있다. 책 『판다스로 쉽게 배우는 데이터 분석과 시각화』에서 공공 데이터 포털, 기상청 기상자료 개방포털, e-나라지표, 통계청, 국가 통계 포털, 서울시 열린데이터광장, 부산시 공공데이터 포털, 경남빅데이터 허브플랫폼, 경상북도 공공데이터 &통계 링크가 추가되어 있어서 참고해 보았다.

이렇게 인터넷에 있는 정제된 데이터를 목적에 맞게 사용하기 위해서는 데이터 분석 작업과 데이터 변환, 데이터 추출 작업이 필요하다.csv 파일 형태로 나와있는 경우가 많기 때문에,그 데이터를 파이썬 프로그램을 활용하여, 고쳐 나갈 수 있다.pdf 파일로 되어 있는 통계데이터도, 변환작업을 통해 데이터 추출이 가능하다. 물론 이 책에서 파이썬 설치 방법 파이썬 개발도구(주피터 노트북) 이 나와 있기 때문에 참고하면 된다.

결국에 데이터 가공에 대한 이해가 요구된다. 수학에서 주로 다루었던, 벡터, 행렬, 배열,정렬 기법을 통해서, 파이썬 내장 함수와 라이브러리에 대한 정확한 사용법을 익힌다며, 파이썬 프로그램의 핵심 목적을 이해할 수 있으며, 판다스(Pandas)가 어떻게 사용되는지 알게 된다.

나의 일상이나 가계부도 타인에겐 큰 의미가 되지 않지만, 파이썬 프로그램으로 데이터 추출,데이터 분석이 가능하며, 가계부 안에 적어 놓은 데이터로, 물가 동향만 보더라도, 해마다 물가가 어떻게 올라갔는지 추이를 알수 있다. 여기서 데이터 분석과 추출 이외에 데이터 시각화가 나오는데, 내가 만든 데이터가, 누구나 이해할 수 있도록, 도형이나, 차트의 형태로 변환하는 과정이 필요하다.예를들어서, 광복 이후 지금까지 대한민국 각 시도의 인구 변화를 유투브로 제작하고자 한다면,책『판다스로 쉽게 배우는 데이터 분석과 시각화』을 실전에 적용할 수 있는지 정확하게 파악하고, 이해할 수 있다.데이터 분석을 통해, 사회적 문제를 파악하고, 정책을 수립할 수 있다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo