실무자를 위한 파이썬 100제
오승환 지음 / 정보문화사 / 2020년 2월
평점 :
장바구니담기


 

 

요즘 재밌는 거 하나가 그동안 안 읽어본 분야의 책 읽기, 오래된 영화보기, 그리고 안해본 일 하기다.

이번에는 파이썬에 관심이 생겨서 도전해봤다.

곧 있으면 빅데이터 스터디로 R과 파이썬을 배울 예정이라서 이번 <실무자를 위한 파이썬 100제> 책이 많은 도움이 될 것 같다.

사실 처음에는 파이썬이 뭔지도 몰랐고 내가 관심있던 것은 크롤링! 크롤링이었다.

국어사전에 따르면 "소프트웨어 따위가 웹을 돌아다니며 유용한 정보를 찾아 특정 데이터베이스로 수집해 오는 작업. 또는 그러한 기술." 이라는데... 쉽게 말하자면 웹서핑을 하다가 쓱쓱 내가 필요한 자료를 모으는 것이다.

이게 말이 모은다는거지 그 양과 질, 그리고 일자별 데이터가 엄청나게 방대해서 그동안은 은근 사람이 수작업해야 하는 일이 참 많았다.

하지만 이런 기술이 있다니?

빅데이터 시대에 처음 알게된 센세이션이었다.

오승환 저자님도 나와 비슷한 생각을 가지고 계셨던 것 같다.

-파이썬 기초 문법을 익히고 나서 처음 관심을 가졌던 분야는 웹 크롤링(스크래핑)이었다. 우리가 매일 사용하는 구글, 네이버 등 검색엔진은 기본적으로 웹 크롤링을 통해 웹 페이지 정보를 수집하고 색인으로 정리해주는 서비스이다. 부동산, 주식, 환율 등 투자 관련 데이터를 웹 크롤링으로 수집하면서 파이썬의 편리함을 크게 느꼈다. 금융감독원 전자공시시스템에서 기업공시자료를 다운로드하고, 구글 검색 트렌드를 분석하는 방법 등 다양한 API 활용 방법에도 파이썬을 이용했다.

-이후 데이터를 수집하고 정리하는 데 필수적인 판다스(pandas), 데이터 시각화에 사용되는 맷플롯립(matplotlib), 통계처리 및 머신러닝을 지원하는 사이킷런(sklearn) 등 파이썬 라이브러리를 하나씩 찾아 공부하면서 데이터 분석과 머신러닝 분야로 응용 범위를 넓힐 수 있었다.

요즘 가장 핫한 분야 맞는 것 같다. 빅데이터, 머신러닝, 그리고 파이썬, R 등 알면 알수록 써먹을 곳이 정말 많다.

나도 크롤링을 시작해서 분야를 넓혀보면 좋겠다는 생각이 든다.

part 1. 웹 스크래핑

회사 실무를 하다 보면 웹 서핑을 통해 자료를 수집하는 일이 많고, 정기적으로 같은 웹에 방문해서 자료를 확인하는 경우도 있을 것이다. 어떤 업무를 자동화하는 방법으로 웹 스크래핑을 소개한다.

part 2. 데이터 정리 및 그래프 시각화

판다스를 중심으로 데이터를 2차원 구조로 정리하고, 다양한 그래프로 표현하는 여러 라이브러리를 차례로 소개한다.

part 3. 다양한 API 활용

구글 검색 트렌드 API로 시작하여 기업의 공시 자료를 제공하는 전자공시시스템, 구글 지오코딩 API를 이용하는 방법을 설명한다. 자연스럽게 API를 이용하여 정보를 얻고 활용하는 방법에 익숙해지는 것을 목표로 한다.

part 4. 오피스 업무 자동화

워드, 엑셀, PDF 문서를 다루는 여러 라이브러리, 이메일을 대량 발송하거나 받은 메일함에서 특정한 조건의 메일을 삭제하는 방법 등 이메일을 관리하는 여러 방법들을 설명한다.

part 5. 애플리케이션 활용 및 개발

간단한 애플리케이션을 직접 만들어 보는 것을 목표로 텔레그램 메신저를 이용하여 메시지를 보내거나 받는 과정을 프로그램으로 만들어 본다. 데이터베이스를 직접 구현하고 간단한 웹 페이지를 만들어 웹 호스팅 업체에 배포하는 과정을 다룬다.

이 책은 아래와 같이 크게 4개의 파트로 구성되어 있는데,

가장 관심을 끄는 웹 스크래핑부터 데이터 정리, 워드, 엑셀, pdf 등 오피스 업무 자동화, 나중에는 심화 과정으로 어플 활용 및 개발까지

이 책 한 권으로 100제를 다루면서 파이썬에 대해 알아갈 수 있다.

파이썬 자습서라고나 할까!

네이버/구글에 "파이썬"만 쳐봐도 연관검색어에 "파이썬 독학", "파이썬 강좌", "파이썬 기초" 등 파이썬 교육에 대한 갈증들이 느껴진다.

일단 이 책으로 시작해서 스터디도 해보고 유튜브나 인강도 들어보고 하면서 나의 케파를 넓혀야겠다.

먼저, <실무자를 위한 파이썬 100제>의 준비물은 바로 파이썬!

파이썬의 장점 중 하나가 바로 무료라는 점이다!

아래 링크에서 "Downloads"에 마우스를 가져다대면 3.8.2 버전을 무료로 다운로드해서 설치할 수 있다.

설치해서 책의 100제를 차례차례 따라해보면 되겠다.

*파이썬 사이트 > https://www.python.org

 

 

 

 

-구글 검색 트렌드 분석하기

내가 원하는 검색어와 일자를 넣어서 트렌드 그래프를 비교해볼 수 있는 아주 유용한 활용법!

나처럼 파이썬을 사용하지 않던 사람들에게는 "네이버 트랜드랩"과 아주 유사한 기술이다.

*네이버 데이터랩 > https://datalab.naver.com

 

 

*네이버 데이터랩으로 본 검색어 트렌드 data

apple iphone, 애플아이폰 / samsung galaxy, 삼성갤럭시

(기간은 2016~2020 현재)

 

얼추 비슷하게 나오는 것 같다.

그동안 트렌드 추이를 더 확인하고 싶었던 나에게 파이썬을 활용한 구글 검색 트렌드 분석은 진짜 많이 써먹을 것 같다.

역시 아는 만큼 보인다!

*구글 트렌드 > https://trends.google.co.kr

 

네이버만 이런 서비스를 제공하는 건 아니다.

아는 사람은 안다는, 구글 트렌드도 있다. 아마 전세계적으로 가장 많이 사용하는 검색엔진인 만큼 유용한 자료다.

*구글 트렌드로 검색해본

apple iphone / samsung galaxy

 

오! 책에서 본 예제와 역시 같다!

파이썬을 활용하면 내가 원하는 자료와 기간만 쏙쏙 취합할 수 있어서 좋고

시간, 지역, 검색어, 추천, 로컬 그리고 주가 분석까지 다 할 수 있다니

스텝 바이 스텝으로 따라해봐야겠다.

알면 알수록 활용도가 높은 파이썬.

그리고 주변에 전공자나 일로 하는 사람들도 꽤 있어서 계속 관심을 가져봐야겠다.

얼마나 활용하느냐에 따라 더 좋은 마케터, 트렌디세터, 실무자가 될 수 있을 듯하다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo