혼자 공부하는 데이터 분석 with 파이썬 - 1:1 과외하듯 배우는 데이터 분석 자습서 혼자 공부하는 시리즈
박해선 지음 / 한빛미디어 / 2023년 1월
평점 :
장바구니담기


초보자가 처음 데이터 분석을  할때 필요한 것들을 담은 책이다. 데이터 분석을 하기 위해서는 기본적인 파이썬을 알아야하는데. 실제 데이터를 가지고 파이썬으로 어떻게 분석을 해야하는지 차근차근 알려주는 책이다. 파이썬을 처음 접하거나 데이터 분석에 대해서 모르는 사람들도 데이터 분석에 대한 기초를 다질 수 있도록 해주는 책이다. 

크게 4가지 영역으로 나뉘는데 첫번째로 데이터 분석이 무엇인지, 데이터 분석을 위해서 필요한 도구가 무엇인지를 알려주고 있고 두번째로는 데이터를 수집하는 다양한 방법을 실제 웹사이트를 크롤링하거나 api를 이용해서 데이터를 모으는 방법을 알려준다. 세번째로는 데이터를 정제하는 방법, 네번째로는 데이터를 요약하고 이를 시각화하는 방법, 다섯번째는 데이터를 더 좋게 보여주는 방법과 데이터를 검증 및 예측하는 방법을 알려주고 있다. 이렇듯 일련의 흐름을 통해서 기본적인 데이터 분석 방법을 알려주는 책이다. 










본문은 아래와 같이 서술되어 있다. 이론적인 것을 설명해주고 이를 코드로 구현한 것을 제시하고 그 결과도 알려주고 있다. 그리고 코드를 작성하는데 필요한 팁은 여기서잠깐을 통해서 알려주고 있다. 



파이썬에 대해서 고급 기능을 알려주기 위해서 좀 더 알아보기 코너를 통해서 더 많은 기능을 친절하게 알려주고 있다. 



각 장이 끝나면 마무리를 통해 핵심 키워드 및 핵심 내용을 요약해주어 리마인드를 하게 해준다. 



각 장에는 확인문제를 제공하여 이장에서 내가 학습한 것을 잘 알고있는지 테스트를 해볼 수 있다. 


이렇듯 이책은 데이터 분석을 처음 하는 초보자들을 위해서 씌여진 책으로 짜임새 있게 순서대로 이책으로 학습하면 기본적인 데이터 분석 실력을 갖출 수 있도록 친절하게 안내를 해주는 책이다. 데이터 분석을 처음 으로 하는 초보자들에게 정말로 따라하기 쉽게 되어 있어 어렵지 않게 공부를 할 수 있을 것이고 특히 다른 기본서들과 달리 모은 데이터로 데이터를 예측해 볼 수 있는 머신러닝 부분도 들어가 있어 짜임새 있게 구성되어 있다. 

데이터분석을 처음 해보는 모든 분들에게 추천한다.



댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
예제로 배우는 파이썬 머신러닝 - 텐서플로 2, 파이토치, 사이킷런으로 만들면서 배우는 다양한 인공지능 시스템, 제3판 제이펍의 인공지능 시리즈 (I♥A.I.) 40
위시 (헤이든) 류 지음, 구정회 옮김 / 제이펍 / 2022년 8월
평점 :
장바구니담기


다양한 머신러닝 모델을 다양한 예제를 통해서 배울 수 있는 책이다. 수많은 머신러닝 관련된 책들이 나와 있으나

이책의 장점은 예제수준이 실제 실무에 사용할 수 있을 정도로 난이도 가 있는 예제를 사용하고 있다. 영화 추천 엔진 구축, 얼굴 인식, 온라인 광고 클릭률 예측, 테라바이틑 규모의 클릭 로그 예측, 20개 뉴스그룹 데이터세 분석 등의 실전에서 사용할 만한 예제들로 머신러닝 모델을 적용하고 있다. 그리고 머신러닝을 할때 대규모 데이터를 이용하여 학습하는 경우가 많은데 이럴때 대규모 데이터를 처리하는 것이 상당히 어려울 수 있다. 이책은 이러한 대규모 데이터 처리를 위한 아파치 스파크를 활용하는 것을 보여주고 있다. 이 부분이 다른 책들과는 차별화된 좋은 점이다. 스파크 설치 및 이를 활용하여 머신러닝을 구축하고 테스트 하는 과정을 상세히 보여주고 있다. 

또한 머신러닝 모범사례라는 장을 통해서 머신러닝 솔루션 워크 플로우를 제시하여 머신러닝을 구현하는 일련의 절차를 알려주고 있고 각 단계별 모범 사례를 제시하여 머신러닝 모델 구축 시 어떤 점에서 주의해야하고 머신러닝 모델의 예측력을 높이기 위한 좋은 팁을 알려주고 있다. 



총 14장으로 구성되어 있다. 






각 장은 머신러닝에 대한 기본적인 개념을 그림과 수식을 통해서 서술하고 있고 이를 파이썬 코드로 구현하는 것을 하나하나 자세히 보여주고 있어서 초보자들도 따라하기 쉽게 되어 있다. 다만 코드에 대한 자세한 설명이 약간 부족하므로 파이썬 문법에 대한 지식이 어느정도 있어야 한다. 그리고 jupyter 노트북이나 vscode를 통해서 코드를 작성한 것이 아니고 파이썬 인터프리터로 코드를 작성하고 있어 가독성이나 생산성이 약간 떨어질 수 있다. 

jupyter 노트북이나 vscode와 같은 툴을 통해서 코드를 작성하는 것이 디버그할때도 좋으므로 이를 활용하여 코드를 작성했으면 하는 아쉬움이 있다. 그러나 그 이외에는 실무에서 사용할 만한 예제를 가지고 직접 코드를 작성한 것이이서 도움이 될 만한 내용이 많아 언제든 활용할 수 있는 책이다. 














댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
모두를 위한 클라우드 컴퓨팅 - HTC 개념부터 가상화, 컨테이너, CI/CD, AWS 프로그래밍까지 I♥Cloud (아이러브클라우드) 25
노서영 지음 / 제이펍 / 2022년 8월
평점 :
장바구니담기


클라우드 컴퓨팅을 위한 바이블인 책이다. HTC, 가상화, AWS, CPU, 메모리, I/O 가상화, 가상머신, 오픈 스택, 컨테이너 기술, 도커, CI/CD 구성까지...... 클라우드 컴퓨팅을 위한 거의 모든 기술을 알려주고 있다. 클라우드 컴퓨팅을 공부하기 위한 모든 내용이 담겨 있다. 클라우드 컴퓨팅의 개념부터 가상머신, 가상화, 컨테이너 같은 기반 기술이 서술되어 있고,  클라우드 컴퓨팅을 활용한 CI/CD, 데이터 센터의 응용도 알려주고 있다. 이책이 정말 좋은 점은 클라우드 컴퓨팅을 실습하기 위해서는 여러 대의 컴퓨터가 필요해서 실제로 실습을 위한 환경을 구축하는 것이 개인적으로는 매우 어렵다. 그러나 이책은 버추얼박스라는 툴을 이용하여 단 한대의 컴퓨터에서 모든 실습이 가능하도록 구성한 점이다. 

가상 머신을 네트워크로 연결하여 가상 클러스터 시스템을 구축하는 방법, KVM과 같은 하이퍼아비저를 이용한 가상머신 생성과 라이브 마이그레이션 방법, 오픈 스택 같은 가상머신 관리 툴과 자동화를 다루고 있고, 리눅스 컨테이너 실습을 통해 컨테이너의 핵심 개념을 익혀 도커에 대한 이해를 높일 수 있고 도커도 실습이 가능하다. 


목차는 다음과 같다. 총 7개의 파트로 되어 있고, 19장으로 구성되어 있다. 














위와 같이 방대한 내용이 각 파트별로 각 장별로 체계적으로 구성되어 있다. 

각 장은 이해하기 쉽게 서술되어 있고, 어려운 개념에 대해서 그림으로 쉽게 이해할 수 있게 되어 있다. 그리고 실제 클라우드를 구성하기 위한 각종 명령어들도 실제 코드를 보여줌으로써 사용자가 쉽게 따라할 수 있게 되어 있다. 







또한 각장 마다 연습문제를 두어서 학습한 내용을 다시 한번 확인할 수 있다.



클라우드 컴퓨팅을 위한 모든 것을 담고 있는 책이다. 즉 클라우드 컴퓨팅의 바이블과 같은 책이다. 클라우드 컴퓨팅 관련된 책을 많이 봤으나. 이 책처럼 모든 것을 담고 있는 책은 거의 없었다. 그리고 단순히 많은 내용만 담고 있는 것이아니라. 그 원리와 실제 실습을 할 수있도록 구성 한 점이 매우 큰 장점이다. 대학교 교재로도 손색이 없을 뿐만 아니라 실제 클라우드 컴퓨팅을 업무에 적용하고 있는 사람들에게도 매우 큰 도움이 되는 책이다. 

클라우드 컴퓨팅을 제대로 배우고 싶은 모든 사람들은 꼭 옆에 두고 참고를 해야만 하는 바이블 과도 같은 책으로  이런 좋은 책이 발간 된 것에 대해서 매우 기쁘게 생각한다. 







댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
Do it! SQL 입문 - 비전공자도 개발자도 쉽게 배우는 기초 문법 + 실용 예제 Do it! 시리즈
강성욱 지음 / 이지스퍼블리싱 / 2022년 7월
평점 :
장바구니담기


데이터가 모든 것을 지배하는 세상이 오고 있다. 데이터를 모르고서는 새로운 서비스를 기획하는데도 어려움을 겪는 경우가 많아지고, 컴퓨터 공학을 전공하지 않았을 지라도 기본적인 데이터를 직접 뽑아 업무에 활용할 수 있는 능력이 있다면 그만큼 자신의 경쟁력이 올라갈 수 있을 것이다. 전공자가 아니어도 데이터를 직접 다루고 싶어하는 비전공자들이 매우 쉽게 데이터를 다루는데 가장 중요한 데이터베이스 조작 언어인 SQL을 쉽게 배울 수 있는 가장 좋은 길을 안내해주는 매우 친절한 안내서이다. 






이책은 아래와 같이 각 주차별로 공부할 내용을 알려주어 손쉽게 공부계획을 세울 수 있다. 


각  본문내용은 아래와 같이 처음 보는 사람도 쉽게 그림과 같이 서술 되어 있고 알아 두면 좋아요라는 코너를 두어서 중요한 부분은 더 서술해 주고 있다. 




select 문의 기본 형식은 다음 처럼 구문을 상세히 설명해준다. 


또한 알아두면 좋아요 코너를 통해서 프로그래밍을 하는데 꼭 필요한 내용을 알려주고 있다. 



특히 SQL 문을 앞에서 잘 학습하고 난 후 다른 기본 책들과는 달리 실전에 적용 할 수 있는  SQL실제로 데이터를 분석하는 사례를 아래와 같이 제시해 주고 있어서  실전 적용하는 데 매우 큰 도움이 된다. 





또한 아래와 같이 국가 통계 데이터를 가지고 직접 실무에서 사용할 만한 SQL 실전 사례를 제시하여 큰 도움이 

된다. 


이와 같이 이 책은 기본적인 SQL 을 파악하게 해주는 것 뿐만 아니라 위와 같이 실무에  적용할 수 있는 

주가데이터, 인구데이터 등 실제 사례를 가지고 여러가지 분석을 할 수 있는 쿼리를 제공하고 있어 다른 기본책

과는 다른 차별점이 크다. SQL 을 잘 모르는 비전공자도 빠른 시일내에 기본적 분석을 할 수 있도록 해주는 친절한 안내서이다. 적극 추천한다. 




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
좋은 코드, 나쁜 코드 - 프로그래머의 코드 품질 개선법, 2023년 세종도서 학술부문 추천도서
톰 롱 지음, 차건회 옮김 / 제이펍 / 2022년 5월
평점 :
장바구니담기



이 책은 어느정도 프로그래밍을 해본 사람들이 실력을 업그레이드 할때 필요한 책이다. 대부분의 개발자들은 혼자서 일하지 않고 여러 개발자들고 협업을 이루면서 일을 할 것이다.  이럴때 코드를 작성할 때 나만 알아 볼 수 있게 작성을 한다면 같이 일을 하는 모든 사람들이 매우 힘들어 지고 프로젝트도 기한 내에 완성이 되지 않을 수도 있다. 이렇듯 코드를 작성할 때 남들도 쉽게 이해가 갈 수 있도록 작성을 해야한다. 


이 책은 이러한 읽기 쉽고, 기억하기 쉽고, 적용하기 쉬운 코드를 어떻게 작성을 하는 지를 실제 코드를 예시로 들면서 친절하게 알려주고 있다. 



위의 목차에 나와있듯이 실제 개발에 필요한 각종 유익한 정보가 가득하다. 일관된 코딩 스타일을 고수하는 방법에 대해서 알려주고 있고. 깊이 중첩된 코드는 무조건 피하고 이를 해결하기 위한 방법도 제시하고 있다. 





또한 위와 같이 각 항목에 대해서 어떤 식으로 코드를 작성해야 하는지 예시코드를 제시하여 참고하기 좋게 서술 되어 있다. 




또한 아래와 같이 구조도를 그려서 이해하기 쉽게 제시를 해주고 있어서 다른 책들보다 가독성이 매우 좋다. 




또한 좋은 코드를 작성하기 위해서 코드를 변경하는 부분을 예전 것과 비교해서 어떤 부분을 수정해야하는지를 알려주고있다. 아래의 예시를 보면 비검사 예외를 사용  할때의 코드 변경과 감사 예외를 사용할 때의 코드 변경에서 서로 다르게 코드를 작성해야하는 부분을 제시해주고  있고 비교 분석이 가능하다. 



즉 이 책은 고급 개발자로 나아가기 위한 아주 중요한 내용을 듬뿍 담고 있는 핵심 참고서 이다. 지루하지 않고 완전 기초적인 내용도 아닌 고급 개발에 필요한 내용들을 많이 담고 있어서 큰 도움이 된다. 좋은 코드를 작성하는 방법을 알려주고 나쁜 코드를 피하는 방법도 제시해주고 있고 단순히 코드를 깔끔하게 작성하는 방법 뿐만 아니라 유지보수가 쉽도록 코드를 구성하는 방법도 알려주는 책이다.


고급 개발자가 되기 위해서는 반드시 읽어봐야하는 필독서이다. 적극 추천한다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo