판다스 인 액션 - 인기 영화, 스포츠, 만화 데이터로 익히는 판다스 라이브러리 / 코딩 챌린지(연습 문제 + 해법), 특별 부록 제공
보리스 패스캐버 지음, 시진 옮김 / 한빛미디어 / 2022년 9월
평점 :
장바구니담기



판다스는 파이썬을 이용한 데이터 분석과 같은 작업에서 필수 라이브러리로 알려져 있는데요. 라이브러리는 특정 분야의 문제를 해결하기 위한 코드 모임입니다. 판다스는 정렬, 필터링, 정리, 중복 제거, 집계, 피벗 등의 데이터 조작 작업을 위한 도구 모음입니다.

 


판다스는 마이크로소프트의 엑셀 스프레드시트 소프트웨어와 구글의 브라우저 스프레드시트 애플리케이션과 비슷합니다. 판다스가 특별한 이유는 바로 처리 능력과 사용자 생산성 사이의 균형이 좋기 때문인데요. 판다스는 밀리초 내에 백만 행의 데이터셋을 효율적으로 변환할 있고, 동시에 간단하고 직관적인 명령 집합을 제공하고 있습니다.

 

이번에 소개할 판다스 액션은 판다스의 기능을 상세하게 소개하고 다양한 데이터셋을 처리하는 방법을 안내합니다 책은 참고 자료 활용할 있도록 장을 자체 데이터셋이 있는 독립적인 튜토리얼과 같이 작성되어 있는데요.

 


판다스 액션의 가장 장점은 장에서 공부한 개념을 연습할 있도록 마지막 부분에 코딩 챌린지로 연습문제와 해답, 장의 핵심 요약까지 완벽하게 코딩 연습과 정리까지 습니다.

 

또한, 판다스 액션은 크게 2 나눠 14 장으로 구성되어 있습니다1부는 판다스의 기본기를 다지기입니다. 판다스이 핵심 메커니즘과 가지 기본 자료구조인 1차원 Series 2차원 DataFrame 공부합니다.


1장에서는 판다스를 사용해 데이터를 분석하면 라이브러리로 무엇을 있는지 직관적으로 확인하고 라이브러리가 무엇을 있는지 전체적인 그림을 그려 있도록 개요 제공합니다.

 

2장과 3장에서는 Series 심층적으로 탐구하며, Series 처음부터 만드는 방법과 외부 데이터 셋을 가져오는 방법, 수학적, 통계적, 논리적 연산을 적용하는 방법을 살펴봅니다.

 


4장은 2차원 데이터 테이블인 DateFrame 소개하며, 이전 장에서 배운 개념을 새로운 자료구조에 적용하고 데이터를 조작하는 추가 방법을 소개합니다.

 

기본기 다지기 마지막인 5장에서는 논리적 기준 같음, 같지 않음, 비교, 포함, 포함, 제외 다양한 논리 조건을 사용해 DateFrame에서 행의 하위 집합을 필터링하는 방법을 소개합니다.

 

1부를 통해 박스오피스 매출부터 NBA 선수와 포켓몬스터에 이르기까지 다양한 주제를 다루는 8개의 데이터셋을 만나 있습니다. 판다스 라이브러리를 효율적으로 사용하기 위해 알아야 하는 기본적인 판다스 내용을 담고 있습니다.

 


2부는 판다스 응용하기입니다. 1부에서 Series DataFrame 다루는 것에 익숙해집니다. 이를 기반으로 6장에서는 공백이 있거나 대소문자를 규칙 없이 사용하는 제거, 대소문자 수정, 단일 열에서 여러 추출과 같은 문제를 해결하는 방법을 논의합니다.

 

7장은 강력한 MultiIndex 사용해 계층적 데이터를 저장하고 추출하는 방법을 살펴봅니다.

8장과 9장은 DataFrame 피벗하고 데이터를 버킷으로 그룹화하거나 데이터를 요약하는 데이터 집계 방법을 중점으로 다룹니다.

 

10장에서는 다양한 조인을 사용해 여러 데이터셋을 단일 데이터셋으로 결합하는 방법을 담고 있습니다11장은 텍스트 외에 날짜와 시간을 다루는 방법인 날짜 정렬, 기간 계산 등에 대한 주제를 다룹니다.

 


12장에서는 판다스로 데이터셋을 가져오고 내보내는 방법을 알아봅니다.

13장은 라이브러리의 구성 설정을 조정하는 방법을 설명하고 마지막인 14장은 DataFrame에서 시각화인 꺾은 선형 차트, 막대그래프, 파이 차트 등을 만드는 방법을 소개합니다.

 

2 응용하기에서는 아기 이름, 아침 시리얼, 포춘 1000 기업부터 노벨상 수상까지 다양한 주제를 담은 30 이상의 데이터셋에 판다스를 적용합니다.

 

장의 내용은 이전 장의 내용을 바탕으로 별로 진행되고 있는데요. 판다스를 처음 공부하는 사람이라면 목차 순서대로 공부하는 것을 추천합니다. 혹은 가장 관심 있는 주제를 위조로 살펴보는 것도 가능합니다. 장마다 시작 부분에서 해당 장의 실습 코드를 처음부터 작성하기 때문에 주제별로 개념을 익힐 있습니다.

 


판다스 액션은 파이썬 프로그래밍 언어를 기반으로 만들어졌으며 파이썬 경험이 부족한 독자들을 위해 부록 B 파이썬 대한 알찬 내용을 소개하고 하고 있습니다. 특별 부록인 개발 환경 구축 가이드, 파이썬 속성과정, 넘파이 속성 과정, 정규 표현식 판다스를 배우는 과정에서 필요한 정보들을 얻을 있습니다.

 

마블, 디즈니 재미있고 현실감 있는 데이터들로 흥미로운 실습 하면서 판다스 개념을 공부하고 싶은 사람들에게 추천합니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
SQL로 시작하는 데이터 분석 - 실무에 꼭 필요한 분석 기법 총정리! 실전 데이터셋으로 배우는 시계열, 코호트, 텍스트 분석
캐시 타니무라 지음, 박상근 옮김 / 한빛미디어 / 2022년 8월
평점 :
장바구니담기



데이터 분석은 기업을 비롯한 여러 조직에 다양하게 활용하고 있을 정도로 관심이 많은 분야인데요. 데이터베이스는 전보다 빠르고 데이터의 의미를 표현하기 위한 분석 도구와 시각화 도구는 이전보다 강력해집니다. 


데이터 분석을 시작하면 데이터를 수집하고 행동 패턴을 파악하기 위한 분석을 합니다. 하지만 제대로 된 경험이 없이 분석을 시작하다 보면 수많은 시행착오를 경험하게 됩니다.


분석한 내용이 틀린 경우도 있고 아무런 인사이트를 도출할 수 없는 결과를 만날 수도 있습니다. 데이터 분석 기법과 관련된 자료는 쉽게 찾을 수도, 정부에서 공개한 공공 데이터나 캐글에서 공개된 데이턴 분석 자료도 볼 수 있습니다. 이러한 자료 같은 경우 자료에 데이터 마이닝 알고리즘, 머신러닝, 수학, 통계 등 내용이 뒤섞여 데이터 분석을 시작한 분들에겐 어려울 수 있는데요.



이번에 소개할 SQL로 시작하는 데이터 분석은 SQL 문법을 공한 사람이 데이터 분석을 실습하기에 좋은 기본 데이터 분석 기법에 대해 상세하게 알려줍니다. 데이터 삽입, 수정, 삭제보다 SELECT문을 활용해 데이터를 원하는 대로 분석합니다. 시계열 분석, 코호트 분석, 텍스트 분석 이상 탐지를 비롯해 간단한 통계를 활용한 실험 분석 및 새로운 데이터 생성 방법까지 실무에 꼭 필요한 분석 기법에 대해 총정리한 저서입니다. 


SQL로 시작하는 데이터 분석 책에 관심 있는 분들이라면 

데이터 분석에 관심을 두고 SQL을 어느 정도 사용할 수 있으신 분, 데이터 분석 경험은 있지만 SQL은 잘 모르신 분, SQL로 사용해봤지만 데이터 분석에 관해서는 잘 모르신 분, 데이터 분석, SQL 둘 다 모르신 분 등 각자의 입장이 다를 거로 생각하는데요.



1장에서는 이러한 경우들을 생각해 기초를 가지고 앞으로 사용할 용어에 대해 정리하는 시간을 가집니다. 우선 데이터 분석이란 무엇인지? SQL이 무엇이며 왜 쓰이는지 다른 분석 도구들과 어떤 차이가 있는지 왜 데이터 분석에 활용하기 좋은지 등에 관해서 이야기합니다.


또한, 필자는 분석을 통해 현재 데이터를 이해하는 일도 중요하지만, 분석을 끌어낸 결과를 잘 활용하는 일까지 매우 중요하고 합니다. 또한 다양한 분석 기법을 설명하는 데 있어서 왜 이런 분석이 필요한지 분석 결과가 무엇을 의미하는지 결과를 새로운 전략에 어떻게 활용하는 방법까지 설명합니다.


2장에서는 데이터 타입 소개부터 데이터 프로파일링, 정제, 셰이핑 등 데이터 준비 과정을 알아볼 수 있습니다.

3장부터 7장까지는 시계열 분석 코호트 분석, 텍스트 분석, 이상 탐지, 실험 분석 등 데이터 분석 활용에 관해 알아봅니다.

8장에서는 다른 도구로 추가 분석을 수행하기 위해 복잡한 데이터셋을 생성하는 방법을 다룹니다.



마지막인 9장에서는 새로운 인사이트를 끌어내기 위해 이 책에서 배운 분석 방법들을 어떻게 활용할지 생각해보고 여러분의 데이터 분석 여정에 도움이 될 만한 참고 자료를 소개합니다.



SQL은 데이터베이스와 대화하기 위한 언어인데요. 그리고 데이터베이스에 저장된 데이터를 다루는 데 많은 강점이 있습니다. 뛰어난 연산 처리 능력을 갖춘 널리 사용되고 필요에 따라 유연하게 사용할 수 있는 데이터 분석 도구입니다. 이처럼 데이터 분석에 SQL을 사용하는 이유는 다양한데요. 이뿐만 아니라 SQL을 사용하는 가장 큰 이유는 전 세계의 수많은 데이터가 이미 데이터베이스에 저장돼 있습니다. 여러분이 속한 조직에서도 최소 하나의 데이터베이스를 사용하고 있을 건데요. 


SQL로 시작하는 데이터 분석 책을 통해 분석한 내용을 기획자나 디자이너와 공유하고 이를 통해 도출한 인사이트가 사용자 경험 향상할 기회가 될 것입니다. 수많은 경험이 필요할 수 있지만 그 전에 데이터 분석에 첫걸음 되길 SQL로 시작하는 데이터 분석 책을 추천합니다.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
한 권으로 끝내는 네트워크 기초 - 클라우드 시대의 네트워크 기초
오키타 토시야 지음, 김성훈 옮김 / 길벗 / 2022년 5월
평점 :
장바구니담기



일상에서 전자기기는 이제 밀접한 관계가 되었는데요. 점점 클라우드 사회로 바뀌면서 우리는 단순히 사용하고 있는 핸드폰, 컴퓨터 네트워크 연결이 당연하게 여겨지고 있습니다. 네트워크 연결에 크게 의식하고 있지 않은데요. 저자는 컴퓨터 단독으로 사용할 있지만, 컴퓨터와 컴퓨터를 네트워크로 연결하면 더욱 다양하고 새로운 가치를 무궁무진하게 만들어 있다고 설명합니다.

 

무한한 발전이 있는 네트워크에 대한 기초를 담고 있는 권으로 끝내는 네트워크 기초 저서를 소개합니다. 책은 네트워크 학습을 시작하거나 네트워크 관련 업무를 수행하고자 필요한 기초 지식을 번에 배울 있는 입문서인데요.

 


권으로 끝내는 네트워크 기초 책은 2부로 나눠 있습니다. 1부에서는 네트워크의 정의부터 네트워크와 웹을 실현하는 기술, 클라우드와 네트워크의 관계를 학습하며 네트워크 기초를 다집니다. 전반적인 네트워크에 대한 기초 개념들과 중간마다 있는 실습으로 네트워크에 대한 개념 원리 확실하게 잡고 있습니다.

 


기본적인 개념적 설명이 텍스트로만 인식되며 지루하거나 다른 개념으로 해석해 오해가 생길 있는데요. 책은 자칫 추상적으로 난해할 있는 네트워크에 대한 개념들을 133 도해와 22개의 표를 보여줌으로 직관적으로 개념을 이해할 있게 도와줍니다.


 

2 네트워크 응용에서는 네트워크 설계와 구축, 운영과 보안, 그리고 네트워크 패턴까지 알찬 내용을 담고 있습니다. 네트워크를 이해하는데 필요한 주요 기술을 배울 있는데요. 또한 네트워크 설계는 시스템이 무엇을 하는 시스템인가?’ 생각하고 나아가 어떤 네트워크가 필요한지 생각할 있는 핵심적인 부분들이 표현되어 있습니다.


 

Column 상자를 통해 저자의 부연 설명을 담고 있습니다. 설명하고 싶은 개념, 실무에 경험

들을 있습니다. 네트워크에 관한 새로운 정보와 함께 현재도 보편적이고 변함없이 지식을 폭넓게 알려줍니다.

 


권으로 끝내는 네트워크 기초를 통해 네트워크의 중요성을 확실히 알아 있었는데요. 컴퓨터를 이용해 여러 가지 일을 편리하게 있는 것은 네트워크 덕분입니다. 우린 인터넷에 접속해 뉴스, 영화, 쇼핑, 공부 다양한 일상을 보내고 있습니다. 이처럼 일상과 산업 전반이 인터넷을 중심으로 전환되면서 네트워크 규모는 방대해지고 중요성도 커지고 있습니다.

 

IT 관련 종사자, 네트워크 기초를 알고 싶은 학생, 네트워크 엔지니어를 목표로 하는 취업 준비생 부담 없이 네트워크 시작하고 싶은 분들에게 추천합니다. 확실하게 네트워크 원리를 배울 기회가 것입니다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
핸즈온 데이터 시각화 - 효과적인 데이터 시각화 전략부터 20가지 시각화 도구 사용법까지
잭 도허티.일리야 일라얀코우 지음, 김태헌 옮김 / 한빛미디어 / 2022년 7월
평점 :
장바구니담기


 

데이터 기반의 빠른 의사결정이 필수인 현대 비즈니스 환경에서는 효과적이고 정확한 데이터 시각화가 갈수록 중요해지는데요. 데이터 시각화의 기본기를 확실하게 익힐 있는 핸즈온 데이터 시각화를 소개합니다.

 

이번 핸즈온 데이터 시각화 책은 파이썬, R 프로그래밍 언어를 통해 데이터 시각화 방법을 표현하는 방식의 학습서가 아닌 코딩 지식 없이도 누구라도 보고 따라 있는 데이터 시각화의 기본적인 개념 원리를 다루고 있습니다. 쉽고 무료로 사용할 있는 온라인 도구를 이용해 각종 차트뿐만 아니라 자리 정보를 전달하는 지도까지 쉽게 따라 하면 있는 핸즈온 예제까지 제공합니다.

 

데이터 시각화의 입문서라고 있는 핸즈온 데이터 시각화는 웹에서 무료로 사용할 있는 간단한 도구로 스토리텔링 하는 방법을 알려주는데요. 간단한 드래그 앤드 드롭으로 사용할 있는 구글 시트, 데이터래퍼, 태블로 퍼블릭을 시작으로 웹사이트를 위한 대화형 차트와 맞춤형 지도를 디자인하는 방법까지 알아 있는 시간입니다.

 

단계적인 튜토리얼, 실전 예제, 온라인 리소스를 통해 깃허브에 있는 Chart.js, 하이차트, 리플릿, 등의 오픈소스 코드 템플릿을 수정하는 방법의 내용까지 담고 있는 매력적인 입문서입니다. 주로 책에서 나오는 예제가 한국을 관련된 내용들은 아니지만, 기본기를 배우기엔 좋은 예제들을 담고 있습니다.


핸즈온 데이터 시각화하는 4부로 구성되어 있는데요. 장마다 핵심 목표는 데이터로 진실하고 의미 있는 스토리를 만들기 위한 과정들을 담고 있습니다. 서문에선 데이터 시각화가 중요한 이유와 차트, 지도, 단어가 스토리 속으로 끌어당기는 방법과 진실로부터 속이는 방법을 다룹니다. 눈으로 확인하시어 데이터 시각화가 의미하는 무엇인지 알아가시길 바랍니다.

 


1 기본 기술은 스토리를 위한 도구 선택과 스프레드 스킬 강화, 데이터를 찾고 질문하기, 지저분한 데이터 정리하기, 의미 있는 비교하기를 통해 데이터를 분석하고 정규화하기 위한 전략을 배울 있습니다.

 


2 시각화 구축에선 차트 만들기, 데이터 지도로 시각화하기, 테이블을 활용한 시각화, 웹에 임베딩하기 여러 가지 유형을 가지고 데이터 시각화 구축하는 방법에 관해 설명합니다.

 


3부는 깃허브로 코드 수정하고 호스트하기, Chart.js 하이 차트 템플릿, 리플릿 템플릿, 지도 데이터 변환하기 경험해보지 않은 코드 템플릿과 고급 도구들을 사용하는 방법과 인기 있는 플랫폼의 인터페이스를 살펴봅니다.

 


4 데이터 시각화의 마지막을 장식하는 만큼 진실하고 의미 있는 스토리를 전달하기 위한 거짓을 발견하고 편향 줄이기, 데이터 스토리 말하고 보여주기 등을 통해 모든 장의 내용을 복습하고 데이터 시각화가 단순한 숫자에 대한 것이 아닌 독자를 설득하는 진실한 이야기가 담겨있습니다.

 

저자는 사람들이 통계의 진실성을 경계하는 것처럼 데이터 시각화의 진실성을 경계해야 한다고 주장하면서 진실하고 의미 있는 스토리를 전달하는데 필요한 데이터 시각화 기술을 배우길 바라는 마음이 전달되고 있는 내용들입니다.

 

이번 기회에 데이터 시각화의 정확한 개념을 이해하고 익힐 기회가 되시길 바랍니다.

 

  "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
사례 분석으로 배우는 데이터 시각화 - 막대 차트부터 대시보드까지 태블로로 실습하며 배우는 인사이트 도출법
황재진.윤영진 지음 / 한빛미디어 / 2022년 6월
평점 :
장바구니담기



 

이번에 소개할 사례분석으로 배우는 데이터 시각화하는 이론부터 실습까지 한 번에 배울 수 있는 내용들을 담고 있습니다. 데이터 시각화 이론만 배우고 나면 어떻게 데이터 시각화를 해야하는지 질문이 생깁니다. 또한 실습을 배우고 나면 차트는 만들 수 있지만, 이게 좋은 시각화인지 고민이 듭니다. 이러한 고민을 해결할 방법들이 모두 담겨 있습니다.

 

좋은 데이터 시각화를 위한 4가지 원칙과 데이터 시각화 준비를 위한 6단계를 설명해주는데요. CHAPTER 1에서는 데이터 시각화란 무엇인지? 중요하고 필요한지에 대한 내용들과 좋은 데이터 시각화를 위한 4가지 원칙으로 데이터, 기능, 컨셉, 시각적 구성요소에 대한 원칙을 있습니다.

 


이를 토대로 CHAPTER 2에서는 6단계의 시각화 순서에 대한 설명으로 본격적으로 데이터 시각화 준비 단계를 진행하게 됩니다.

 

1단계 : 알고 싶은 질문 생각하기

2단계 : 데이터 획득하기

3단계 : 데이터 정제하기

4단계 : 적절한 차트 선택하기

5단계 : 데이터 준비하기

6단계 : 데이터 시각화하기

 

데이터 시각화를 하기 위해 태블로 사용하는데요. 태블로는 사용자가 데이터를 시각적으로 분석하고 이해할 있도록 도와주는 비즈니스 인텔리전스로 다른 데이터 분석 도구와 달리 드래그 드롭 방식으로 쉽게 배우고 실습에 적용할 있습니다.



CHAPTER 3 차트 유형별 데이터 시각화 기법으로 막대 차트, 차트, 파이 차트, 분산형 차트, 하이라이트 테이블, 하이라트 지도, 워드 클라우드 등에 대해서 알아볼 있는데요.

 


CHAPTER 4 대시보드와 태블로 스토리 만들기로 대시보드는 데이터 분석에 필요한 다양한 데이터와 차트를 쉽게 알아볼 있으며 한곳에 모아둔 것으로 차트 데이터를 유기적으로 연동할 있는 장점을 선보입니다. 그리고 데이터 스토리텔링은 다양한 차트나 대시보드를 정해진 순서에 따라 보여줌으로 메시지를 이야기 형태로 전달하는 기법을 배울 있습니다.

 

CHAPTER 5 데이터 시각화로 사례 분석하기로 서울특별시 공공 자전거 현황 분석, 서울특별시 대기오염도 현황 분석, 전국 종량제 쓰레기봉투 가격 분석, 대학 입학정원 입학 생수 분석에 대해 실습할 있습니다.

 


실습은 알아보기, 질문하기, 답해보기, 보여주기, 발표하기 순으로 진행됩니다.

 

알아보기 : 다양한 상황에서 발생하는 데이터 사례를 통해 차트 사용법을 알아봅니다.

질문하기 : 본격적인 데이터 시각화에 앞서 데이터를 준비하고 해결할 질문을 생각해봅니다.

답해보기 : 태블로로 다양한 차트를 직접 만들면서 앞서 떠올렸던 질문에 답을 해봅니다.

보여지기 : 다양한 차트를 모아 대시보드를 만들어 보고 대시보드를 바탕으로 다른 사람에게 데이터를 분석 결과 전달하는 방법을 알아봅니다.

발표하기 : 다양한 차트와 대시보드를 바탕으로 발견한 인사이트를 다른 사람에게 효과적으로 발표하는 방법을 배울 있습니다.

 

이상 예쁘고 아름다운 차트를 만드는 것이 아니라 분석 목적에 따라 인사이트를 전달하고 있는 데이터 시각화를 배우고 싶은 분들에게 추천합니다. 태블로를 이용해 실생활에 바로 적용할 있는 데이터 시각화 기본기를 익히길 바랍니다.


"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo