데이터 경영을 위한 파이썬 - 성공하는 CEO의 시스템 분석 툴
마탄 그리펠.대니얼 게타 지음, 박찬성 옮김 / 윌북 / 2023년 10월
평점 :
장바구니담기


경영자가 알아야 할 파이썬 코딩






책을 선택한 이유


데이터는 모든 현상을 담고 있다.


데이터를 제대로 이해하면 정확한 의사 결정을 하게 된다.


유용한 정보를 얻기 위한 데이터 분석 방법을 알아보기 위해

"데이터 경영을 위한 파이썬"을 선택한다.






데이터 경영을 위한 파이썬"은


1장 파이썬 시작하기

2장 파이썬의 기본기 1

3장 파이썬의 기본기 2

4장 파이썬의 기본기 3

5장 파이썬으로 데이터 다루기

6장 데이터 탐색, 변형, 그리기

7장 여러 데이터세트 다루기

8장 데이터 취합하기

9장 연습 문제


로 구성되었다.





1장 파이썬 시작하기 에서는


프로그래밍 언어는 다양하다.

잘못된 것을 배우느라 시간을 허비할까 걱정되기도 한다.


웹사이트는 대부분 웹 애플리케이션이다.

웹 애플리케이션은 프런트엔드와 백엔드로 구성된다.


보여지는 프런트엔드는 HTML, CSS, 자바스크립트로 만들어진다.

백엔드는 데이터베이스 와 일련의 규칙으로 구성된다.


프로그래밍 언어는 대부분 데이터베이스와 웹페이지 사이에서 쓰인다.


어셈블리 언어는 사람이 이해하기에 난해하며,

파이썬은 높은 가독성 덕분에 인기 있는 프로그래밍 언어다.


파이썬은 가장 빠르게 성장하는 주요 프로그래밍 언어다.


파이썬 개발 환경 꾸리기, 명령줄의 기초 사용법,

파이썬 코드, 간단한 파이썬 스크립트 직성을 실습해 본다.



2장 파이썬의 기본기 1 에서는


파이썬 코드는 명령줄에서 스크립트를 실행하거나,

대화형 모드를 사용해 실행할 수 있다.


대화형 모드는 시간을 많이 절약할 수 있다.

파일 스크립트로 코드를 저장하면 코드를 재작성할 필요가 없다.


파이썬 오류 메시지는 코드의 문제점을 알려주므로 친숙해져야 한다.


파이썬 오류 메시지에 대한 해결책은 구글링으로 파악하고

디버깅 하는 것이 효과적이다.


주석, 변수, 숫자, 수학 기호로 연산하기, 문자열,

사용자 입력을 받는 input 함수를 실습해 본다.



3장 파이썬의 기본기 2 에서는


조건문은 여러 선택지에 따라 다른 결과를 내놓는다.


파이썬의 논리 연산 기호를 대화형 모드로 실습하며 알아본다.


대문자를 구분하지 않고 인식하기, 리스트 함수,

리스트 함수를 이용한 반복문 작성을 실습해 본다.


피즈버즈는 개발자 인터뷰에서 흔한 질문이다.


피즈버즈 케이스를 통해 피즈버즈를 해결하는 가장 짧은

코드를 작성하는 과정을 살펴본다.


딕셔너리 는 문자열 라벨링 방식을 지원하면서,

리스트 보다 효과적으로 데이터를 저장하는 방식이다.


딕셔너리 사용법을 실습을 통해 알아본다.



4장 파이썬의 기본기 3 에서는


함수는 재사용할 수 있게 코드를 저장하는 수단이다.


함수를 만드는 단계, 함수의 존재 이유,

코드 스멜 로 오류 가능성을 확인하고 문제를 해결하기,

함수 작성시 고려할 사항, 함수의 매개변수,


파이썬 표준 라이브러리 의 함수 활용을 설명한다.



5장 파이썬으로 데이터 다루기 에서는


데이터 분석에는 엑셀이 아니라 파이썬을 사용해야 한다.


확장성, 안정성, 자동화, 통합성 등 많은 문제를

더 효과적으로 해결할 수 있다.



주피터 노트북은 파이썬과 효과적으로 상호 작용을 할 수 있으며,

시각화가 쉬워, 가장 인기 있는 파이썬 분석 도구다.


주피터 노트북 설치, 코드 셀, 마크다운 셀, 코드저장을 알아본다.


판다스 라이브러리는 데이터 분석에 주로 사용된다.


행 인데스와 열 이름, 행을 확인하는 함수, 데이터프레임 크기 확인 함수,

주피터 노트북 코드 자동 완성, 데이터 읽고 쓰기, 열 유형에 대해 알아본다.



6장 데이터 탐색, 변형, 그리기 에서는


판다스로 데이터를 정렬하고 그래프를 그려본다.


기준 열을 바탕으로 데이터프레임을 정렬하고,

plot()함수를 이용해 빈도를 파악하기,

수치형 열 분석 및 히스토그램 그리기,


데이터프레임 필터링하기, 특정 열에 연산을 적용하기,

데이터프레임 수정하기를 실습해 본다.



7장 여러 데이터세트 다루기 에서는


유의미한 데이터를 분석하기 위해서는

데이터세트를 조합하는 능력이 있어야 한다.


어떤 데이터세트를 조합해야 하는지 판단하고

판다스로 작성하는 방법을 알아야 한다.


유니온 기능을 이용해서 두테이블을 조합한다.


테이블을 조합하는 다섯 가지 방법을 알아보고,

상황에 알맞은 유형으로 테이블을 조인 한다.


유니온 은 concat()함수, 나머지 유형의 조인 은

pd.merge()함수가 사용된다.


예제를 실습하면서 각 상황에서 가장 적합한

유형의 조인이 무엇인지 파악해 본다.


인덱스 정렬은 빠르게 조인을 할 때 유용하다.

올바른 유형의 조인 고르기를 사례를 통해 알아본다.


기본 키는 모든 행을 유일하게 식별하는 열이다.

기본 키는 유일해야 한다.


조인을 수행하기 전 조인 키 중 기본키를 정해야 한다.


다양한 조인 방법을 이용해 데이터세트를 유용한 방향으로

변형하는 방법을 실습해 본다.




8장 데이터 취합하기 에서는


취합은 여러 열을 조합하고 일부 요약 통계를 계산하는 경우 유용하다.


groupby()함수를 사용해 평균을 구하기,

통계에 이용되는 함수, 여러 열을 취합하는 unstack()함수,

agg()함수, 그룹화 고급 기법,


생성한 열을 개별적으로 취합하는 방법,

날짜/시간 유형의 열을 취합하기 등을 실습해 본다.



9장 연습 문제 에서는


배운 것을 총동원하여 복잡한 문제를 분석해 본다.


데이터 속에서 진주를 구하려면 스스로 생각하고,

코드를 작성하며, 답을 찾아야 한다.


현실 데이터세트는 항상 복잡하고, 지저분하며, 접근성이 떨어진다.

데이터 인프라가 여러 분리된 시스템으로 확장되고,

각각의 시스템은 유용하지 않은 데이터를 분리해서 저장할 가능성이 높다.


데이터 민주화는 비즈니스 리더가 데이터를 분석 가능한 형태로 만들어

회사 전반에 걸쳐 분석에 활용한다.


데이터를 올바르게 민주화하는 것은 데이터 분석가의 중요한 능력이다.


이백만 개 이상의 행으로 구성된 데이터세트를 작은 데이터세트로 축소하고,

서로 다른 두 데이터세트를 조합하여 비즈니스 통찰을 얻는 방법을 실습한다.




데이터 경영을 위한 파이썬"은

파이썬의 기초 사용법부터 주피터 노트북의 이용,

판다스를 이용한 데이터 정렬, 조합, 취합,

데이터 민주화에 대해 다룬다.


웹사이트는 대부분 웹 애플리케이션이다.

웹 애플리케이션은 프런트엔드와 백엔드로 구성된다.


프런트엔드는 HTML, CSS, 자바스크립트로 만들어진다.

백엔드는 데이터베이스 와 일련의 규칙으로 구성된다.


프로그래밍 언어는 대부분 데이터베이스와 웹페이지 사이에서 쓰인다.


파이썬은 높은 가독성 덕분에 인기 있으며,

가장 빠르게 성장하는 주요 프로그래밍 언어다.


파이썬 코드는 명령줄에서 스크립트를 실행하거나,

대화형 모드를 사용해서 시간을 절약할 수 있으며,

파일 스크립트로 코드를 저장할 수 있다.


파이썬의 조건문, 논리 연산 기호, 리스트 함수,

딕셔너리, 함수, 데이터 분석의 사용법,


판다스로 데이터를 정렬하고 그래프 그리기,

데이터프레임, 다양한 조인 을 이용한 데이터세트 변형,


비즈니스 리더가 데이터를 회사 전반에 걸쳐 분석에 활용하기 위해

분석 가능한 형태로 만드는 데이터 민주화,


현실 데이터세트를 작은 데이터세트로 축소하고,

서로 다른 두 데이터세트를 조합하여 코드를 작성하며,

비즈니스 통찰을 얻는 방법을

실제 비즈니스 사례를 통해 실습한다.


"데이터 경영을 위한 파이썬"은

파이썬과 판다스의 기초 이론부터 시작해서

프로그램 이용법을 배우며, 실습 사례를 연습하면서,


스스로 생각하고, 문제를 분석하면서

현실 데이터에서 유용한 정보를 얻어내는 과정을 소개한다.


데이터 분석은 의사결정에 유용한 정보를 제공한다.

데이터를 분석하는 방법을 안다면 정확한 판단을 할 수 있다.


원하는 데이터를 직접 추출하고 목적에 적합한

데이터로 만들어 갈 수 있다면 적시에 적절한 의사결정을 할 수 있다.


파이썬은 직관적으로 프로그램을 이해할 수 있다.

코딩은 더 이상 전산 전문가의 영역이 아니다.


전산 자료를 요청하면 마음에 맞는 데이터를 가져오기 어렵다.

경영자가 자신이 원하는 데이터를 직접 추출할 수 있다면

다른 사람에게 의존하면서 걸리는 시행 착오와 시간 낭비 없이

시의적절하고 유용한 데이터를 가져올 수 있다.


"데이터 경영을 위한 파이썬"은 경영에 파이썬을 이용하면서

유용한 데이터를 추출해 적절한 의사결정을 할 수 있도록 하는

유용한 정보를 제공한다.


"데이터 경영을 위한 파이썬"은 데이터 분석을 통해

경영 목표를 효과적으로 달성할 수 있는 파이썬 사용법을

경영 사례를 통해 배울 수 있도록 안내한다.



윌북 과 컬처블룸 서평단에서

"데이터 경영을 위한 파이썬"를 증정해주셨다.

감사드린다.


#데이터경영을위한파이썬 #성공하는CEO의시스템분석툴

#마탄그리펠 #대니얼게타 #박찬성 #윌북 #PythonforMBAs

#컬처블룸 #컬처블룸서평단 #코딩 #파이썬





댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo