프로그래밍 언어인 파이썬은 고급 프로그래밍 언어로 간결하고 읽기 쉬운 구문 덕분에 입문자들에게 인기가 있으며 데이터 분석, 웹 개발, 인공지능 기계 학습 등에서 핵심 도구로 사용되고 있습니다. 파이썬은 장점이 많습니다. 가독성과 명료성이 있고 다재다능한 기능을 가지고 풍부한 표준 라이브러리입니다.
또 확장성을 가지고 있어 다른 언어와 쉽게 연동할 수 있고 동적 타이밍이 있어 빠른 프로토타이핑에 유용합니다.
실행 속도가 느릴 수 있으나 사이썬 같은 도구나 효율적인 구현으로 해결이 가능하고 모바일 및 게임 개발에 유용합니다.
이 책 《프로젝트 30개로 완성하는 데이터 분석》에서는 데이터 분석 프로젝트를 위한 필수 이론과 데이터 분석 프로젝트 30개를 분석합니다.
파이썬과 아나콘다 파이썬은 조금 차이가 있습니다. 《프로젝트 30개로 완성하는 데이터 분석》에는 아나콘다 파이썬을 활용해 데이터 분석을 진행합니다.
아나콘다 파이썬은 파이썬과 R 언어를 위한 오픈 소스 배포판으로 데이터 과학, 머신러닝, 대규모 데이터 처리 등에 주로 사용합니다.
아나콘다 파이썬이 순수한 파이썬에 다양한 과학 계산용 패키지와 도구, 패키지 관리 시스템을 함께 제공한다는 점입니다.
파이썬이 아무 도구도 설치되지 않은 순수한 상태라면 아나콘다 파이썬은 데이터 분석과 머신 러닝 도구 등을 포함한 완성형 상태라고 볼 수 있습니다.
《프로젝트 30개로 완성하는 데이터 분석》에는 파이썬과 아나콘다 파이썬의 설치 방법을 설명합니다.
윈도우 검색창에서 아나콘다 프롬프를 입력하고 관련 앱이 나타나면 아나콘다 프롬트를 실행합니다.
파이썬 프로그래밍에서 변수와 주석이 있습니다. 변수는 데이터에 붙이는 이름 태그와 같습니다. 주석은 토드 작성 시 매우 중요한 부분으로 코드의 기능과 목적입니다.
변수는 다른 프로그래밍 언어와 달리 파이썬에서는 변수를 선언하는 별도의 과정이 필요하지 않습니다.
프로그램 실행 중에는 주석이 무시되므로 코드를 작성하는 개발자나 후에 코드를 볼 수 있는 다른 사람들을 위한 설명과 문서화에 이용됩니다.
자료형 타입은 컴퓨터 프로그래밍에서 변수나 객체가 다룰 수 있는 데이터의 종류를 정의합니다.
문자열 자료형, 숫자형 자료형, 리스트 자료형, 튜플 자료형, 딕셔너리 자료형, 집합 자료형, 불 자료형 등이 있습니다.
데이터 분석 프로젝트에는 웹에 있는 표 데이터 가져오기, 빈도 분석하기, 선 그래프 그리기, 히스토그램 그리기, 파이 차트 그리기, QR 코드 이미지 생성하기 등입니다.