-
-
실용 SQL - PostgreSQL로 시작하는 데이터 스토리텔링 가이드북
앤서니 드바로스 지음, 임소정 외 옮김 / 영진.com(영진닷컴) / 2023년 1월
평점 :
리뷰 - 실용 SQL 2판 (원제: Practical SQL, 2E: A Beginner’s Guide to Storytelling with Data)
minimal information
- 출판사: 영진닷컴
- 저자: Anthony DeBarros
- 번역: 임소정, 강민혁
- 페이지: index 포함 458
TLDR (세줄요약)
- 초보자를 위해 postgreSQL 설치부터 설정까지 상세하게 설명
- 미국의 실제 데이터셋을 다루며 SQL 기본기를 다짐
- postgreSQL 최신 버전을 이용하며 고급 쿼리 활용 예제까지 담김

Introduction
2023년 시작하자마자 좋은 책이 추가 되었습니다!
사실 SQL은 배워야지 배워야지 하면서도 쉬우니까 하면서 우선순위에서 뒤처지고, 다른 자료구조, 알고리즘 스터디, 시험, 취준, 포트폴리오, 다른 시급한 업무 등등등등에 밀려 뒤로 밀리는 경향이 있습니다.
하지만, 데이터 분석을 주업무로 하는 일을 하고자 한다면 앞에서 언급한 것들보다 이 SQL은 훨씬 중요합니다.
예를 들어, 제가 지난 3년간 수행했던 국가 과제의 데이터 요구 사항은 많이 간소화했지만 대충 아래와 같습니다.
2009.1.1~2019.12.31 사이 **대학교 병원에 당뇨로 진단 받고 외래 추적 관찰하는 환자에서 심뇌혈관질환 (급성 심근경색, 뇌경색, 뇌출혈, 급성 관상동맥 증후군 중 하나)로 입원한 환자를 추출하세요. 단, 당뇨 진단 후 1년 이내 발생한 심뇌혈관질환은 무시합니다.
이 요구 사항을 충족하고 나서야 이 데이터를 가공하여 변수를 추출하고, 결과가 발생한 날짜를 붙이고, 머신러닝이던 딥러닝 모델에 집어 넣을 수 있겠죠?
SOTA 모델/논문도 중요하지만, 사실 이렇게 데이터를 도메인 지식에 맞추어 원시 데이터셋을 잘 만드는 일이 데이터 분석에서 가장 중요하고도 힘들면서 지루한 일입니다.
그것을 도와줄 수 있는 툴이 SQL이라고 생각합니다.
저는 물론, 저 요구 사항을 맞추느라 낑낑 대며 postgreSQL을 만지며 구글을 하루 종일 뒤지고 맞는지 확인하고 다른 사람한테 물어물어 구축하고 그랬습니다…
Contents
실용 SQL은 친절한 책입니다. 대부분 데이터 분석을 시작하려 하면 DB 실에 던져질 가능성이 높긴 하지만, 이 책은 프로그래밍을 처음으로 접하는 데이터 분석 초보자를 많이 배려한 것 같습니다.
1장. 코딩 환경 설정은 초보자를 위해 아주 기초적인 시스템 설정 지침부터 상세하게 설명하고 있습니다.
또한 저자가 구별을 해 놓지 않았지만, 제가 보기에는 2장부터 12장까지는 postgreSQL을 이용한 SQL의 기본기를 다지는 챕터입니다.

그리고, 이후 13장부터 20장까지는 고급 쿼리 기술과 활용에 대한 내용으로 아마도 SQL을 실제로 쓴다면 부딫히게 될 많은 문제에 대한 내용입니다.
제가 관심 있어하는 텍스트 마이닝에 대한 챕터는 14장에 있습니다.

PostGIS를 사용한 공간 데이터 분석은 15장에서 다룹니다.
개인적으로 관심이 많은 부분입니다. 이 책에서도 꽤 비중있게 다룹니다.

또한, 데이터를 주고 받을 때 사용되는 JSON 파일을 다루는 방법에 대해서는 16장에서 다룹니다.

Discussion
책의 절반은 기초 과정 뒤 절반은 실무에 대한 내용을 다루고 있습니다.
그러므로 책의 전반에서 최신 postgreSQL 구문을 익히고, 책의 후반에서 고급 쿼리 기술과 실무에 대해 학습할 수 있습니다.
그리고 19장인 데이터베이스 관리와 마지막 장인 20장은 데이터 스토리텔링 프로세스로 할애하여 분석을 위한 아이디어 찾기, 데이터 검토하기 등 지침을 다룸으로서 현직 데이터 분석 전문가의 SQL 활용 노하우를 수록하고 있습니다.
또한, 저한테 매우 호감 포인트! 재미없고 지루한 개념적인 예제가 아니라 미국 정부에서 제공하고 있는 실제 데이터셋을 다룹니다! (전 예제가 재미 없으면 책이 안 읽히더라구요…)
물론 postgreSQL을 중심으로 쓰여 있지만, MySQL, Oracle, SQLite 등 SQL 표준을 따르는 DBMS에서 비슷비슷한 내지는 거의 동일하게 실습을 진행할 수 있습니다!
이 책은 어떤 분께 도움이 될까요?
- 데이터 분석 초보 (저같은…)
- SQL을 실무에 응용하고 싶은 분
- 최신 postgreSQL과 그 고급 쿼리 활용을 배우고 싶은 분
이 많은 도움이 될 것 같습니다.