이렇게 쉬운 통계학 - 누구나 쉽게 업무에 활용하는 기초 통계
혼마루 료 지음, 안동현 옮김 / 한빛미디어 / 2019년 3월
평점 :
장바구니담기


비즈니스 인텔리전스 시스템을 개발하고 운영하다가 빅데이터와 인공지능 데이터 아키텍처를 다루게 된 컴퓨터공학 전공자로서 통계에는 항상 갈등을 느껴 왔습니다. 통계용어에는 익숙해진 지 오래지만 체계적으로 배운 적은 따로 없었던 상태에서 전공서적은 꽤 어려웠습니다. 스스로 잘 이해했는지 의구심이 많이 들기도 했습니다.

그러다 마침 한빛미디어의 <이렇게 쉬운 통계학>을 만났습니다. 기대를 많이 했습니다. 다 읽고 난 뒤의 느낌은 '역시 쉽지 않다'였습니다. 물론 이 책은 제가 읽었던 통계학 서적 중에서 참 쉬운 축에 속합니다. 더불어 꽤 분명한 미덕이 있기에 통계를 독학하거나 어느 정도 감을 잡고 싶다면 추천하겠습니다.

이런 종류의 책이 그렇듯 몇 군데 책을 놓을 만한 어려운 곳이 있습니다. 평균, 중간값, 최빈값 얘기가 계속 이어지다가 분산과 정규분표로 바로 넘어가는 듯하게 느껴지기도 합니다. 하지만, 이 책은 주인공이 없지만 확실히 스토리를 가지고 있습니다. 통계학이란 무엇인지 훑어보고 모집단의 특징을 도출하여 가설을 세우고 검증하는 스토리입니다. 통계라는 업의 본질을 느끼게 해 주려고 저자가 노력한 게 느껴지는 듯합니다. 중간중간 계속 읽기 힘들다는 생각이 들면 완벽히 이해하겠다는 부담은 내려놓고 다음 장으로 넘어가도 좋겠습니다.

이 책은 다른 통계책에 비해 짧게 다루는 주제가 꽤 있습니다. 가설검정이 대표적입니다. 저자의 의도는 이해가 갑니다. 길게 얘기하는 게 취지와 맞지 않아서일 것입니다. 조던 엘렌버그가 지은 <틀리지 않는 법>은 가설검정 얘기를 좀 길게 하는 편입니다. 두 저자가 비전공자를 대상으로 이 주제를 다루는 접근법이 달라 좀 흥미로웠습니다. 어쨌든 <틀리지 않는 법>은 책 두께가 남자 어른 손가락으로 두 마디는 됩니다. 글꼴 크기도 <이렇게 쉬운 통계학>에 비해 살짝 작습니다. 모셔두기 십상인 <틀리지 않는 법>보다 <이렇게 쉬운 통계학> 쪽이 저자가 의도한 바를 독자에게 전달한 효과가 크지 않을까 합니다. 물론 둘 다 후회 없이 좋은 책입니다.

다만 이 책은 다 읽고 난 뒤에 이제부터 뭘 해야 할지 고민이 됩니다. 에필로그에 직감이 얼마나 틀릴 수 있고 통계가 얼마나 중요한지 얘기했으면서도 이 책 이후에 할 것을 알려주지는 않습니다. 다행히 한빛미디어는 책표지 오른쪽 날개에 이어서 읽을 책을 추천해 주었습니다. 저는 이 <처음 배우는 딥러닝 수학>, <데이터 과학을 위한 통계>, <헬로 데이터 과학> 중에서 <헬로 데이터 과학>을 제일 추천합니다. 비전공자를 대상으로는 제일 쉬운 다음 단계라고 보기 때문입니다. 그 다음으로는 <엑셀만 알아도 할 수 있는 데이터 과학>을 권합니다. 통계를 써먹어 보고 싶어 근질근질할 텐데 이 책을 통해 실제로 뭔가 해볼 수 있습니다. 길게 설명하지 않은 통계용어도 앞서 읽은 책에서 충분히 익숙해졌기에 어려울 게 없을 겁니다. 그 이후에는 R이나 파이썬도 할 마음이 생길지도 모르겠습니다. 화이팅입니다.



댓글(1) 먼댓글(0) 좋아요(3)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
arccii 2019-10-01 22:17   좋아요 1 | 댓글달기 | URL
읽기 시작했는데, 서평을 읽으니 감이 잡히네요. 통계 입문학 서적들이 늘 그렇듯이요..^^ 감사합니다.
 
머신러닝 실무 프로젝트 - 실전에 필요한 머신러닝 시스템 설계, 데이터 수집, 효과 검증 노하우
아리가 미치아키 외 지음, 심효섭 옮김 / 한빛미디어 / 2018년 6월
평점 :
구판절판


이 책 목차를 보고 한 번 놀라고, 정말 목차 대로 내용이 나왔는지 확인하면 두 번 놀랐다. 모 쇼핑몰 쇼핑 어드바이저 챗봇을 구축하고 운영하면서 익히며 고민했던 경험과 사례가 이 책에 그대로 녹아 있었기 때문이다.


1부. 머신러닝 실무 노하우
 - 머신러닝 프로젝트 처음 시작하기
 - 머신러닝으로 할 수 있는 일
 - 학습 결과 평가하기
 - 기존 시스템에 머신러닝 통합하기
 - 학습 데이터 수집하기
 - 효과 검증하기
 
2부. 머신러닝 실무 프로젝트
 - 프로젝트 1 : 영화 추천 시스템 만들기
 - 프로젝트 2 : 킥스타터 분석하기
 - 프로젝트 3 : 업리프트 모델링으로 마케팅 효율 높이기


이 책은 228쪽으로 얇다. 이정도 분량에는 일장일단이 있다. 애초에 저자는 머신러닝 입문서가 아님을 밝혔다. 아예 코세라 강의를 듣거나 입문서를 먼저 보라고 추천한다. 코드 한 줄 한 줄을 상세히 설명하지 않는다. 대신 Github에 Jupyter Notebook 코드를 올려 두었다.

그렇다 해도 책을 휘리릭 읽으면 내가 뭘 읽었는지 머리가 뭐가 남았는지 모를 수 있다. 우선 책을 1회차 읽고, 2회차에는 꼭 실습환경을 꾸며서 실제로 소스 코드를 실행해 보면 좋겠다. 윈7 사용자는 VM으로 Linux 환경을 먼저 구성해야 하는 번거로움이 있다.

이 책은 적지 않은 부분을 모델 평가에 할당했다. 실제로 참 어려운 부분이다. 다른 머신러닝 책도 모델 평가에 대해 다뤘지만, 데이터를 학습과 테스트 용도로 나누는 기술에 대해 설명하고 끝나는 때가 많았다. 반면 이 책에서는 업리프트 모델링과 적용방안까지 언급하면서 저자가 했던 고민에 대해 알려주는 게 인상적이다.

PC 한 대만 쓸 수 있는 학생은 이 책의 진가를 다 알기는 힘들 듯싶다. 하지만 회사원인 머신러닝 입문자는 회사의 자원을 쓸 방법을 찾아서 이 책의 범위를 뛰어넘은 실습을 해보자. 실력이 일취월장함을 자각할 것이리라.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
엑셀 피벗 & 파워 쿼리 바이블 - 엑셀 피벗과 파워 쿼리를 다루는 거의 모든 기능
최준선 지음 / 한빛미디어 / 2017년 11월
평점 :
장바구니담기


인공지능과 빅데이터 시대에 백만 줄이 한계라는 엑셀로 뭘 할 수 있을까?


정답: "정말 많은 걸 할 수 있다."


엑셀로 SUM만 간신히 쓰거나 vlookup 함수 정도만 쓰면서 엑셀에 감탄했다면 신세계를 알 필요가 있다.


평가항목을 점수표와 매칭하여 평가한다든가, 웹 데이터를 입맛에 맛게 편집한다든가, 판매처별 실적을 하나로 통합해 분석한다든가, 월 시트별 판매내역을 판매대장 하나로 변환한다든가 하는 일을 해야 할 때 피벗테이블과 파워 쿼리를 고려해 볼 만하다.

더불어 어지간한 엑셀 입문서나 강좌를 독파한 후에도 엑셀에 대한 갈증이 남았다면, 그에 따라 VBA 매크로 학습을 고민했다면 이 책이 큰 도움이 될 것이다.

과거, 엑셀에 부가적으로 설치하는 BI 솔루션 대부분은 엑셀이 하지 못하는 영역에서 특기를 발휘하는 방식으로 꽤 고가였다. 엑셀이 이 정도 기능은 바로 지원해도 좋을 텐데 하며 아쉬워 하던 시기에 나온 게 '파워 쿼리'다. 비슷한 시기에 6만5천 줄이 한계이던 워크시트가 백만 줄까지 담도록 발전하기도 했다. 이제 (PC 성능이 괜찮으며) 파워쿼리를 쓸 줄 알면 데이터가 몇 억 줄이라도 엑셀만 가지고 다룰 수 있다.

이 책은 한국어로 파워쿼리를 설명하는 얼마 되지 않는 귀한 자료다. 다만 진입장벽이 좀 있다. 아래 조건만 선결하고 정독하면 엑셀 전문가가 된다고 해도 과언이 아니겠다.

1. 엑셀 입문서를 본다.
    기능을 나열한 책보다는 몇 가지 시나리오(실습)를 다룬 게 좋겠다. 엑셀로 할 수 있는 일을 전반적으로 알아 보고, 자신이 할 일과 엑셀 사이의 연계를 생각해 볼 필요가 있다. 엑셀로 하고 싶은 게 있어야 피벗이든 파워쿼리든 익힐 생각이 나지 않겠나.

2. 이 책의 1장은 이해가 덜 가더라도 인내하고 통독한다.
    PART01 엑셀 데이터 관리 방법 장은 내용이 결코 쉽지 않다. 데이터 다루기에 익숙한 사람은 이런 내용이 중요함을 잘 알지만, 이제 데이터를 다뤄볼까 하는 사람은 뜬금 없게 볼 법도 하다. 그러나 엑셀을 데이터베이스처럼 쓰고자 한다면, 이 정리 과정이 무척 중요하다.

이 책의 내용은 정말 충실하다. 정말 엑셀로 데이터 분석을 하겠다고 마음을 먹었다면 바이블 역할을 제대로 해준다. 다만, 엑셀로 데이터 분석을 해보겠다는 마음을 먹게 해주는 책은 못 된다. 그런 내용이 궁금하면 저자가 같은 출판사에서 번역한 <회사에서 바로 통하는 엑셀 비즈니스 데이터 분석>을 탐독해 보자.


회사에서 바로 통하는 엑셀 비즈니스 데이터 분석

<엑셀 피벗&파워 쿼리 바이블>을 제대로 보겠다는 마음이 강해지지 않을까 한다. 응용하기에 어렵지 않아 같이 추천하는 바이다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
아주 큰 스케치북 : 그림 그리기 톡톡 창의력 시리즈
한빛에듀 편집부 지음 / 한빛에듀 / 2017년 10월
평점 :
장바구니담기


몇 달째 막차 타고 퇴근하느라 가족에게 소홀하던 차에 좋은 책이 나왔다고 하여 덥석 받았습니다.


아이가 보드게임 만들기를 좋아하여 이것 저것 많이 그리고 오리는 걸 봐왔기에 좋아하겠구나 싶었습니다. 마음 먹고 정시는 아니더라도 아이들이 깨어 있을 때에 퇴근하고 싶었지만 그렇게 하지 못하여 저보다는 결국 아내가 이 책으로 아이와 놀고 말았네요. 카톡으로 사진을 보내줘서 아이가 재미있어 하는구나 생각했습니다.


따라 그리는 데에서 멈추지 않고 커스터마이징을 했음


날아가는 오토바이인데 태양에 가까워서 보호막을 씌웠음


이 책의 미덕은 그리기 시범 4단계에 있습니다. 미술 선생도 아니고 그림에 소질이 없으면 아이가 너댓 살만 되어도 무얼 그려 달라는 요청에 난감해집니다. 그런데 이 책은 4단계로 그리는 단계를 설명해 줘서 어른으로서 그려 주기도 부담 없고, 아이들도 곧잘 따라합니다.


이 책을 따라 하느라 그림 그리는 방식이 굳어지면 어쩌나 했는데 기우였습니다. 일단 그리기 주제가 다양해서 굳어질 틈이 없어요. 시큰둥해 하는 페이지를 넘겨 버려도 그릴 게 많습니다. 첫째가 공주 같은 걸 그려 달라고 했을 때에는 그려 본 적이 없는 주제라 힘들었는데 이 책에는 공주도 있고 요정도 있습니다. 진작 나왔으면 진땀 빼지 않았겠어요.

이번 주말에는 같이 그리면서 놀려고 합니다. 예습 없이도 아이들과 놀기 편한 게 이 책의 진정한 미덕이겠습니다.



댓글(1) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
wizmusa 2017-11-25 10:57   좋아요 0 | 댓글달기 | URL
사진을 올릴까 말까 망설이게 했던 그림들이 꽤 됩니다. 특히 토끼 그림은 행상 손수레가 있다는 이유로 지폐와 여러 가지 계산을 덧붙여 그려 놔서 올리지 않기로 마음 먹었지요. 자식의 성향이 어디로 튀는지 볼 수 있는 소중한 기회였습니다.
 
실무에서 바로 통하는 자바 (Java 8 대응) - 당장 현장에 투입된 초보 개발자를 위한
다케다 하루키 외 지음, 김성훈 옮김 / 한빛미디어 / 2017년 7월
평점 :
절판


신입사원을 대상으로 어떻게 하면 빨리 일을 맡길 수 있을까에 대해서는 정답이 없긴 하다. 저자들의 고민이 많았을 책이다. 나도 몇 번 후임을 받았지만 매번 고민이 있었다. 어느 만큼 가르치고 어느 만큼 헤매게 할까에 대해서는 속한 조직의 상황과 신입의 배경지식에 따라 다를 수 밖에 없다.

 

때문에 자바를 사용하는 조직에서 이 책을 OJT 교재로 사용한다면 더할 나위가 없겠다. Java라는 언어에 대한 개요, 자료형, 기본문법, 객체지향 개념과 구현에 이어 최근에 추가한 제네릭과 람다식을 다룬다. 자바의 역사는 짧지 않기에 기본 제공하는 라이브러리가 많으므로 이를 활용하는 방법과 함께 다운로드 받아 사용할 수 있는 외부 라이브러리를 소개한다. 자바 개발자로서 구글링으로 성장할 수 있는 기반을 닦아 줬달까? ☺ 이 과정을 통해 정말 중요한 개발도구인 이클립스의 사용법도 익히게 된다.

 

기초 과정 다음으로 데이터베이스가 나와서 살짝 놀랐다. 보통 파일 처리 아니었나 싶은데 아무래도 최근 경향으로는 DB를 먼저 익히는 게 실전 투입이 빠르긴 하겠다. 데이터베이스를 다루며 단순히 select, insert만 하는 게 아니라 어지간한 데이터베이스 교재의 개요만큼은 설명하며 ORM까지 다뤘다. 길지 않게 다뤄서 이것만 가지고 이해할 수 있을까 하는 생각이 들긴 했는데, OJT 목적을 감안하면 별 수 없겠다. 친절하게도 이클립스 안에서 관련 라이브러리를 검색해서 설치하는 내용도 빠짐 없이 나와 있다.

 

텍스트 입출력 장에서는 기본적인 파일 처리를 말하고 CSV, XML, 로그를 다룬다. 이전의 자바 기초교재처럼 고작 Hello world 같은 문자열을 읽고 쓰기만 한다면 시시할 텐데, 당장에 업무에 쓰일 기능을 익히니 다소 진도가 빠르더라도 보람은 있을 구성이다. JSON을 다뤘으면 더 좋았을 텐데 XML에 대한 과정을 익혔으면 JSON을 불러 쓰는 건 어렵지 않겠다.

 

이렇게 응용을 다루다가 다시 한 번 자바 심화과정에 들어간다. 한 번 읽어 보니 저자들이 멀티 스레드 처리를 다룬 취지를 알 듯했다. 당장 신입 수준으로 써먹지는 못하겠지만, 이런 개념이 있으니 알아 두고 선배들이 만든 소스를 이해하도록 하되, 최신 기능은 이러저러하니 까먹지 않길 바란다는 정도려니 싶다.

 

이후의 내용은 상용 개발 협업에 절대적으로 중요한 테스트와 개발 소스 버전 관리, 작업진척 및 이슈 관리, 자동화(CI)다. 각 주제로 두꺼운 책이 나올 정도로 심오한 주제들이지만 OJT하기 좋은 수준으로 다뤘다. 좋은 선배라면 이 책과 기존 산출물을 두고 생동감 있게 설명해 줄 만하다. Git을 다룰 만도 한데 SVN만 얘기하여 약간 아쉬웠다.

 

이 책으로 실무 자바를 독학하려는 사람들에게 당부하고 싶은 말이 있다. 대상독자에 '자바를 전혀 경험해보지 않은 사람'이라는 항목이 있긴 해도 아예 프로그래밍 초짜는 이 책을 쫓아가기 힘들다. 그전에 C나 PHP 같이 다른 언어로 파일과 DB를 읽고 썼던 사람이면 더할 나위 없아 좋고, 최소한 구구단이라도 짜 봤던 사람이 대상이라는 얘기다. 어디 국비지원 과정 같은 걸 찾아 3~5일 자바 교육과정을 들어 보길 바란다. (행여 스프링 프레임워크나 스트러츠 프레임워크 과정을 듣지는 말고 자바 기초 과정을 찾으시라.)

 

어느 정도 소양을 갖춘 후에 이 책으로 독학하기는 나쁘지 않다. 다만 소양이 있어도 군데 군데 헤맬 부분이 나온다. 머리 속에 별 이정표가 없는 채로 이 책을 따라 하다 보면, 자바를 배우는 건지, 이클립스를 배우는 건지, 메이븐을 배우는 건지, 뭘 하는 건지 혼란스러울 수 있다. 그런 때에 좌절하지 말고, 해당 개발 소스를 일독한 후에 일단 넘어가도 좋겠다. 자바를 머리에서 아예 놓지만 않으면 나중에 자연스럽게 이해가 될 거라고 단언한다.

 

신입이라면 좋은 선배를 만나길 바라고, 독학자들은 용기와 끈기를 갖길 바란다. 화이팅.



댓글(0) 먼댓글(0) 좋아요(3)
좋아요
북마크하기찜하기 thankstoThanksTo