숫자는 거짓말을 한다 - 통계와 그래프에 속지 않는 데이터 읽기의 힘
알베르토 카이로 지음, 박슬라 옮김 / 웅진지식하우스 / 2020년 10월
평점 :
품절


<숫자는 거짓말을 한다>, 알베르토 카이로 지음, 박슬라 옮김, 웅진지식하우스, 2020


숫자 가득한 표는 많은 정보를 담고 있지만 한 눈에 파악하기는 힘들다. 오랜 시간 숙련되어 숫자를 직접 비교하는 것이 편하다 할 사람도 있겠지만, 데이터를 시각화한 차트가 보다 직관적이기 때문에 쉽게 파악할 수 있다고 믿는다.


보통 보고서를 쓸 때 데이터를 표로 표현하기도 하지만, 전달하고자 하는 핵심 내용을 직관적으로 보여주고, 설득력을 높이기 위해 차트를 그려 넣기도 한다. 설득력이라는 이유로 척도가 무시된 차트를 그리거나 척도가 다른 차트를 비교하는 오류를 범하곤 한다. 차트가 가진 강력한 설득 능력이 오히려 거짓 정보를 양산하고, 거짓말의 도구로 사용될 수 있는 것이다.


비주얼 저널리즘 전문가인 알베르토 카이로는 <숫자는 거짓말을 한다>를 통해 차트의 강력한 설득력으로 인해 거짓 정보를 전달하는 도구가 될 수 있음을 경고하고 올바르게 차트를 이해하는 방법을 전하고 있다.


알베르토 카이로는 먼저 차트 디자인은 글쓰기와 차트 해석은 글 읽기와 비슷하다고 이야기한다. 또한 불변의 법칙은 드물고, 우리가 지닌 것은 대부분 수많은 예외와 위험 부담이 수반된 융통성 있는 원칙과 지침이라고 이야기한다.


이 책의 핵심 메시지 중 하나는 바로 차트 디자인이 글쓰기와 비슷하다는 것이다.
차트 해석은 글을 읽는 것과 유사하다.
다만 차트 해석은 전통적인 읽기와 달리
항상 선형적으로 진행되지 않는다는 점만 다를 뿐이다.
이 글쓰기 비유를 차트에 적용하면
지나치게 좁고 높은 그래프는 과장된 표현이고,
지나치게 길고 낮은 그래프는 절제된 표현이라고 할 수 있다.(106)


차트 디자인은 글쓰기와 마찬가지로 과학이자 예술이다.
불변의 법칙은 드물고, 우리가 지닌 것은 대부분 수많은 예외와
위험 부담이 수반된 융통성 있는 원칙과 지침이다.(102)


차트에 위험부담이 따르는 것은 차트가 강력한 설득력을 가졌기 때문에 이를 악용해 잘못된 정보를 전달할 수 있기 때문이다. 또한 우리가 가진 확증 편향과 인지부조화에 의한 자기합리화 등 심리적 영향으로 잘못 이해할 수 있기 때문이다. 차트가 가진 위험부담을 피하고자 한다면 차트를 올바로 읽는 역량(도해력)을 길러야 한다고 강조한다.


차트의 강력한 설득력은 대가를 초래한다.
차트가 거짓말할 수 있는 이유는 우리가 스스로에게 거짓말하는 경향이 있기 때문이다.
인간은 차트와 숫자로 기존의 이견과 편견
그리고 확증 편향이라는 심리적 경향을 강화한다.(41)


차트를 읽을 때 흔히 마주치는 문제()
상관관계와 인과관계, 합병 패러독스 그리고 생태적 오류()
차트는 표시되어 있는 것만 보여준다.()
생태적 오류는 개인을 그가 속한 집단의 속성에 근거해 분석하려 할 때 발생한다.()
개인이나 집단 등 분석 수준이 다르면 필요한 데이터 세트도 달라진다.
예를 들어 집단을 연구하기 위해 데이터를 생성하고 요약했는데
이를 받아들이는 대상이 그보다 작은 집단이나 지역, 도시 또는 개인일 경우
데이터의 효용성은 크게 줄어든다.
여기서 합병 패러독스가 발생한다.
데이터를 일부분만 이용하거나 취합하는 방식에 따라
특정 패턴이나 추세가 종종 사라지거나 역전되는 것이다.(218~220)


차트는 좋든 나쁘든 세상 어디에나 존재하며 설득력이 무척 강하다.
이러한 요소들이 결합하면 틀린 정보와 가짜 뉴스라는 거대한 재앙으로 이러질 수 있다.
그러므로 차트를 읽을 때는 신중하게 주의하며 정확한 정보를 인지해야 한다.
, 도해 능력을 키워야 한다.(43)


그렇다면 차트를 올바로 읽는 방법은 무엇일까?

먼저 제목, 설명, 출처를 살펴보라고 한다. “쓰레기를 넣으면 쓰레기가 나온다는 말과 같이 신뢰할 수 있는 데이터를 넣어야 신뢰할 수 있는 차트가 된다는 것이다. 다음으로 측정 대상, 단위, 척도, 범례 등 차트의 스캐폴딩 정보를 확인하고, 시각적 부호화한 내용 자체를 살필 것을 권한다. 이때 차트 위에 가상의 사분면을 그리고 각각 이름을 붙이거나 데이터의 중심을 관통하는 가상의 선을 그리는 것이 도움이 된다고 한다. 이어서 주석도 읽고, 폭넓은 시야로 패턴과 동향, 관계까지 파악하라고 이야기한다.


차트를 해석하는 5단계 법칙
1)
제목, 설명 출처 : 차트에 제목과 설명이 있다면 그것부터 읽자.
출처가 명시되어 있다면 역시 살펴본다.
2)
측정 대상, 단위, 척도, 범례
차트는 무엇을 어떻게 측정했는지에 관한 정보를
문자 또는 시각 자료로 표시해야 한다.
3)
시각적 부호화
4)
주석을 읽어라
5)
폭넓은 시야로 패턴과 동향, 관계를 파악하라.(78~80)


좋은 차트는 데이터를 얼마나 정확하게,
그리고 올바른 비례에 맞춰 부호화했느냐에 달려 있다.
하지만 그 전에 고려해야 할 사항이 있다.
바로 데이터 자체의 신뢰성이다.
차트를 읽을 때는 가장 먼저 데이터의 출처에 주목해야 한다.(118)


차트의 스캐폴딩과 시각적 부호화 방법()
차트를 정확히 읽으려면 내용을 뒷받침하는 구성 요소(차트의 스캐폴딩)
내용 자체(데이터의 표현 또는 기호화 방식)에 주목해야 한다.
스캐폴딩은 제목과 범례, 척도, 제작자 이름, 출처 등으로 구성된다.(50)


차트를 읽는데 유용한 요령()
첫째, 언제나 가장 먼저 척도를 살펴보라.
이 차트가 무엇에 관한 것이고, 무엇을 측정했는지 파악해야 한다.
둘째, 산점도에 이름이 붙은 데에는 이유가 있다.(
)
세번째 요령은 차트 위에 가상의 사분면을 그리고 각각 이름을 붙이는 것이다.()
네 번째 방법은 원이 집중된 구역의 중심을 관통하는 가상의 선을 그리는 것이다.
(59~60
)


차트는 우리를 똑똑하게 만들고 유익한 대화를 나누도록 돕지만
그러려면 특정한 조건이 충족되어야 한다.
그 조건의 하나는 차트의 디자인이고
나머지는 우리가 그것을 읽고 해석하는 방법이다.(
)
또 하나의 조건은 논의를 발전시키기 위해 차트에 접근해야 한다.()
우리는 차트가 거기 표시되어 있는 것만 보여준다는 원칙에 충실해야 하며
너무 많은 것을 읽어내려 해서는 안 된다.(
)
차트를 사용하는 목적이 중요하다.
(259~260
)


주의할 점은 차트는 표시되어 있는 것만 보여줄 뿐임으로 너무 많은 것을 읽어내려 하지 말고, 오차를 오류로 혼동하지 말고, 데이터를 통해 국가, 지역 등의 집단과 개인을 비교하고 싶다면 같은 수준의 데이터를 비교해야 한다고 이야기한다. 그리고 백분율과 비율로 표시된 통계 수치는 인간성이 제거되어 우리를 관념적으로 만들 수 있다는 점도 경계해야 한다고 강조한다.


오차의 종류는 다양하다.
그중 하나는 오차 범위는 여론조사의 불확실성을 표현할 때 흔히 접할 수 있다.
오차 범위는 신뢰구간의 2가지 요소 중 하나다.
다른 하나는 신뢰 수준으로, 백분율 수치로 나타내며 주로 95%99%.(
)
따라서 수치가 불확실한 차트를 볼 때는
최종 결과가 보이는 것보다 더 작거나 클 수 있다는 사실을 명심해야 한다.(199)


각각의 추론에는 그에 걸맞은 수준의 데이터 통합이 필요하다.
한마디로 국가 또는 지역별 종교와 행복의 상관관계를 알고 싶다면
국가 또는 지역 수준의 통합 데이터를 비교해야 한다.
개인에 관해 알고 싶으면 국가나 지역 수준의 차트는 필요하지 않다.
이 경우 차트는 개인과 개인을 비교해야 한다.(227)


인류의 진보를 논할 때 백분율이나 비율만 고려하면
통계 수치에서 인간성을 제거해 우리를 자기만족에 안주하게 만든다.(
)
<
숫자에 속아 위험한 선택을 하는 사람들>의 저자 게르트 기거랜처는
백분율은 필요한 것보다 더 숫자를 관념적으로 만든다고 말했다.(178~179)


당파성을 가진 가짜 뉴스가 범람하는 시대에서 가짜 정보에 현혹되지 않고 좋은 정보를 골라내는 능력은 반드시 필요하다. 차트를 올바르게 읽는 방법을 안다면 거짓 정보, 왜곡된 정보 등을 충분히 걸러낼 수 있을 것이라 믿는다.


아울러 평균이 가진 허상을 날카롭게 지적한 토드 로즈의 <평균의 종말>(21세기북스, 2018)과 인간의 가진 본능으로 인해 차트와 통계를 잘못 이해함으로써 세상을 오해하고 있다고 지적한 한스 로슬링의 <팩트풀니스>(김영사, 2019)를 함께 읽는다면 올바른 데이터 읽는 법을 익히는데 도움이 될 것이다.


* 해당 도서는 출판사로부터 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
혼자 공부하는 머신러닝 + 딥러닝 - 1:1 과외하듯 배우는 인공지능 자습서 혼자 공부하는 시리즈
박해선 지음 / 한빛미디어 / 2020년 12월
평점 :
구판절판


<혼자 공부하는 머신러닝+딥러닝>, 박해선 지음, 한빛미디어, 2020


기업에서 중장기 변화를 예측할 때 보통 연평균 성장률(compound annual growth rate, CAGR)을 사용한다. 최근 3개년이나 5개년 연평균 성장률을 적용해 앞으로의 실적을 예측한다. 주어진 데이터의 한계로 이를 사용할 수밖에 없겠지만, 대체로 연평균성장률을 적용한 미래예측은 잘 맞지 않는다.


최근 정보통신 기술의 발달로 인해 빅데이터, 인공지능이 빠르게 일상에 접목되고 있어, 혹시라도 기업의 중장기 변화를 예측하는 데 있어 머신러닝, 딥러닝을 접목할 수 있지 않을까 싶었다. 프로그래밍에 대해서는 아는 바가 없어 실제 구현 가능한지 감이 잡히지 않았다.


머신러닝, 딥러닝 프로그램에 대한 용어나 원리 등이라도 이해해볼 요량으로 책을 찾았지만, 함수와 코드 위주로 설명된 책들은 C언어를 알지 못하면 이해하기 쉽지 않았다. <혼자 공부하는 머신러닝+딥러닝>인공지능 공부가 정말 처음일 때, 어려운 수식에 지쳤을 때, 쉬운 그림과 실전 예제로 공부하고 싶을 때라는 표지의 문구가 끌렸다. 이번엔 이해할 수 있을 것이란 근거 없는 자신감이 생겼다.


쉽게 이해할 수 있는 예제와 비유를 사용했습니다.
심지어 이 분야와 무관하더라도 파이썬만 알고 있다면
머신러닝과 딥러닝을 학습할 수 있도록 꾸몄습니다.(6)


<혼공머신>은 파이썬, 사이킷런 등 라이브러리를 설치하지 않고 네트워크에 연결된 컴퓨터와 구글 코렙을 통해 실습하도록 안내하고 있다. 구글 코렙에서 작성한 노트북은 구글 드라이브에도 저장이 되니, 인터넷만 연결되면 보유 컴퓨터의 성능과 상관 없이 머신러닝, 딥러닝 프로그램 개발이 가능하다.


머신러닝과 딥러닝 관련 용어들과 작동 원리를 설명하고, 직접 프로그래밍 실습을 할 수 있도록 구성되어 있어, 비교적 쉽게 이해할 수 있다. 생선 가게에서 도미를 분류하는 단순한 방법으로 출발해, 주어진 길이 정보로 무게를 예측하고, 내용물을 알 수 없는 럭키백의 확률을 계산하는 복잡한 방법까지 프로그래밍할 수 있도록 알고리즘과 함수들을 세세히 짚어준다.


머신러닝은 K-최근접 이웃 회귀와 선형 회귀 등 회귀 알고리즘과 로지스틱 회귀, 확률적 경사 하강법 등 분류 알고리즘은 물론, 트리 알고리즘과 군집 알고리즘의 순서로 단계를 높여 간다. 그리고 딥러닝은 이미지와 텍스트를 위한 인공 신경망으로 구분해 개념을 설명하고 실습할 수 있도록 하고 있다.


키보드에 손을 올려놓고 책의 코드를 직접 입력하면서 읽는 책입니다.()
귀찮다거나 어렵다고 생각해 미루지 마세요.
컴퓨터 앞에서 실습하면서 공부하면
어느새 글자로는 쉽게 이해할 수 없었던 개념을
너무나 당연하게 몸으로 느낄 수 있을 것입니다.(7)


불과 몇 년 전만 해도 머신러닝, 딥러닝 프로그래밍을 하려면 C언어를 다룰 줄 알아야 한다고 했었다. 머신러닝, 딥러닝을 위한 서버를 구축하거나 복잡한 머신러닝 구동을 위해 컴퓨터 성능도 좋아야 했다. 지금은 인터넷만 연결된다면 하드웨어의 제약 없이 구글의 자원을 이용해 누구나 쉽게 머신러닝, 딥러닝 프로그래밍이 가능하게 되었으니 세상은 내가 생각하는 것보다 훨씬 빠르게, 편하게 편하고 있는 것 같다.


여전히 기업의 중장기 변화 예측에 대한 솔루션을 찾은 것은 아니지만 다양한 기업 정보가 담긴 빅데이터를 확보할 수 있다면 불가능하지 않을 것 같다.


* 해당 도서는 출판사로부터 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.



댓글(0) 먼댓글(0) 좋아요(4)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
아! 와 어? 인문과 과학이 손을 잡다
권희민.주수자 지음 / 문학나무 / 2020년 11월
평점 :
장바구니담기


<!와 어?>, 주수자/권희민 지음, 문학나무, 2020


<!와 어?>는 물리학자 남편과 소설가 부인이 함께 과학과 인문학적 시각으로 바라본 일상의 이야기를 담은 에세이집이다. 40년간 다르게 사고하며 살아온 부부가 함께 책을 쓰면서 서로의 차이를 알게 되고, 서로가 알지 못하는 부분에 대한 이해가 깊어졌다고 한다.


과학자의 시선과 소설가의 시선으로 그려낸 일상, 우주, 자연, 인간, 숫자에 대한 이야기는 과학적 사고와 인문학적 사고의 차이를 알 수 있고, 다양한 관점에서 사유할 수 있도록 해준다.


인간의 생존과 경험 범위도 한정되어 있다.
인간이 생존할 수 있는 온도는 32도와 41도 사이에서다.
이 범위 밖으로 나가게 되면, 너무 더워서 못 살고 너무 추워서 못 산다.(155)


체온과 기온을 헷갈린 것이 아닌가 싶다. 32도와 41도가 기온이라면 우리는 여름에만 살 수 있다는 뜻이니, 체온인 듯하다. 하지만 체온이 32도 보다 낮거나 41도 보다 높으면 춥고, 더워서 못하는 게 아니라 비가역적 세포 손상에 의해서 사망하는 것 아닌가 싶다.


헷갈리는 부분이 있어 갸우뚱하기도 했지만 일상과 연결된 과학 이야기는 일상을 보다 호기심 어린 시선으로 바라보도록 해줬다.


* 해당 도서는 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.



댓글(0) 먼댓글(0) 좋아요(1)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
[전자책] [세트] 지적대화를 위한 30분 고전 (총50권)
박계원 / 웅진지식하우스 / 2019년 8월
평점 :
장바구니담기


<지적대화를 위한 30분 대화>, 박계원 지음, 웅진지식하우스, 2020


늦깎이로 독서에 입문해 고전 읽기는 언제나 숙원사업이었다. 매해 신년 계획을 세울 때 운동과 외국어가 빠지지 않듯 고전 읽기에 도전했다. 이해력 부족을 탓하며 완독하지 못한 채 책장에 고이 모셔 놓기 일쑤였다. 빼곡히 책장을 채운 고전을 보면 자책은 커지고, 자존감은 낮아졌다.


<지적대화를 위한 30분 대화>는 동서고금의 고전 50권으로 구성한 전자책 시리즈다. 고전의 핵심 내용을 요약하고, 저자가 작품을 쓰게 된 배경과 시대적 상황에 대해서 이야기하고, 작품이 인류사에 미친 영향까지 다루고 있다. 저자와 시대적 배경 등 작품 주변의 이야기들은 고전은 어렵다는 편견을 깨기에 충분하다.


핵심 내용 위주로 축약되어 있어, <지적대화를 위한 30분 대화>를 읽었다고 고전을 깊이 이해했다고 할 수 없지만, 원전을 읽기 전에 전체적인 개념을 잡는데 도움이 된다. 완독하지 못한 고전에 다시금 도전할 용기를 준다.


수포자 탈출을 위해 야심차게 뉴턴의 <프린키피아>에 도전했었다. 무모한 도전임을 깨닫고 나중을 기약하며 책장에 꽂아 놓았었는데, <지적대화를 위한 30분 대화>를 통해 다시금 꺼내 들었다. <프린키피아>에 담긴 모든 법칙과 정리를 완벽히 이해한 것은 아니지만, 암흑의 수포자 터널을 빠져나올 한 가닥 빛이 보인다.


* 해당 도서는 출판사로부터 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.



댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
연봉이 쑥쑥 오르는 이직의 기술 - 몸값 제대로 받고, 회사에서 인정받는 프로 이직러의 커리어 수업
김영종 지음 / 상상출판 / 2020년 12월
평점 :
장바구니담기


<연봉이 쑥쑥 오르는 이직의 기술>, 김팀장 지음, 상상출판, 2020


이제 평생 직장은 없다는 말도 식상하다. 회사는 결코 내 인생 전부를 책임져 주지 않는다는 것을 알면서도 회사에 있는 동안에는 마치 전부를 책임져 줄 것이라 착각하며 막연히 기대한다.


입사 초년생 때는 회사에서 얼마나 높이 올라가느냐, 얼마나 오래 다니느냐가 중요하다고 생각했다. 하지만 시간이 흐를수록 길이와 높이가 중요한 것이 아니라, ‘다음이 중요함을 깨닫는다. 로열패밀리가 아닌 이상 반드시 끝이 있기 때문에 다음을 준비하지 않으면 다음이 결코 행복할 수 없다고 믿는다. 그래서 다음을 위한 준비는 무엇이든 언제나 옳다고 믿는다.


<연봉이 쑥쑥 오르는 이직의 기술>6번이나 이직한 15년 경력의 인사팀장인 저자가 몸값 제대로 받고, 회사에서 인정받는이직의 노하우를 전하는 책이다. 이직은 준비하는 사람들이 궁금해하는 질문에 답하는 형식으로 내용이 구성되어 있고, 이직의 단계별로 준비해야 할 사항과 마음가짐에 대해 자세히 이야기하고 있다.


경쟁력을 확인할 수 있는 체크 리스트
-
회사의 소속, 직급, 직책 제외하고 한마디로 소개하면, 자신은 어떤 사람인가?
-
자신의 직무와 관련해 최근 가장 이슈되고 있는 주제어를 다섯 가지 이상 이야기한다면?
-
주변에 자신을 추천해줄 수 있는 지인이 몇 명이나 있는가?
-
현재 다니고 있는 회사보다 상위 등급의 회사를 꼽을 수 있는가?
-
최근 회사에서 다른 사람에게 자랑할 만한 성과를 낸 적이 있는가?
또 관련해서 정확한 지표가 있는가?
-
면접에서 자신의 직무상 강점을 무엇이라고 이야기할 것인가?
적어도 세 개 이상의 질문에 명확한 답변을 할 수 있어야 한다.(20~21)


이유 없는 이직은 하지 말자.
목적 : 이직하고 싶은 이유는 무엇인가(
)
가치 : 정말 이직할 만큼 가치 있는 곳인가()
적응과 성공 : 확실히 적응해서 성공할 수 있는 곳인가
(81~82
)


경력기술서는 다음과 같은 순서를 기억하고 작성하는 것이 좋다.
1)
자신이 지원한 직무에서 요구되는 역량이 무엇인지 파악
2)
상대방에게 빠른 시간 내에 전달 가능하도록 단락 구성
3)
차별화된 포인트를 강조(93)


면접관을 압도하는 다섯 가지 기술
- 30
초 안에 5문장으로 말하라.
-
확실한 솔루션을 말하라.
-
감성적인 면을 연결시켜 말하라.
-
논리적으로 말하라.
-
의도에 맞게 말하라.
(119~121
)


당장 이직 생각이 없더라도, 현재의 직장과 직무에서 경력을 쌓고, 몸 값을 높이기 위해서라도 이 책을 읽으면 도움이 될 것 같다. 부록으로 이직의 단계별로 자가 진단할 수 있는 프로 이직러의 셀프 체크 리스트가 실려 있으니, 이직을 준비하고 있다면 준비가 소홀하지 않게 스스로 체크해보는 것도 좋을 듯하다.


* 해당 도서는 출판사로부터 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.



댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo