처음 처음 | 이전 이전 | 1 | 2 | 3 | 4 | 5 | 6 |다음 다음 | 마지막 마지막
확률적 프로그래밍 기초 원리 : 머신 러닝과 인공지능을 이해하는 또 다른 방법 에이콘 프로그래밍 언어 시리즈
신승환 지음 / 에이콘출판 / 2015년 9월
평점 :
장바구니담기


## Intro


요즘 종종 **베이지안 네트워크(Bayesian network, BN)를** 활용하는 논문이 보인다. 예를 들어 산불관련 논문에서는 산불 발생과 관련된 인위적, 자연적 인자를 나열한 후 각 인자 및 인자간 조합에 따른 산불 발생 확률을 분석했다. 


**베이지안 네트워크**에 흥미를 조금씩 가져가던 차에 과학원 도서관에서 이 책을 발견했다. 총 4부 중 실습과 관련된 3, 4부를 제외하고 1, 2부만 읽어보기로 했다. 개략적으로 살펴보는 게 목적이니까.


## Bayesian network


### Description


간단히 정리하면


**베이지안 네트워크란** 특정 상황에 대한 지식들을 원인과 결과의 형태로 표기하는 그래프를 말한다. 베이지안 네트워크는 명제를 벽돌삼는 몇 가지 형태(순차, 발산, 수렴)의 노드로 이루어져 있다. 이 벽돌을 구성하는 개념(확률, 조건부 확률, 진리표, 주관적 확률 등)은 1장~8장에서 설명하고 있다. 네트워크를 이루는 **각 노드의 발생 확률을 정량적으로 구해서 이해하기 쉽게 표현하고 예측 및 추론에 사용**할 수 있는 도구다.


인자가 많아질 수록 네트워크가 복잡해질 수 있는데, 베이지안 네트워크에서는 각 노드 간 독립성(자신, 부모, 자손을 제외한 모든 노드) 성질을 이용해 **네트워크를 단순화**할 수 있다.


### Why BN?


이와 관련된 설명은 7, 8장에 잘 나와있다. 결론적으로 BN에서 사용하는 **베이지안 확률(주관적 확률)로 현실을, 사람의 사고 과정을 잘 표현할 수 있기 때문**이다.


#### 객관적 확률과 주관적 확률


**객관적 확률**에서는 참, 거짓 혹은 그 사건이 발생할 확률이 딱딱 계산된다. 반면, **주관적 확률**(vs 객관적 확률)에서는 사람마다 느끼는 **사전 확률**이 사건 발생 후 **사후 확률**로 수정되는 과정이 발생한다.


#### 베이지안의 현실성


실제로 **사람들은 베이지안과 비슷하게 추론**한다. 증거를 본 후 기존 믿음에 변화를 준다. 


게다가 현실에서는 참/거짓으로 딱딱 나눠지는 상황, 단순한 인과관계를 갖는 상황이 아닌 경우가 많다. 참인 것 같으면서 어느 조건이 만족하면 거짓이 되는 등... 매우 복잡하다. 확률과 명제를 함께 사용하면 더 많은, 복잡한 정보를 **현실에 가깝게 표현할 수 있다**.


## Bayes theorem & likelihood


- 베이지안 정리 및 가능도(우도, likelihood)를 이해하는 데 조금 도움이 됐다. **도움이 됐다**는 것은 이 책이 특별히 설명을 잘 해서라기보다는 여러 번 이 정리와 용어를 봐오던 중 지금 우연히 이해도가 올라갔을 수 있다. **조금** 도움이 됐다는 것은 이 책이 설명을 못했다기보다는 원래 저 용어와 정리가 직관적으로 받아들이기 힘들다는 뜻이다.

- 베이지안 정리는 **사후확률 = 가능도 x 사전확률 / 증거**로 쓸 수 있다. 수두가 발생하는 사건이 H, 붉은 반점이 보이는 사건이 D라고 하자. **구하고 싶은 것은 P(H|D)**, 즉 붉은 반점이 보일 때 수두일 확률이다. 베이지안 정리로 풀면 **P(H|D) = P(D|H) x P(H) / P(D)이다**. 수두는 한 천 명에 한 명 걸리나(사전확률)? 여기에 수두에 걸린 사람이 그 증거(붉은 반점)를 보일 확률(내 사전 믿음에서 해당 증거가 발견 될 가능성, likelihood)을 곱하고, 이것을 증거가 발생할 확률로 **스케일링**해준다.

- 스케일링 해준다는 것은 전체 H집합 중 D에 해당하는 것으로 상정 범위를 좁혀준다는 뜻이다. **사후확률오즈**(두 베이지안 모델의 사후확률 비율)를 구할 때는 고려하지 않아도 된다. 두 모델 모두 P(D)를 분모로 하여 계산 중에 약분되기 때문이다. 이런 점에서도 P(D)로 나누는 것은 단순히 스케일을 조정하는 기능(표준편차 구할 때 제곱근을 구하는 것처럼)으로 볼 수 있을 것 같다.


## Others


- **6장 초반에 나오는 가능도에 대한 설명은 틀린 것 같다**. 주어진 데이터를 기반으로 가설이 맞을 확률을 구하기 때문에 **가능도 = P(H|D)라고** 써 있는데, 앞 장의 표기방식이 변한 게 아니라면 **가능도는 P(D|H)가** 맞는 것 같다.

- **설명이 친절하다**. 개념, 상황 등 설명을 정의 한 줄, 요약 한 줄로 끝내는 게 아니라 정의, 여러 예시와 자세한 풀이, 뒤에서 한 번 더 요약하고 다른 장에서 반복하기까지... 나는 이렇게 말하듯 자세히 풀어 설명해주는 게 좋다.

- **요약이 잘 돼있다**. 첫 번째와 비슷한 장점이다. 장 끝마다 몇 포인트로 요약을 해뒀는데, 이것만 가볍게 읽어도 감을 잡을 수 있을 정도다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
우리 몸이 세계라면 - 분투하고 경합하며 전복되는 우리 몸을 둘러싼 지식의 사회사
김승섭 지음 / 동아시아 / 2018년 12월
평점 :
장바구니담기


우리에게 필요한 지식을 만드는 일에 관하여


뒷표지에서 이 문구를 본 후 나는 이 책을 집어들어 서점을 나왔다. 이전에 김대식 교수의 어떻게 질문할 것인가를 읽을 때 기대했던 것처럼 혹시 질문하는 방법에 대한 내용이 담겨있을까 생각했다. 비록 이런 내용은 없었지만, 올해 읽은 최고의 책으로 꼽겠다.


김승섭 교수가 전공하는 역학(Epidemiology)은 인구집단에서 질병의 원인을 탐구하는 학문(p. 252)이다. 이 책 전반에는 1) 사회의 부조리함이 어떻게 특정 인구집단의 질병 발생에 영향을 미치는지에 대한 이야기가 담겨있다. 이 이야기의 중심에는 지식 생산의 주요 수단인 과학이 있다. 김승섭 교수가 소개하는 사례 중 다수는 이해 관계, 사회적 분위기 등이 과학하기와 콜라보하여 잘못된 방식으로 연구가 진행된 것이 원인이었다. 김승섭 교수는 과학이 어떻게 잘못 진행되었는지를 밝히면서 2) 올바르게 과학하는 방법에 대한 이야기를 함께 들려준다. 첫 번째 이야기는 PD수첩 등 사회 고발 프로그램을 보는 듯 흥미로우면서도 공감할 수 있는 부분이 많다. 특히 이 부조리가 다른 나라, 다른 인종뿐만 아니라 우리나라에서도 진행되고 있음을 보여주기에 스스로를 돌아보게 한다. 두 번째 이야기는 과학을 잘못된 길로 인도할 수 있는 요소가 무엇인지를 알려준다는 점에서 나처럼 과학을 하는 사람은 물론 과학 지식에 노출되고 소비하는 모든 사람들에게 유익할 내용이다.

우리가 과학의 목소리를 신뢰하는 것은 결론에 도달하기까지의 합리적 사고 과정 때문이지, 그 결론이 진리를 담보하기 때문이 아닙니다.” (p. 241)


과학은 합리적 사유를 기반으로 하기 때문에 오늘날 가장 신뢰받는 지식 생산 방법이지만 그 대상, 방법, 심지어 결과까지도 아래와 같은 외부 압력에 노출될 수 있었다.


-      

n  “1. 권력에서 담배회사가 어떻게 연구자를 섭외해서 원하는 결과를 얻고, 그 결과를 경영에 이용했는지 이야기한다.

-       국력

n  “1. 권력에서 신약 개발은 실제로 가장 사람을 많이 죽이는 병이 아닌, 고소득 국가에서 가장 필요로 하는 치료제 위주로 진행됨을 이야기한다.

n  “2. 시선에서 일제가 동아시아 침략을 정당화하기 위해 어떻게 과학 지식 생산에 관여했는지 이야기한다.

-       인종

n  “3. 기록에서 흑인에 대한 사회적 차별이 어떻게 그들의 건강을 악화시켰는지 이야기한다.

n  한국사회 또한 인종차별 문제를 가지고 있다고 지적한다(pp. 160-163, 170-176). “한반도만 벗어나면 한국인은 전 세계 모든 곳에서 소수자라는 사실을 함께 기억했으면 합니다” (p. 178). 이 문구는 모든 특정 집단 내 기득권에게 적용할 수 있을 것 같다. 기득권층을 보호해주는 울타리가 없을 때를 생각해볼 수 있도록.

n   “5. 시작에서 흑인 매독 환자를 치료하는 대신 생체실험 대상으로 사용한 터스키기 사건을 소개해준다.

-       성별

n  “1. 권력에서 성별에 따라 병원의 처방이 어떻게 달라지는지 보여준다.

n  “1. 권력에서 기존 의학 지식의 상정하는 표준 대상은 성인 남성이었으며, 이렇게 만들어진 지식이 여성에게 어떤 피해를 줬는지 이야기한다.

n  “4. 에서 전염병 환자 돌보는 일을 여성이 맡음으로써 여성의 질병 사망률이 높았다는 이야기를 한다.

-       권위

n  “5. 시작에서 종교적 세계관의 권위에 도전한 사례를 보여준다(갈릴레오 등).

n  “6. 상식에서 기존 패러다임(갈레노스)의 권위에 맞선 사례(베살리우스, 하비, 제멜바이스)를 보여준다.


위의 항목 중 사회적 차별과 관련 있는 것들도 있는데(인종, 성별, 국력), 이로 인해 터스키기 사건처럼 비윤리적인 연구가 탄생할 수도 있다고 경고한다. 터스키기 사건은 미국 정부까지 그 차별을 진행하도록 승인했던 충격적으로 비윤리적인 연구였다. 터스키기 사건의 백인 과학자들이 그 흑인 집단은 연구를 위한 조건에 부합하는 완벽한 집단이었습니다라며 결백을 주장하는 것은 그들이 흑인의 생명을 존중하지 않았다는 것의 반증이 된다. 만약 그 연구 집단이 그들의 가족이었다면 그 때도 지식 생산의 사명감을 유지할 수 있었을까?


흑사병, 역병 등 공포스런 전염병 때문에 주변사람이 실시간으로 죽어가는 상황에서 과거의 제한적인 지식을 가지고 어떻게든 대응하려 노력하던 모습이 아주 처절해보였다. 얼마나 무서웠을까. 이 공포 때문에 결국은 종교에 기대거나 마녀 사냥 등 다른 피해자를 만들기도 했다.


과학은 데이터로 말한다

외부 압력이 개입한 지식과 더불어 김승섭 교수는 근거가 부족한 지식을 주의하고자 한다. 개인의 경험을 근거로 삼지 말 것(“6. 상식” – 의사 스폭의 조언과 안아키)에서 진행된다. 또한 기존의 지식을 당연하게만 생각하지 말고 실험 데이터로 항상 검증하고 필요하다면 의문을 제기하는 자세를 강조한다.


"지금 내 생각이 틀린 것일 수 있다는 비판적 사고는 인류가 과거의 상식과 맞서 싸우며 이 세상과 인간에 대한 더 나은 설명을 제공할 수 있었던 거대한 원동력이었습니다." (pp. 316-317)


과학 발전

그러나 이 질문이 인류 역사에서 가지는 함의는 결코 가볍지 않습니다.” (p. 247)


중학교 과학시간에 탈레스가 세상이 물로 이루어져 있다고 한 것, 엠페도클레스가 세상은 4개 원소로 이루어져 있다고 한 것 등 고대 그리스 과학자들이 세계를 구성하는 물질에 대해 어떻게 생각했는지 배운 적이 있다. 그때는 단순히 옛날 사람들이 세계를 어떻게 생각하고 있었는지 배우는 정도, 과학 교과서 초반에 등장하는 준비운동과 같은 딱히 어렵지 않은 가벼운 내용 정도로 생각했었다.


이 책에서는 고대그리스 사람들이 세상을 구성하는 물질에 대해 질문할 당시의 상황을 함께 설명해준다. 당시에는 세계관, 과학 등 대부분의 활동에 종교가 관여하고 있었다고 한다. 신들의 가르침에 기대지 않고 스스로의 사유로 세계를 설명하려는 노력의 시작 중 하나가 고대 그리스 사람의 자연철학인 것이다. 비록 그들은 정확한 설명을 내놓지 못 했지만, 그 시도로 인해 인류가 세계를 구성하는 물질에 대해 스스로 고민하게 되었고 오늘날의 지식을 가질 수 있었던 것이다. 더불어, 합리적인 사유를 통해 질문에 답하는 방법이 다른 분야에도 적용되기 시작하면서 오늘날 우리가 과학이라고 부르는 학문이 발전할 수 있던 것이다. 토마스 쿤의 <과학 혁명의 구조> 내용과도 잘 들어맞는다.


여섯 소제목

김승섭 교수는 두 글자의 낱말 여섯 개를 사용해 이 책의 소제목을 구성했다. 낱말 선정을 참 기가막히게 해놨다. 예를 들어 두 번째 소제목 시선은 세 개의 부제로 이뤄져 있다. 첫 두 개는 일제가 어떻게 지식을 왜곡시켰고 이를 식민지배에 어떻게 활용했는지를 이야기하고, 마지막에서는 조선시대에 새로운 지식을 만들고자 노력했던 세종에 대해 이야기한다. 일제에 대한 이야기를 읽고 나서 1장과 크게 다르지 않다고 느꼈다. 왜 굳이 제목을 시선이라고 두었을까 의문을 품었다. 세종에 대한 이야기를 읽고 나서 제목 참 잘 지었다는 생각을 했다. 2장을 보는 것과 보지 않는 것이라 소개했는데, 세종이 정말로 조선에 필요한 지식을 고민했던 부분이 보는 것이라면 일본인이 지식을 왜곡한 것이 보지 않는 것이다. 이 둘의 대비가 2장의 제목이 된 것이다. 각 제목이 어떻게 지어졌는지는 각 장의 프롤로그(혹은 장 요약)를 보면 짐작할 수 있다.


글 쓰는 방식

김승섭 교수의 문장 전개 방식은 담담하면서 신사적이고 명료하다. 읽기에 부담이 없다. 또한 구체적인 근거를 자주 보여주기 위해 논문 결과를 자주 인용하는데, 정리가 아주 잘 돼있다. 무엇을 위해 무엇을 했고, 어떤 결과가 나왔다는 등의 내용을 읽고나면 전혀 모르는 논문이라도 개요는 다 파악한 것 같이 느껴진다.


또한 재미있게 전개하고 맺을 줄 안다. 각 장이나 문단의 도입부에서는 재미를 위해 서술 순서를 바꾸기도 한다. 예를 들어 28쪽에서는 소설 줄거리부터 요약한 후 어떤 소설의 줄거리였고 왜 이를 언급했는지 진행해나간다. 인용구로 시작하는 경우도 있고(31, 33쪽 등), 이전 문단의 질문을 답변하는 식으로 시작하기도 한다(102). 마무리에서는 책 내용과 어울리는 시를 인용하기도 한다. 55, 56쪽에서는 고정희의 시를 인용했는데, 마치 담배회사의 미사여구와 같은 광고 전략을 적이 숨어 있는 꽃밭으로 비유한 것 같다.


담배회사의 전략을 보며, 고정희 시인의 시 한 구절이 떠올랐습니다” (p. 55)

 

기타

"인연이 닿는 연구를 한다." (조선일보 인터뷰 중) : 나 역시 인연이 닿아 지금의 연구를 하고 있다. 내 연구는 이 땅에 필요한 지식인지, 필요한데도 생산되고 있지 않은지, 혹은 필요 없을지


"단언컨대 저는 누군가의 멘토가 될 생각이 없어요. 이렇게 얘기해보죠. 심리학 등 많은 기존 연구 결과를 보면 어떤 사람이 창조적 결과물을 내놓는 건 그이의 삶이 가장 안정적일 때입니다. 기업가든 학자든 예술가든 예외가 거의 없어요. 칸트가 철학사에 일대 혁명을 가져온 건 정규직 교수 자리를 딴 이후죠. 우리 사회는 젊은 친구들에게 도전해서 창조적 결과물을 내놓길 요구하지만, 그 바탕이 되는 조건을 마련해주는 데는 별 관심이 없어요. 실제로는 안정적인 환경이 도전과 창조를 낳는데도 말이죠. 그래서 전 학생들에게 무작정 도전하라고 하지 않습니다. 기성세대로서, 학자로서 제가 할 수 있는 건 그들이 덜 불안해할 수 있는 환경을 만들어주는 일이라고 생각합니다." (조선일보 인터뷰 중)


162쪽에서 기술한 연구 방법을 보면 4개 범죄 키워드로 검색한 결과가 21,866건이고 이를 분석 데이터를 사용했다. 저 많은 수의 기사를 직접 인터넷에서 수집한다면 보건학 연구는 대학원생 건강에 좋지 않을 것이다. 이럴 때 코딩이 필요한 것 같다. 이전에 아는 동생 남자친구가 나에게 용돈 벌이 수단으로 웹크롤러를 코딩해보라고 한 적이 있었다. 그때는 새로운 코딩 분야라는 흥미로만 재미있어 했었지만, 의외로 가까운 사람들이 이 코드를 필요로 할지도 모르겠다.


163-176쪽에서 카마라 존스 교수의 인종차별이 차별 받는 사람의 삶에 미치는 영향에 대해 쓴 논문을 소개하는데, 그 논문의 전개 방식이 아주 흥미롭다. 한 이야기로 시작을 한다. 정원사에게 차별당한 분홍 꽃, 꿀벌을 거부하는 분홍 꽃의 내재적 차별에 대한 이야기인데, 논문에서 하려던 말(사회적으로 차별당하고 결국에는 스스로를 차별하게 되는 흑인)과 아주 잘 맞는 비유이다.

과학자들은 집요하면서도 정밀한 노력으로 작지만 튼튼한 이야기들을 쌓아 올립니다” (p. 207)



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
과학자의 글쓰기
최병관 지음 / 지식여행 / 2019년 3월
평점 :
장바구니담기


이 책은 좋은 국내 과학 저서를 여러 권 소개해준다는 점에서 가치 있다. 또한 글 쓸 때 고려해볼만한 기본적이면서도 유용한 지침들도 함께 담겨있다.


그냥 지나칠 수 없는 제목이었다. 작년에 읽었던 기자의 글쓰기가 생각나기도 했다. 곧바로 구매한 후 내 독서 대기 목록에 올려뒀다.


나는 보통 글쓰기 책을 읽을 때는 문장을 쓰는 방법, 문단을 구성하는 방법 등 글쓰는 것 자체에 도움이 되는 방법을 얻고자 하는 마음이 있다. 하지만 이 책에 그런 팁은 담겨있지 않다. 대신, 본격적으로 글 쓰기에 돌입하기 전에 발생할 수 있는 여러 질문에 대답해주고 있다.


목차는 크게 4부로 나뉜다. 1부에서 우리나라 과학 글쓰기 실정을 다루고 2-4부에서 왜, 무엇을, 어떻게 쓸 것지를 다룬다. 글쓴이가 근무하고 있는 한국지질자원연구원을 중심으로 다양한 에피소드를 곁들여가며 읽히기 쉽게 서술했다. 하지만 내가 이 책에서 주목한 건 그러한 자세한 내용보다는 각 부를 구성하는 장의 제목들, 그리고 각 장마다 등장하는 여러 과학저서들이다.


건축에서 설계도만큼 중요한 것은 없다” (176 p)

글쓴이가 4부에서 책 잘 쓰는 방법에 대해 강조한 것 중 하나는 책의 구상을 탄탄하게 하는 것이다. 이 책 또한 탄탄하고 구체적인 청사진을 바탕으로 집필 된 것으로 보인다. 각 부의 제목은 심플하면서도 책의 제목과 잘 맞물려있다.


스테디셀러가 될 수 있는 과학책”, “논문만 쓰는 과학자 vs 책도 쓰는 과학자”, “내 연구 분야가 책이 될 수 있다”, “크고 구체적인 그림을 그린다”, “과학도 인생도 스토리텔링”, “기자가 기사 쓰듯, 교수가 강의하듯 쓰는 글쓰기” (각 부의 소제목 중 일부)

각 부의 소제목들은 그 자체로 좋은 팁이 된다. 혹은 한 번 곱씹을 만한 글귀로 이뤄져 있다. 특별하지 않고 당연한 말들이라 여길 수 있지만, 고민에 닥쳤을 때 생각해볼만한 것들이다. 네 개의 부를 조직한 것처럼 각각의 장들도 잘 구성되어 있다. “이 장에 어울리는 책이라는 코너에서 각 장에 어울리는 국내 과학 도서를 저자의 리뷰 형식으로 추천해준다.


이 책의 또 다른 좋은 점은 글 쓰는 데 용기를 준다는 것이다. 책을 쓰고 싶어하는 사람은 많지만 대부분 어떻게 시작할지 막막해 할 것이다. 글쓴이는 큰 욕심을 버리고 작은 것부터 시작하라고 한다. 블로그에 글 쓰기, 칼럼 연재하기, 매일 하는 강의를 정리하기 혹은 공동저술하기. 한 권을 혼자 다 쓰는 것은 초보 저자에게 매우 부담스런 작업이다. 작은 것부터 시작하여 저자로서 트레이닝하는 단계를 거치라 조언한다.


그 외


우리나라에서는 과학 글쓰기를 정규 과목이나 필수 과목으로 정해 지속적으로 교육하지 않는다.” (p. 38)

나는 학부생 때 스스로 적극적으로 글쓰기를 필요로 하지 않았기에 반 정도 동감한다. 학교에 다니면서 보고서나 에세이를 거의 모든 과목마다 쓰기는 했다. 하지만 글 쓰기 코칭에 초점이 있지는 않았다. 나를 포함해서 많은 학생들은 그 당시에 글쓰기를 훈련할 필요를 느끼지 못한다. 학교의 어른들께서 미리 탄탄한 프로그램을 만들고 따라갈 수 있게 해줘야 한다. 그렇게 변하고 있는 듯하다.


서론과 결론은 서비스 차원에서 두는 것이고, 진짜 중요한 것은 글의 몸통이라고 할 수 있는 본론이다.” (44 p)

정말 그럴까? 논문의 경우, 모든 과학자들은 자신의 세부 분야만이라도 관련 논문을 다 읽기 힘들어한다. 새로운 논문이 너무 많고, 한 논문을 제대로 읽으려면 시간이 오래 걸리기 때문이다. 그래서 나는 각 논문이 어떤 배경에서 어떤 연구를 하게 되었고 어떤 메시지를 주는지 파악하는 것이 논문 읽기의 첫걸음이라 생각한다. 그 이후에야 본론까지 제대로 읽을 논문을 선택하는 것이다.


“’내가 읽고 싶어 하는 책이 없어서 직접 쓰게 됐다.’” (91 p)

정재승 교수가 한 말이다. 그런 책을 쓸 수 있다니 멋있다. 나는 무슨 책을 읽고 싶을까.


화성은 지구에서 가까운 것은 물론 여러 가지 면에서 지구와 닮아, 인류가 이주하기에 가장 적합한 위성으로 알려져 있다” (160 p)

내가 고등학교 지구과학시간에 배우기론, 화성은 위성이 아닌 행성이다.


이 책을 한 번 다 읽고 처음 든 느낌은 그저 그런 책이었다. 하지만 책 리뷰를 쓰기 위해 뒤적거리면서 내 느낌은 바뀌었다. 글 쓰는 것과 마찬가지로 읽기도 여러 번 하면 장점이 있는 것 같다.


이 장에 어울리는 책에서 소개된 책 목록


1.     임재춘, 한국의 직장인은 글쓰기가 두렵다, 북코리아, 2005

2.     임재춘, 한국의 이공계는 글쓰기가 두렵다, 북코리아, 2006

3.     강호정, 과학 글쓰기를 잘 하려면 기승전결을 버려라, 이음, 2007: 목적, 대상에 따른 글쓰기 방법 정리. 논문 투고 과정 조언.

4.     탁석산, 글쓰기에도 매뉴얼이 있다, 김영사, 2005

5.     정희모, 이재성, 글쓰기의 전략, 들녘, 2005: 15년간 글쓰기를 가르쳐온 저자들이 정리한 글쓰기 관련 원리와 방법론.

6.     신형기 외, 모든 사람을 위한 과학 글쓰기, 사이언스북스, 2006: 인문학자와 과학자가 함께 쓴 과학 글쓰기 책

7.     남궁인, 만약은 없다 응급의학과 의사가 쓴 죽음과 삶, 그 경계의 기록, 문학동네, 2016: 숨결이 바람 될 때와 비슷할 듯?

8.     엄융의, 내 몸 공부 건강한 삶을 위한, 창비, 2017: 서울대 강의 우리 몸의 이해를 엮은 책.

9.     테드 윌리엄스, 타격의 과학 메이저리그 마지막 4할 타자의 야구 이야기, 이상, 2011

10.  정재승, 정재승의 과학 콘서트, 어크로스, 2011(개정증보판): 과학을 이야기로 이끌어나가는 방법을 제시해준 책.

11.  강양구, 세 바퀴로 가는 과학 자전거, 뿌리와이파리, 2009

12.  이정모, 공생 멸종 진화, 나무나무, 2015

13.  이한승, 솔직한 식품, 창비, 2017

14.  여인형, 퀴리부인은 무슨 비누를 썼을까?, 한승, 2007

15.  박기화, 제주도 지질여행, 한국지질자원연구원, 2013

16.  송길영, 여기에 당신의 욕망이 보인다, 쌤앤파커스, 2012

17.  김범준, 세상물정의 물리학, 동아시아, 2015

18.  이윤석, 웃음의 과학, 사이언스북스, 2011: 이윤석이 과학책을?

19.  심진보 외, 대한민국 제4차 산업혁명 새로운 미래를 위한 전략과 통찰, IDX, 콘텐츠하다, 2017



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
신이 내린 필력은 없지만 잘 쓰고 싶습니다
심원 지음 / 은행나무 / 2019년 3월
평점 :
장바구니담기


  나는 여러 권의 글쓰기 관련 책을 읽었다. 그 중 한 권을 추천한다면 영문 도서는 Joshua Schimel“Writing Science”, 한글 도서는 이 책을 추천하겠다. 두 책 모두 단순, 명확하면서도 특정 종류가 아닌 일반적인 글쓰기에 통용될 수 있는 원칙을 다루고 있다.


글쓰기


질문은 문장-기계를 돌리는 연료다. 한 문장을 쓰고 적절한 질문을 한 후 답하면, 다음 문장이 나온다. 문장을 지배하려면 질문을 지배해야 한다. 질문이 멈추면 문장도 멈춘다… 질문을 통해 문장을 이어나가는 방식은 아주 단순하면서도 강력하다. 그 문장을 왜 썼고 왜 그 자리에 위치시켰는지 대답을 줄 수 있으면서도, 반대로 글 쓸 때 자연스레 이를 고민하게 해준다.” (61-62 pp)


  먼저 이 책에서는 몇몇 유용한 질문을 소개한다. 이 질문에 대답한다는 생각으로 글을 쓰면 자연스레 탄탄한 문단이 완성된다. 흥미롭게도, 이 질문은 한창 호기심 많은 유치원 아이들이 잘 하는 ?”와 비슷하다. (최소) 두 번 질문하기. 이것이 핵심이다.


  저자는 글쓰기 과정을 사실(말과 행동) à 질문 à 견해로 구분한다. 가운데 단계에서 저자가 말하는 ?”가 등장한다. ?”에는 여러 의미가 있다. 다루는 사실에 대해서 왜 그런데?” “그러면 어떻게 되는데?” “그게 왜 중요한데?” 등의 의미로 쓰일 수 있다. 이 질문들은 각 문장을 탄탄하게 이어 붙여주는 역할을 한다. 이에 대해 대답하면서 자연스레 탄탄한 글이 완성된다. 가령 논문을 쓴다고 하면, 다루는 사실은 데이터가 될 것이고, “왜 이런 결과가 나왔는데?” “이게 왜 중요한데?” 등의 내용이 고찰에서 다뤄질 것이다.


좋은 글의 기준이 하나일 수는 없겠지만, 적어도 말하는 바가 분명한 글을 좋은 글이다. 말하는 바가 분명한 글은 궁극적으로 답하고자 하는 하나의 화제에 대응하는 하나의 결론을 담는다. 그러나 글쓰기 초보는 자신이 쓴 모든 문장을 소중하게 생각하기 때문에 어떤 문장이 가장 중요한 문장인지 제대로 결정하지 못한다.” (189 p)


  명확한 글을 쓰는 방법에 대해서도 언급한다. 여기에도 앞서 나온 질문들이 사용된다. 그리고 몇 개 개념이 추가된다. “주제어란 사실에서 견해로 도약하기 위해 사용하는 최초의 씨앗 개념이고, “화제란 주제어로부터 만들어낸 질문이다. 이 질문에 대답하는 것으로 견해를 밝히고 나름의 결론을 제시한다. 여기서 결론은 여러 가지가 있을 수 있고 자신만의 결론을 뒷받침 근거와 함께 제시한다.

  명확한 글을 쓰기 위해서는 다루는 주제어가 무엇인지, 주제에 대해 어떤 이야기를 할 것인지 분명히 밝히고 그에 벗어나지 않게 전개해야 한다. 글을 쓰다 보면 특별히 마음에 드는 문장이 만들어질 수 있지만, 화제에서 벗어난 내용이라면 과감히 잘라낼 수 있어야 한다. 화제부터 시작하여 화제에 대한 대답과 그 대답에 대한 질문, 그리고 그에 대한 대답을 반복하여 논리 구조를 갖춘다. 그렇게 하면 주제어 제시 à 화제 제시 à 결론 제시라는 직관적, 효과적인 구조를 갖춘 글을 쓸 수 있다. 초고는 편하게 쓰되 퇴고 중에 위의 질문을 통해 논리 구조와 각 문장의 필요성을 점검한다.

  짧고 구체적으로 쓰되 필요한 정보는 모두 담아내야 한다(135 p). 이를 위해서는 해당 언어의 어휘력을 길러야 할 것이다. 분량이 제한된 자기소개서, 제안서 등의 글을 쓸 때도 물론 중요하고 분량 제한이 없더라도 독자를 위해서, 글의 완성도를 위해서 꼭 필요한 능력이다. 단어뿐만 아니라 어떤 내용을 썼는지, 안 썼는지도 꼭 고려해야 한다. 이와 관련해 아래와 같이 언급하고 있다.


따라서 모든 것을 있는 그대로 재현하겠다는 불가능한 시도는 일찌감치 포기하되, 어떤 경우에도 거짓 사건을 지어내지는 말아야 한다. 또한 늘 자신이 쓸 수 있었지만 쓰지 않은 것이 무엇인지 생각하고, 왜 그것을 쓰지 않았는지 스스로 이해할 만한 설명을 할 수 있어야 한다. 때에 따라서는 거짓말을 하는 것보다 말하지 않는 것이 더 큰 문제가 되기 때문이다.” (165 p)


글읽기


읽기가 안 되는 이유는 읽기만 하기 때문이다.” (200 p)

창의력이란 존재하지 않는 것을 창조하는 능력이 아니라 남들이 파악하지 못하는 사물과 사태의 본질을 정확하게 꿰뚫어 보고 그것을 드러내는 능력이다.” (207 p)


  글을 읽는 방법도 다룬다. 마찬가지로, 앞서 다룬 글 쓰는 방법을 적용한다. 이 글을 쓸 때 어떤 질문을 했고 어떤 의도로 구성 했는지, 어떤 질문으로 문장을 이어 붙였는지 고민하며 읽어야 한다.


기타


공부란 지식과 정보를 머릿속에 잔뜩 집어넣는 게 아니라 끊임없이 새로운 기준을 마련하고, 그것들을 돌려 써가면서 대상으로부터 다양한 의미를 추론하는 방법을 배우고 익히는 것이다. …… 멍청이가 되고 싶지 않다면, 세상이 무지갯빛이라는 것을 인정해야 한다. 그리고 자신이 쓴 색안경은 무지갯빛 세상을 이해하기에 형편없다는 것도 인정해야 한다. 그러나 일단 어떤 색안경이든 썼다면 물러서지 않고 끝까지 밀어붙여야 한다. 그 다음에 미련 없이 색안경을 벗을 수 있어야 한다.” (p 228)


  보통 논문 한 편에는 주로 사용하는 색안경이 적어도 하나 있다. 가령 같은 결과라도 이에 대한 우수함을 강조하려는 논문과 보완이 필요하다는 주장을 하려는 논문에서의 해석은 서로 다를 것이다. 하나의 색안경이 전능하지는 않다. 그 색안경으로만 볼 수 있는 것이 있는 반면 볼 수 없는 것도 있다. 이 양면을 꼼꼼하게 보여주거나 다른 색안경과 비교하는 것으로도 괜찮은 논문을 쓸 수 있다. 이 과정을 거치면서 내가 가진 색안경을 어떤 상황에서 사용해야 하는지, 어느 부분을 개량할지, 아니면 버릴지 판단할 수 있을 것이다.


  글쓰기를 벽돌 쌓기에 비유했다(97 p). 단어 뜻을 정확히 알아야 튼튼한 벽돌을 만들 수 있다. 여러 개의 근거로 타당성을 높이는 것을 튼튼한 벽돌이 여러 장 있어야 튼튼한 구조물을 만들 수 있다고 표현했다. 적절한 질문으로 문장을 긴밀하게 연결하는 것은 시멘트질에 해당한다.


좋은 글귀


자신의 경험을 정확하게 기록하고, 그 속에서 좋은 질문을 발굴하여, 그에 관한 견해를 다른 사람이 알기 쉽게 쓰는 방법 (들어가며)

글쓰기는 문법 규칙에 따라 같음과 다름을 배치하여 궁극적으로는 차이를 만들어내는 활동이다. (p 55)

사건만 정확하게 기록할 수 있다면 견해는 언제든 덧붙일 수 있다. …… 문장은 시공간을 압축한다. 이것이 마법의 핵심이다. …… 사실을 기록하는 글은 경험을 재구성하고 압축해야 한다. (133 p)

일상에서 대화 중 일부를 기록하는 것만으로 좋은 글감이 된다. 이렇게 기록한 남의 말들이 새로운 영감을 주기도 한다. (137p)

자신이 쓰는 문장이 왜 그 자리에 꼭 있어야 하는지를 따질 때, 우리는 글쓰기 과정 전반을 통제할 수 있다. (149p)

묘사는 이미지를 문장으로 번역하는 과정이며 그 결과는 문장으로 그린 그림이다. (153p)



댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
프로그래머를 위한 선형대수
히라오카 카즈유키.호리 겐 지음, 이창신 옮김 / 길벗 / 2017년 3월
평점 :
장바구니담기


선형대수 학점을 높이고 싶거나 선형대수에 관한 직관을 키우고 싶다면 꼭 읽어야 할 책이다.


논문을 읽다 보면 가끔 어려운 수학 표현이 등장하는데, 이를 이해하지 못하는 경우가 있다. 이해하지 못하면 써먹을 수도 없으므로 내가 손을 뻗을 수 있는 참고 문헌의 범위가 수학 때문에 줄어들게 되는 것이다. 그리고 통계 관련 자료도 조금 깊이 있는 설명을 원하면 어려운 수학이 꼭 등장하고 비슷한 어려움을 겪는다. 이런 일 때문에 수학을 공부할 필요성을 느낀다.


먼저 잡힌 건 선형대수학이다. 내가 선형대수학을 공부할 때 힘들었던 건 교재의 설명을 뚜렷하게 상상할 수 없었다는 것이다. 다른 도움이 될 만한 자료를 찾다가 “coding the matrix”라는 책을 발견했다. 시각화를 해주기 때문에 이해가 수월할 것 같으면서도 파이썬 공부도 겸할 수 있을 것 같았다. 하지만 막상 책을 보니 쓸데없이 크고 묵직했다. 속지 또한 출판사에서 하나도 다듬지 않은 미완의 강의 자료 같았다. 사서 볼 의욕이 뚝 떨어졌다.


그 후 발견한 책이 이 책이다. 계산 방법, 정의 같은 게 아닌 진짜 의미를 알려주겠다는 표지 광고도 마음에 들었고 책 디자인도 괜찮았다. 그리고 잠깐 살펴보니 Ruby로 만든 애니메이션도 제공해준다. 보기로 결정했다.


공부할 시간까지는 없었기에 주말에 지하철에서 꺼내 읽었다. 책 광고처럼 증명을 자세히 하지 않고 의미 위주로 설명해주는 방식으로 내가 필요한 부분을 잘 채워줬다. 슥 한 번 읽었을 뿐인데도 선형대수가 무엇을 하는 과목인지 그리고 각 용어가 왜 존재했던 것인지도 어렴풋이나마 정리가 되는 것 같다.


책 구성은 단순하다. 이론 관련 세 챕터, 코딩 관련 두 챕터, 그리고 부록이다. 이 중 이론 관련 세 챕터만 읽었다. 첫 번째는 이야기를 풀기 위한 배경지식을 입혀주는 단계로 보인다. 선형공간이 무엇인지, 행렬을 곱하는 게 무엇을 뜻하는지 등이다. 행렬을 곱하는 것이 무엇인지 잘 보여주는 단어는 mapping(사상)이다. 한 선형공간에서 다른 선형공간으로 벡터를 옮기는 것이다. 이 두 선형공간은 좌표 표현 방식이 서로 달라서 같은 벡터라도 mapping 후에는 방향과 크기가 바뀌게 된다. 어떤 행렬은 방향 변환 없이 벡터를 잡아 늘리기만 하고, 어떤 행렬은 벡터를 한쪽 축으로 찌그러뜨린다. 이런 표현 자체도 이 책에서 mapping을 시각적으로 보여주기 때문에 가능하다. 또한 찌그러뜨리는 행렬은 역행렬을 구할 수 없다는 것도 같은 찌그러진 벡터를 만드는 mapping 이전의 벡터가 무수히 많을 수 있다는 점에서 직관적으로 이해할 수 있었다.


두 번째는 배경 지식이면서 동시에 그 자체로 하나의 결과일 수 있을 것 같다. 큰 주제는 역행렬이다. Mapping 전의 벡터와 mapping하는 행렬을 보고 벡터가 어떻게 바뀔지 맞추는 게 순방향의 문제라면, 역행렬은 역방향 문제와 관련된다. , mapping된 벡터 이전의 벡터를 구하는 문제다. 역행렬이 존재하는지 판단하는 수단으로 kernel, image, rank가 이 챕터에 들어있다.


마지막 챕터의 주제는 연립방정식이다. 선형대수의 목적 중 하나가 연립방정식을 푸는 것이라 한다. 연립방정식으로 표현한 시스템을 행렬 표현으로 바꾼다. 현 상태에서 행렬을 한 번 곱하면 t=t+1의 상태가 얻어지는 것이다. 여담으로 여기서 선형대수는 비연속적 시간(이산시간)의 흐름을 다룬다면, 미분방정식은 시간이 연속적으로 흐르는 상황을 고려한다는 점으로 두 과목의 관계를 소개한다. 보통은 앞으로 이 시스템이 어떤 상태로 치닫을 것인지 궁금해한다고 한다. 시스템이 폭주할 수 있고 계속 안정적일 수도 있다. 이 시스템을 표현하는 행렬이 대각행렬이면 이를 쉽게 판단할 수 있다. 대각행렬의 거듭제곱은 대각성분의 제곱으로 쉽게 구할 수 있기 때문이다. 여기서 대각화가 등장한다. 대각화는 시스템이 폭주할 것인지 판단하기 쉽도록 시스템의 표현 방식을 바꾸는 작업이다. 챕터 1에서 행렬을 곱하는 것은 다른 선형공간으로 mapping하는 것이라 했는데, 시스템의 행렬을 잘 바꾸면(=대각행렬로 바꾸면) mapping이 벡터를 방향 변화 없이 잡아 늘리거나 줄이는 변화만 일으키게 된다. 대각화와 관련해 고유벡터와 고윳값이 등장한다. 시스템의 행렬을 대각행렬로 잘 바꾸기 위해 필요한 요소들이다. 대각화가 가능할 것인지 판단하는 데 쓰이고, 대각화에 성공한 시스템이 폭주할지 아닐지 판단하는 기준이 되기도 한다(고윳값의 절댓값). 그리고 이 시스템 변화 방향을 정량적으로 보여주기도 한다(고윳값 만큼 잡아 늘리거나 줄인다). 만약 대각화가 불가능하다면? 이때 요르단 표준형이 등장한다. 요르단 표준형은 대각화했을 때만큼 간단하게 시스템을 파악할 수는 없지만, 대신 모든 시스템에 사용 가능하다는 장점이 있다. 즉 모든 시스템의 행렬은 적어도 요르단 표준형으로는 변환이 가능하고 일부 축복받은 경우 대각화가 가능한 것이다. 학부 때 선형대수 교수님이 교재 새 에디션에서 요르단 표준형이 없어졌음에도 왜 굳이 따로 인쇄해서 나눠주고 공부를 시켰는지, 왜 요르단 표준형은 교재에 꼭 있어야 한다고 하셨는지 그제서야 알 것 같았다.


두서 없지만 대략 이런 흐름이었다. 다시 정리하면 행렬을 곱하는 건 mapping. 역행렬이 존재하는가에 kernel, image, rank 사용. 어떤 연립방정식 시스템을 행렬로 표현. 이 시스템의 폭주 여부를 대각화로 판단. 대각화 가능 여부는 고윳값, 고유벡터로 판단. 대각화가 불가능하면 요르단 표준형 사용. 이 정도가 큰 맥락이고 나머지는 각 개념 관련 배경지식, 계산법, 정리&증명이다.


그냥 지하철에서 읽기만 했는데 이렇게 정리가 가능해졌다. 진작에 읽었다면 내 선형대수 성적이 좀 높았을텐데라지만 그땐 이 책이 없었구나. 어쩔 수 없었나 보다.


댓글(0) 먼댓글(0) 좋아요(3)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
처음 처음 | 이전 이전 | 1 | 2 | 3 | 4 | 5 | 6 |다음 다음 | 마지막 마지막