[eBook] 데이터과학자의 사고법 - 더 나은 선택을 위한 통계학적 통찰의 힘
김용대 지음 / 김영사 / 2021년 3월
평점 :
장바구니담기


합리적인 의사결정의 시작은 상호 비교입니다.

-알라딘 eBook <데이터과학자의 사고법> (김용대 지음) 중에서

데이터과학에 대한 두 번째 오해는 데이터를 위한 기술이라는 것입니다. 데이터과학이란 새로운 정보나 지식을 찾기 위해 데이터를 수집?저장?분석하는 유관 과학기술(예: 통계, 컴퓨터, 통신, 소프트웨어 등)입니다. 위키백과에서는 데이터과학을 통계학?컴퓨터학?응용분야 지식의 융합이라고 정의합니다

-알라딘 eBook <데이터과학자의 사고법> (김용대 지음) 중에서

데이터과학의 핵심에는 데이터로부터 유용하고 새로운 정보를 찾기 위한 합리적 사고방법이 자리 잡고 있습니다

-알라딘 eBook <데이터과학자의 사고법> (김용대 지음) 중에서

변호사의 오류가 시사하는 바는 동일한 사건에 대해서도 이미 알고 있는 정보가 무엇인가에 따라서 확률이 바뀐다는 것입니다. 확률은 고정된 것이 아니고 우리의 지식에 따라 유동적으로 바뀝니다. 이렇게 바뀌는 확률을 ‘조건부확률’이라고 합니다. A가 관심 있는 사건이고 B가 우리가 알고 있는 정보이면,P(A|B)는 B를 알고 있을 때 A의 조건부확률입니다.

-알라딘 eBook <데이터과학자의 사고법> (김용대 지음) 중에서

데이터에는 정보와 잡음이 섞여 있습니다. 데이터과학자의 목표는 데이터로부터 잡음을 제거하고 정보를 추출하는 것입니다. 깨에서 참기름을 추출하듯 정보를 뽑아내야 합니다. 야구통계학자로 명성을 쌓고 미국 대선 예측으로 유명해진 네이트 실버Nate Silver는 그의 책 《신호와 소음》에서 정보를 신호로, 잡음을 소음으로 표현합니다. 데이터 자체는 정보가 아니며 데이터에서 잡음을 제거해야 정보가 나온다는 것입니다.


-알라딘 eBook <데이터과학자의 사고법> (김용대 지음) 중에서

functional MRI라는 의료기기가 있습니다. 뇌의 활동을 실시간 동영상으로 촬영할 수 있는 기기입니다. MRI가 사진을 찍는다면 fMRI는 동영상을 찍습니다. 뇌를 연구하는 데 필수적인 매우 혁명적인 기기입니다.

-알라딘 eBook <데이터과학자의 사고법> (김용대 지음) 중에서

통계적 가설검정에서 기술적으로 어려운 부분은 귀무가설 아래에서 주어진 데이터가 관측될 확률을 계산하는 것입니다.

-알라딘 eBook <데이터과학자의 사고법> (김용대 지음) 중에서


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo