쉽게 설명하면, 세포 중에는 고장 난 세포들이 일정 비율로 존재하기 마련인데, 비율이 일정해도 전체 세포 수가 많을수록 이 불량 세포의 영향이 상대적으로 줄어든다는 얘기다. 정상 세포의 절대적인 숫자가 많을수록 생물에게는 유리하다는 소리인데, 우리가 주목할 것은 뭐드지 양이 많을수록 전체적으로 왜곡이 줄어든다는 자연의 이치이다.
정육면체 주사위를 고작 여섯 번 던져서는 1이 나올 확률은 6분의1 이라는 이론을 확인할 수 없다. 1이 아예 안 나올 수도 있고 여섯 번모두 1이 나올 수도 있다. 하지만 6만 번 던지면, 장담컨대 1이 나올 확률이 6분의 1에 아주 근접하게 나올 것이다. 뭐? 아주 아주 말도 안 되는 기적이 벌어져서 6만 번 동안 1이 한 번도 안 나왔다고? 다시 6억 번을 던져라. 이번에는 분명 이론을 따르는 결과가 나올 것이다.
야이, 그럼 네가 던져봐라. 무책임한 말처럼 들릴지도 모르지만 이게빅데이터의 본질이다. 정말 압도적인 양의 샘플이 존재하면 그중 표준에서 벗어나 결과를 왜곡하는 샘플의 영향을 극적으로 낮출 수 있다. 고로 빅데이터를 잘만 활용하면 매우 정확한 예측이 가능하다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 

이런 컴퓨터 수준의 퍼포먼스를 보일 자신이 없다면 계산은 콤퓨터에게 맡기고 우리는 연산과정을 조금이라도 더 효율적으로 수행할 알고리즘을 찾는데 집중하는 편이 낫다


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 

컴퓨터 되는 법을 배우는 우리 컴퓨터 쓰는 법을 배우는 그들


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 

안타까운 점은 이렇게 막대한 비용과 에너지를 들였음에도 우리 아 이들이 과거 몇 시간 동안 풀지 못하는 문제를 두고 끙끙 앓던 나와 같은 길을 걷고 있다는 사실이다.
이 현상은 또 이미 말한 대로 대학은 나와야지.‘라는 풍조 속에서 교육의 초점이 대학 입시에만 맞춰져 있기 때문에 생겨났다. 그러다 보니 학생 입장에서 중요한 건 남들이 맞히는 시험 문제는 나도 맞히고 남들이 틀리는 시험 문제는 나만 맞히는 것이다. 그에 대한 반작용으로 출제 측에서는 수십만 명의 응시자들을 변별하기 위해 문제를 위한 문제‘를 끊임없이 만들어낸다. 이쯤되면 수학이 재밌고 실용적이라고 생각하는 학생에게 정신적으로 문제가 있어 보인다.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 

다음 장에서 나는 당신의 신경망을 양자 역학에 맞게 재배선하는, 돈키호테만큼이나 무모하고 불가능한 작업에 착수할 것이다. 약간의 수식도 없이 말이다. 양자 역학적인 우주에 자통하는 실제적인 도구는 추상적인 수학이다.
무한 차원의 힐베르트 공간,
정사영 연산자,
유니타리 행렬(unitary matrix),
그리고 여타 고등 원리 등은 배우려면 몇 년은 걸릴 내 용들이다. 단 몇 쪽 안에 어떻게 우리가 양자 역학을 배울지 기대하시라.


댓글(0) 먼댓글(0) 좋아요(1)
좋아요
북마크하기찜하기 thankstoThanksTo