-
-
우리에게는 다른 데이터가 필요하다 - 차별을 만드는 데이터, 기회를 만드는 데이터
김재연 지음 / 세종(세종서적) / 2023년 9월
평점 :
차별과 기회를 만드는 데이타의 이야기입니다. 그런데 데이타 이야기인데 읽다보면 계속 정부, 관공서의 데이타 내용이 나와서 피곤해집니다. 가망없는 정부 앱을 들으면 속이 타는데 왜 계속 이들을 언급하는 걸까 했더니 저자 김재연 선생이 정치학박사에 정책대학원 교수를 했던 분입니다. 아무래도 관련분야에 있다보니 줄곧 나오는 이야기가 쓸데없이 비대한 정부의 데이터에 대한 안타까움과 걱정이 많습니다.
넷플릭스 자동추천 알고리듬은 과거의 내 취향입력값)에 근거해 내가 보고 싶어할 콘텐츠(출력값)를 예측한다. 넷플릭스가 이용자 한두 명의 데이터만 가지고 있다면, 알고리듬이 이런 예측을 정확하게 하기란 불가능하다. 넷플릭스 추천 알고리듬이 이런 일을 할 수 있는 이유는 나와 비슷한 취향을 가진 수많은 사람들이 이 플랫폼을 이용하기 때문이다. 빅데이터가 알고리듬을 훈련시키고, 알고리듬이 더 많은 데이터(이용자)를 유인한다. 이 선순환이 넷플릭스 같은 디지털 플랫폼의 고속 성장을 이끈다.
44-45p
사기업들의 경쟁은 치열합니다. 그런데 빅데이터의 시작은 정부 데이터라는 말은 충격입니다. 맞습니다. 애초에 주민증부터 원초적인 데이터를 가지고 시작하는 곳이죠. 이렇게 정부는 빅데이터를 모아 뭘 하는지 모르겠습니다.
2장 데이터의 3원칙은 명쾌합니다.
신뢰하기 위해서 의심해야 한다.
날 것의 데이터는 없다.
쓰레기를 넣으면 쓰레기가 나온다.
60p
여론조사결과를 알기 위해 임의로 추출한 3천명이 인스타 이용자 300만명보다 유효하다고 합니다. 백분의 일인가요. 그정도로 편향된다니 어설픈 통계가 무섭습니다.
빅데이터가 더 나은 사회를 만들지 않는다는 멋진 말입니다. 데이터는 데이터일 뿐이죠. 마치 정부가 가지고만 있는 수없는 날 것들입니다.
인공지능은 미래가 아닌 과거를 예측한다는 더 멋진 말입니다. 과거 경험을 축적하여 새로운 데이터에서 동일 패턴을 찾아내기 때문에 예측처럼 보이는 겁니다. 그런데 가끔 과거도 틀리곤 합니다. 인터넷이나 인공지능이 너무 잘 알고 있어 다 알고 있을거라는 기대를 하곤 하는데 교묘한 재주를 가졌을 뿐입니다. 탁월한 부분입니다.
5장부터 저자가 핵심이라고 하는데 정말 이렇게 변화되면 좋겠습니다. 현장의 전문가들의 좋은 연구가 현실에 반영되면 얼마나 좋을까요.
공문서는 더 쉬워져야 한다.
행정용어는 공무원만의 코드다.
시민의 논높이에서 정부 서비스를 디자인하기
정부 서비스의 핵심은 쉽고 간단할 것
혁신의 기준은 인공지능, 메타버스가 아니다. 시민의 편리다.
그러면서 슬쩍 공무원들의 편도 들어줍니다.
공무원에게는 죄가 없다.
불편을 피드백으로 바꿔야 공공서비스가 개선된다.
시민의 불편이 정부에겐 기회가 된다.
맞습니다. 무조건 비난만 할 것이 아니라 바꿀 수 있는 부분, 개설가능한 내용을 알려줘야 알아먹죠. (과연 알아먹을까요)
마지막에 1995년 이전에 인터넷사이트들이 마구 개인정보를 수집했었던 것이 법령이 없어서 막 나간 것이라는 사실은 충격적이었습니다. 그 시절에 자신의 개인정보는 회원가입의 포인트에 불과하던 가치였습니다.
#데이터사이언스
#우리에게는다른데이터가필요하다
리뷰어스 클럽의 소개로 출판사로부터 책을 제공받아 주관적으로 작성한 글입니다.


