최소한의 데이터 리터러시 - 인공지능 시대를 살아갈 모든 사람을 위한 교양서
송석리 외 지음 / 길벗 / 2024년 2월
평점 :
장바구니담기


데이터 리터러시라는 단어를 들어본 적이 있는가?

 

데이터 리터러시는 데이터 문해력으로 바꿔쓸 수 있다. 즉 데이터를 다양한 방식으로 읽고 이해하고 사용하는 능력이다. 여기에 덧붙여 데이터를 보면서 업무와 관련된 질문을 하고 데이터와 관련된 지식을 배우고 타인에게도 전달할 수 있는 능력까지 가질 수 있다면 금상첨화일 것이다.

 

데이터 리터러시를 위해 우리가 가져야 하는 자세는 아래와 같다.

첫째, 현실을 더 정확하게 파악하고 명확한 근거를 바탕으로 미래를 예측하기 위해 데이터 기반의 의사 결정을 하는 것이 중요하다.

둘째, 관심 있는 데이터에 여러분이 진짜로 궁금한 질문을 던지는 것이 중요하다.

셋째, 데이터를 잘 읽고 쓰려면 데이터에 대한 배경 지식이 중요하다.

넷째, 데이터 분석 방법을 알면 문제 발견 및 해결 능력을 높일 수 있다.

다섯째, 문제에 대한 답을 찾는방법을 배우고 익히는 것을 목적으로 삼고 항상 비판적인 관점을 가지로 데이터를 바라본다.

 

이 책 51쪽에 그 이유를 자세히 설명해 놓았으니 반드시 확인하고 다음 장으로 넘어가기 바란다.


이 책에 대하여... 

사실 나도 데이터 과학에 대해 관심을 많이 가지고 있고 서서히 관련 자격증도 준비하고 있지만 개념론에 대해 뜬구름 잡는 것 같은 느낌이 많이 든다. 기초가 아직은 덜 준비된 측면이 있기 때문이다.

 

이 책은 이러한 사람, , 위에 나온 나와 같은 고민을 가진 사람에게 유리한 책이다. 왜냐하면, 이 책은 데이터 과학과 데이터 분석을 위한 이해를 돕기 위해 4명의 수학 선생님이 쓴 책이기 때문에 중고등학생이 이해할 수 있도록 쉽게 쓰면서도 다뤄야 할 기초 용어 및 개념은 다루고 있기 때문이다.

 

이 책은 크게 데이터 리터러시를 시작하는 시간, 데이터 리터러시를 기르는 시간. 데이터 리터러시를 활용하는 시간 3부분으로 나눌 수 있다.



 

1데이터 리터러시를 시작하는 시간은 데이터 과학의 세계로 입문하는 시간이다. 데이터 과학의 개요에 대하여 설명하고, 어떻게 문제를 해결하는지를 간략하게 보여주며, 데이터 과학에 대해서 어떤 자세를 가져야 하는지를 위와 같이 알려준다.

 

2데이터 리터러시를 기르는 시간은 데이터 과학을 이해하기 위해 필수로 알아야 하는 개념을 알아가는 시간이다. 아래와 같은 개념을 알게 될 것이다.

 

유클리디안거리, 평균, 대푯값, 산점도, 사분위수 범위, 상관관계 단항과 다항회귀, 1종 오류와 제2종 오류, 심슨의 역설, 피어슨 상관계수, 베이즈 정리 등

 

위의 개념을 영화의 제작비와 관객 수의 상관관계, 학교 성적, 각과별 대학 성적, 코로나19 진단 키트의 사례를 들면서 알기 쉽게 설명한다. 이 장을 다 읽으면 알 수 있는 가장 기본적인 것은 데이터 리터러시를 위해서는 용어, 특히 통계학과 수학 용어에 대한 이해가 중요하다는 점이다.

그리고 오렌지3 프로그램을 통해 소프트웨어로 데이터를 처리하고 분석하면서 위의 개념들을 이해하는 시간을 가질 수 있을 것이다.


오렌지3으로 나타낸 제작비 관객수 산점도와 관계계수 r


오렌지3predictions 위젯을 활용하여 예상 관객수를 출력한 결과



오렌지3으로 나타낸 안전벨트 착용 여부에 따른 사망률 모자이크 플롯

 

실습 데이터는 길벗 홈페이지에서 최소한의 데이터 리터러시 책을 검색하면 다운로드할 수 있다.


 길벗 최소한의 데이터 리터러시 사이트

 

3데이터 리터러시를 활용하는 시간은 위의 개념을 토대로 실생활에서 응용하는 방법에 대해 알아가는 시간이다. 우선 데이터를 통해 나온 그래프를 어떻게 해석할지를 알아보는 ‘WHAT'S GOING ON IN THIS GRAPH?‘ 사이트에 대해서 알아볼 것이고, 기후위기에 대한 인식 조사를 위해서 설문지 작성하는 방법과 설문지를 통해 나온 데이터를 통해 어떻게 데이터를 분석하는지CODAP을 통해 알아보는 시간을 가진다. 그리고 2부에서 배운 산점도를 토대로 기후 변화를 예측하는 시간도 포함되어 있다. 이러한 과정을 거친 후 마지막이지만 가장 중요한 데이터윤리에 대해 생각하는 시간을 가지게 된다.

 

이 책을 읽게 된다면...

일단 이 책을 가지게 된다면, 일단 무작정 읽어본다. 그러다가 내가 모르는 용어를 만나면 표시한다. 두 번째는 읽으면서 모르는 용어에 대해서 찾아보면서 이해한다. 그러면서 ORANGE3 프로그램, CODAP 프로그램을 구동하고, ‘WHAT'S GOING ON IN THIS GRAPH?’ 사이트, 케글, 공공데이터포털, 기상자료개방 포털 등 책에 소개된 사이트를 방문해서 책에 나와 있는 대로 자료를 다운받고 실습을 해보자. 어려웠던 개념에 대하여 좀 더 쉽게 이해할 수 있을 것이다.

 

사실 나도 이 책을 보면서 뉴욕 타임스 사이트 중 이런 사이트가 있을 줄 몰랐고, 새롭게 나오거나 알게 된 프로그램을 보면서 세상 살기 참 편해졌구나. 그리고 공부하기도 점점 편해지는구나를 느낄 정도였다. 새로운 프로그램(또는 애플리케이션)과 사이트를 알고 다음에 활용할 수 있다.

 

또한 저자가 학교 선생님이다 보니 영화, 학교 성적, 대학 입학 성적, 기온 변화, 코로나19 진단키드 등 학생에게 관심이 많을 것 같은 주제에 대해서 다양한 예를 들면서 다루고 있다. 하지만 디지털 리터러시에 대해 잘 모르는 성인에 대한 배려도 잊지 않았다. 위의 사례들이 학교에서 배우는 것뿐만 아니라 실제 사회생활에서 맞닥뜨릴 수 있는 문제이기 때문이다.

 

다만, 3부의 15장 설문지 조사의 경우 별도로 실습 파일을 만들어서 CODAP 실습에 바로 적용할 수 있게 준비했으면 어떠했을지라는 생각이 든다. 오렌지 3에 관해서는 책에 사용법과 실습 방법이 자세하게 나와 있지만 CODAP은 그런 실습 방법이 나와 있지 않다.

 

CODAP 초기화면


마치며...

4차 산업 시대를 들어서면서 데이터 과학의 중요성은 하루가 다르게 중요해지고 있다. 데이터 활용은 우리 삶을 송두리째 바꿔놓고 있다. 데이터를 활용하지 못하면 도태될 수도 있는 세상이다. 학생들과 데이터에 대해서 잘 모르고 감을 못 잡는 성인이라면 이 책을 통해 데이터의 세상에 빠져들어 보자. 데이터는 당신에게 문제점을 알려줄 것이고 해결책을 제시해 줄 것이고 세상을 발전시킬 수 있는 첫걸음을 내딛게 할 수 있을 것이다.

 

 

[이 서평은 출판사 리뷰 이벤트에서 도서를 제공 받았으며, 작성자의 주관적인 견해를 토대로 작성하였습니다.]


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo