코딩 없이 배우는 데이터 과학 - 빅데이터·인공지능 세계 권위자가 제언하는 코딩 없이 배우는 데이터 시리즈
황보현우.한노아 지음 / 성안북스 / 2023년 3월
평점 :
장바구니담기


코딩 없이 배우는 데이터 과학 / 황보현우. 한노아 지음 / 출판 성안북스

최근 빅 데이터와 인공지능에 제 2의 붐이 불고 있다. 2016년 구글 딥마인드의 알파고가 인공지능에 대한 관심을 불러일으켰다면, 2022년 말 출시된 오픈 AI 의 챗 GPT는 인공지능의 활용 영역을 우리의 일상으로 끌어들이고 있다.

인공지능 기술의 추세가 초 거대 인공지능, 창조하는 인공지능, 가벼운 인공지능, 활용성 높은 인공지능을 주목함에 따라 데이터 활용의 방향성 또한 별도의 코딩 없이 데이터를 분석하는 No Code, Low Code로 전환되었다는 점이다.



코딩 없이 배우는 데이터 과학 이 책에서 쉽게 말해 인공지능의 발전에 따라 파이썬이나 R과 같은 프로그래밍 언어의 문법을 배우면서 데이터 학습을 시작하는 것이 아닌, 인공지능 기술에 기반하여 잘 만들어진 도구를 이용해 데이터 과학의 프레임 워크를 이해하고, 바로 실무에 데이터 분석 기법을 활용하는 것으로 중심이 변화하고 있는 것이다.

코딩 없이 배우는 데이터 과학 이 책의 목차는 총 6개의 챕터로 구성되어 소개해 놓은 컴퓨터 공학 도서이다.

데이터 과학은 수학, 통계학, 컴퓨터 공학에 기반한 과학적 접근법을 이용한다.

데이터 과학은 다양한 학문과 산업의 결정체이고, 목적이 아닌 도구이다.

데이터 과학을 배우는 이유는 "더 나은 의사 결정" 을 위해서 이고, 21세기 가장 매력적인 직업으로 데이터 과학자를 소개했다.

코딩 없이 배우는 데이터 과학 이 책의 1장에서는 데이터 과학에 접근하는 방법을 소개했고, 데이터 과학에 접근하는 다양한 관점과 우리가 채택하는 프레임 워크에 대해 설명했다.


데이터 과학은 통계학, 컴퓨터 과학 등 여러 학문에 기반을 둔 학제 간 융합의 산물이다. 따라서 데이터 과학을 제대로 학습하기 위해서는 특정한 이론이나 알리고즘에 매몰되지 않고, 통계 학습과 기계 학습을 궤뚫는 프레임 워크를 정립하는 것이 중요하다.

코딩 없이 배우는 데이터 과학 이 책에서는 특정 학문에 치우치거나 개별 방법론에 매몰되지 않고, 보다 거시적인 안목에서 데이터 과학의 프레임 워크를 제공하는 데 목적이 있다.

코딩 없이 배우는 데이터 과학 이 책의 2장에서는 데이터 과학에서 활용 가능한 여러 도구를 소개하고, 코딩 없이 배우는 데이터 과학 도서의 실습 도구인 SAS R OnDemand for Academics에 대하여 설명해 놓았다.


코딩 없이 배우는 데이터 과학 이 책의 3장에서는 획득한 데이터를 실제 분석이 가능한 데이터로 가공 및 처리하기 위한 방법에 대하여 학습한다.

이번 장에서는 데이터 처리가 중요한 이유와 데이터 입력과 출력 그리고 데이터 처리 기본 데이터 구조 변환에 대한 설명이다.

데이터 처리가 중요한 이유 세 가지를 설명했고, 데이터 처리 기본에서는 데이터 처리에 가장 많이 쓰이는 "질의" 에 대해 배우고, 데이터 구조 변환에서는 데이터를 구조적으로 크게 바꾸는 기능이다. 알아 두면 다양한 정보 영역에 있는 데이터를 결합해, 데이터를 다각도로 살펴볼 수 있다는 장점이 있다.



코딩 없이 배우는 데이터 과학 이 책의 4장에서는 데이터를 정리 및 요약하는 과정을 통해 데이터가 가진 특성을 파악하는 기술적 데이터 분석에 대해 다룬다.

기술적 데이터 분석은 데이터를 정리하고, 요약하는 과정을 통해 데이터가 가진 특성을 파악하는 분석 방법을 말한다.

데이터 분석의 대가들은 이렇게 말한다. "데이터가 말하는 소리를 들어보아라." 데이터의 소리에 귀를 기울인다면, 데이터로 속이는 데이터 사기꾼이 되는 것을 피할 수 있다.

코딩 없이 배우는 데이터 과학 이 책에서 다루는 분석 방법은 크게 두 가지를 소개해 놓았다. 하나는 수치형 데이터에 대한 분석이고, 다른 하나는 법주형 데이터에 대한 분석이다.


코딩 없이 배우는 데이터 과학 이 책의 5장, 6장에서는 그래프나 지도와 같은 시각화 도구를 활용하여 데이터 분석 결과를 활용하고, 이해하는 방법에 대하여 학습한다.

이번 장에서는 1 차원, 2 차원, 다 차원 그래프를 이용한 데이터 분석을 학습한다. 1 차원 그래프는 주로 한 변수의 분포 특성을 시각화 하여 범주 별 비율이나 빈도를 분석하거나 대푯값 또는 이상 치를 발견하기 위해 활용한다.

2 차원과 다 차원 그래프는 변수 간의 관계 분석을 주목적으로 한다. 우리가 시각적 데이터 분 석을 본격적으로 알아보기 전에 꼭 기억해야 할 한 가지가 있다.

바로 데이터를 시각적으로 나타내는 목적은 "보는 사람의 이해를 돕기 위함" 이라는 점이다. 이 사실만 기억해도 이번 장에서 학습할 내용의 절반을 학습했다고 생각해도 무방하다고 한다.


코딩 없이 배우는 데이터 과학 이 책의 6장에서는 지도 그래프의 종류, 위치 지도, 지역 지도에 대해 학습한다. 지도 그래프란 지도에 그래프를 더한 시각화 방법이다.

코딩 없이 배우는 데이터 과학 이 책은 데이터 과학 입문자와 통계학, 컴퓨터 공학 비전 공자를 위한 도서이다. 통계학이나 컴퓨팅에 대한 이론적 기반을 보유하지 않은 학습자가 데이터 과학을 학습함에 있어 초행 길의 길잡이와 같은 역할을 하고자 한다고 저자는 말한다.

코딩 없이 배우는 데이터 과학 이 책을 통해 데이터 과학의 프레임 워크를 이해하고, 데이터를 가공하고 처리하는 방법을 배우고, 기술적으로 분석하는 방법도 익히고 나면 데이터 과학을 위한 기본 작업을 배우게 되는 것이다.

코딩 없이 배우는 데이터 과학 이 책을 마스터 하게 되면, 인공지능의 발전으로 인한 데이터 도구의 발전은 어떤 방법론을 적용해야 하는지, 또 분석 결과를 해석하기 위해서는 어떤 방법을 이용해야 하는지 만 알고 있으면, 어렵지 않게 데이터 문제를 풀 수 있도록 변하였다.

더 이상 코딩 문법에 얽매이지 않고, 보다 쉽게 데이터 문제를 해결할 수 있게 된다.




* 출판사로부터 위 책만 무상 제공 받아 직접 읽고 작성한 후기입니다. *

#코딩없이배우는데이터과학




댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo