코딩 없이 배우는 데이터 과학 - 빅데이터·인공지능 세계 권위자가 제언하는
황보현우.한노아 지음 / 성안북스 / 2023년 3월
평점 :
장바구니담기


코딩없이 배우는 데이터과학

빅데이터, AI, 데이터 기반 TF, 애자일조직, 린 프로젝트...

내가 소속된 회사에서 최근에 가장 신경쓰고 있는 분야는 바로 데이터 사이언스인다.(참고로 소속된 회사는 IT회사가 아니다)

비단 데이터사이언티스트의 몸값이 치솟고 있다는 뉴스를 보지 않더라도 수많은 데이터를 기반으로 한 여러가지 의사결정의 과정은 효과적이고 효율적이며 신속하고 불필요한 과정을 많이 생략해 준다.

그것이 가능했던 것은 수많은 데이터들 그리고 그 데이터를 축적할 수 있었던 IT기술의 발전때문이다.

그런데 그렇게 많아지 데이터로 인해서 데이터를 잘 활용하는 방법인 데이터 사이언스가 주목을 받고 있는 것 같다.

이 책은 그러한 데이터사이언스에 대한 기초를 함양해 주는 책이다.

구성은 다음과 같다.

1. 데이터 과학을 위한 체계

2. 데이터 과학을 위한 도구

3. 데이터 가공과 처리

4. 기술적 데이터 분석

5. 시각적 데이터 분석

6. 시각적 데이터 분석 II

체계 및 도구 뿐 아니라, 분석방법과 실제 사례까지 설명해준다.

도구로는 SAS를 소개하고, 가공은 테이블과 칼럼등 기초적인 데이터 셋에 대해서 안내한다. 그리고 나머지 절반은 실제 데이터를 분석한 사례들이기 때문에, 초보자들도 어떻게 데이터를 활용하는지 직관적으로 알수 있다.

기존에 주로 R과 R 스튜디오에 관련된 책들을 읽었었는데, SAS도 오픈소스로 활용이 가능하니 한번 체험해 봐도 좋을 것 같다.

챗GPT가 상당부분 데이터 엔지니어에 대한 장벽을 낮출 것으로 보인다.

(기승전 챗GPT)

덧붙임.

  1. 새삼 엑셀이 파워풀한 도구임을 알게됨

  2. 결국 빅데이터는 사고력 인것, 기술적인 부분은 데이터엔지니어가 도움을 주면 됨(쿼리는 결국 필요한 데이터를 연결하는 것)

  3. 데이터가 많아질 수록 사고력/인사이트의 능력이 더 커질 것

  4. 문과와 이과를 연결하는 사고력이 필요함.

  5. 올해들어 데이터 사이언스에 관해 읽을 책 : 총 3권

  6. 올해들어 만난 데이터 사이언티스트(자칭포함) : 총 10여명

본문의 내용을 일부 인용하면,

데이터분석역량은 통계학습, 기계학습, 패턴인식 등 다양한 데이터 분석 방법론에 근거하여 데이터를 해석해 내는 역량을 말한다. 데이터 과학자는 데이터를 분석해 문제를 해결하고 패턴을 발견술한다. 이때 데이터 과학자에게 데이터는 재료이고, 분석역량은 재료를 가공하는 기술이다. (중략) 하지만 데이터 분석 기술 만으로는 분석을 잘 할 수 없다. 데이터는 현상을 담고 있기 때문이다. 일상 문제를 데이터 문제로 정의하고, 데이터 분석으로 얻은 결과를 해석하는 모든 과정이 데이터 분석이다. 그리고 이러한 데이터 분석을 기술에서 예술로 승화시키기 위해서는 '비즈니스 역량'이 꼭 필요하다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo