데이터 마이닝을 위한 데이터 과학을 재미있게(?) 설명한 책으로 대학 교재로 활용해도 괜찮을 것 같은 생각이 든다.

지금까지 데이터 마이닝 도구 및 기법에 대해서만 배웠지 그 기본 원리(근간)이 되는 데이터 과학에 대해서 배운적은 없은 것 같다. (원리도 모르면서 툴만 사용한 것이 조금은 부끄럽네요..ㅠㅠ)

제목 그대로 비즈니스를 위한 데이터이 과학이기 때문에 알고리즘 설명이나 어려운 수학은 자제하고 있으며 그림과 설명을 곁들여 설명하고 있다.

 

저자는 서문에서 이 책을 읽을 대상을 지정해주고 있다.

 

 

 

그리고 데이터 과학에 대한 이 책의 3가지 개념적 접근 방법을 소개해주고 있다. (이런 내용 및 개념을 다루고 있다고 생각하면 된다.)

 

. 데이터 과학을 기업 조직에 결합하는 방법에 대한 개념

 - 데이터 과학팀을 모집, 조직, 육성하는 방법이 포함된다.

 - 데이터 과학이 경쟁력을 향상시키도록 생각하는 방법이 포함된다.

 - 데이터 과학 프로젝트를 성공적으로 수행하기 위한 전략적 개념이 포함된다.

2. 데이터 분석적으로 사고하는 일반적인 방법

 - 이 개념을 갖고 있으면 적절한 데이터를 찾아내 적절한 방법을 적용하는 데 도움이 된다.

 - 여러 상위 수준의 데이터 작업과 '데이터 마이닝 프로세스'가 이에 포함된다.

3. 실제로 데이터에서 지식을 추출하는 일반적인 개념

 - 방대한 데이터 과학 작업 및 작업에 사용하는 알고리즘의 기반이 된다. 

 

이 책을 읽은 독자들이 아래와 같은 평가를 한게 눈에 띈다.

데이터 과학에 입문하는 사람들에게 도움이 될 것이며, 비즈니스 문제에 데이터 과학 문제를 적용하는데 중점을 두었고, 고객 이탈, 타겟 마켓팅, 위스키 분석처럼 실제 비즈니스에서 발생하는 익숙한 문제를 여러 곳에서 예제로 다뤘다. 알고리즘을 나열하기보다는 데이터 과학에 깔려 있는 개념을 독자가 자 이해할 수 있으며, 문제 해결 방법을 알려준다.

데이터를 현명하게 사용하면 비즈니스 경쟁력을 새로운 차원으로 끌어올릴 수 있으며, 데이터가 주도하는 환경에서 성공하려면 엔지니어, 분석가, 관리자 모두 자신 앞에 놓여 있는 선택사항, 설계 결정 사항, 장단점을 반드시 이해하고 있어야 한다. 흥미로운 예제, 명확한 설명, '방법'뿐만 아니라 '이유'도 자세하고 폭넓게 설명하고 있으므로, 데이터 주도 시스템을 개발하고 응용하는 업무를 수행하려는 사람에게 완벽한 입문서이다. 

이 책의 초반부는 개념 및 예제, 비즈니스 측면에서 풀어나갔으며, 중반부는 모델, 과적합, 유사도, 군집, 이웃, 시각화, 증거, 확률, 마이닝 등 데이터 분석 기법 설명한다. 후반부에는 비즈니스 전략 및 결론으로 끝을 맺는다. 챕터별 새부 내용을 나름대로 정리한 내용은 아래와 같다. 

 

1. 개요: 데어터 분석적 사고 방식

 - 데이터의 제공하는 기회를 데이터 주도 의사 결정을 축으로 분석 활용하면 어떤 이익이 있는지 설명한다. (데이터 마이닝과 데이터 과학의 차이점 포함)

 

2. 비즈니스 문제와 데이터 과학 해결책

 - 데이터 마이닝의 프로세스 (비즈니스이해->데이터이해->데이터준비->모델링->평가->배치)와 분석 기법 및 기술 (통계학, 데이터베이스 쿼리, 데이터 웨어하우스, 회귀분석, 기계학습과 데이터마이닝)

 

3. 예측 모델 개요 : 연관성에서 감독 세분화

 - 모델 유도(예측)을 기반으로 감독 세분화 및 시각화 과정 설명

 

4. 데이터에 대한 모델 적합화

 - 회귀분석 및 선형/비선형 함수, 벡터 기계 설명

 

5. 과적합화 문제 해결

 - 일반화(Generalization)와 과적합화(Overfitting) : 데이터 마이닝은 모델 복잡도와 과적합화 문제간의 싸움 (균일화(Regularization)를 통해 모델 복잡도 통제)

 

6. 유사도, 이웃, 군집

 - 비슷한 항목을 찾아내는 일, 예측 모델링, 개체 군집화을 통해 유사도 사용 방법 설명, 유사도 및 거리 계산 방법, 최근접 이웃법 계열의 방법 설명

 

7. 결정 분석적 사고 1 : 좋은 모델은?

 - 모델의 적절한 평가 척도 고안이 필요하며, 기댓값은 좋은 틀을 제공한다.

 

8. 모델 성능 시각화

 - 모델의 평가 결과를 시각화하는 것은 평가 업무에서 매우 중요한 부분이며, 훈련 데이터 및 표본을 이용해 결과를 예측해야 한다. (수익 곡선 및 수신자 운용 특성 곡선 등은 중요한 시각화 도구이다.)

 

9. 증거와 확률

 - '각 타겟이 특정값을 어떻게 생성하는가?'라는 질문을 통해 새로운 기법 설명 (생성기법(Generative Method), 베이지안 기법(Bayesian Method)

 

10. 텍스트 표현 및 마이닝

 - 텍스트를 특정 벡터로 변환하는 방법 설명 ( 각 문서를 개별적인 단어로 분할하거나 TFIDF 공식을 이용해 각 단어에 값을 할당하는 방법)

 

11. 결정 분석적 사고 2 : 분석 공학

 - 문제에 대해 데이터를 분석적으로 장려함으로써 데이터 마이닝의 역할을 명확히 하고 비즈니스 제약, 비용, 효과를 고려ㅏ며, 문제를 단순화하기 위한 가정을 명확히 표현하는 것

 

12. 기타 데이터 과학 작업 과 기법

 - 항목드의 동시 발생 또는 연관성 찾아내기 : 상품 구매

 - 전형적인 행위의 프로파일링 : 신용카드 사용량이나 고객 대기 시간

 - 데이터 항목 간의 연결 예측 : 사람들 간의 소셜 네트워크에서의 연결

 - 데이터를 관리하기 쉽게 만들거나 데이터에서 숨은 정보를 찾아내기 위해 축소 : 잠재적인 영화 선호도

 - 모델을 하나의 전문가로 생각하고 모델을 조합하기 : 영화 추천 모델 개선

 - 데이터 간의 인과 관계 도출 : 소셜 네트워크에 연결된 사람들이 동일한 상품을 구입하는 이유

 

13. 데이터 과학과 비즈니스 전략

 - 데이터 과학은 운용도 아니고 공학도 아니다.

 

14. 결론

 - '명확히 설명할 수 없다면 그것을 제대로 알고 있는 것이 아니다.' (알버트 아인슈타인)

 

 

 

일반적인 개발자를 대상으로 작성된 책이 아니기 때문에 책의 중간적인 부분은 상당히 어려울 수도 있다. (그래서 조금 더 흥미를 잃지 않기 위해 1~2장을 읽고 11~14장을 읽은 후에 관심이 가는 장부터 이리저리 읽는 방식을 취했다.) 하지만 데이터베이스를 설계하는 개발자나 데이터를 설계하는 기획자(개발자)는 꼭 읽어보기를 권한다. (데이터를 바라보는 관점을 비즈니스에 초점을 맞췄기 때문이다.)

 

자매품으로 '데이터 시각화를 위한 데이터 인사이트 : 빅데이터를 바라보는 통찰의 눈'도 추천한다.


0개의 상품이 있습니다.



0개의 상품이 있습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기
 
 
 

 

 

예전에는 게임을 개발한다고 하면 PC용 게임을 말하는 것이고, 이것은 DirectX를 쓴다는 얘기와 상통했었다. 하지만 지금은 다양한 OS환경과 3D툴 및 기술들로 인해 DirectX를 배우지 않는 사람들이 많이 있다. 가령 DirectX는 윈도우에서만 돌아가지만 OpenGL은 멀티 플랫폼을 자랑하며, 특히 모바일 환경에서는 OpenGL ES가 거의 장악하고 있다고 볼 수 있겠다. 거기에 유니티, 토크, 게임브리오, 언리얼 등 3D툴의 성능이 높아 기반지식 습득의 필요성이 약해지고 있는 실정이다. 

 


 

처음에 이 책의 제목을 봤을 때 DirectX를 설명하는 책인줄 알았다. 하지만 목차를 보면 알겠지만, 이 책은 3D 게임 프로그래밍 입문서이며, 샘플로 제공하는게 DirectX라고 보면 좋을 것이다. 그렇게 본다면 DirectX는 부제로 달았으면 더 좋았을 것 같다. (책이 더 많이 팔리지 않았을까..)

 

사회 초년병 시절 게임회사에서 게임을 개발하면서 봤던게 DirectX 7이였는데, 벌써 11이라니 조금은 많은 시간이 지난 것 같아 당황스럽기도 하고, 또 그때와 얼마나 바뀐게 있을까하는 궁금증도 있었다.

그리고 초심으로 돌아가 입문서를 다시 한번 보는게 어떨까하는 마음에서 이 책을 집어들었다. 우선 결과부터 얘기하자면 이제는 수학공식이 가물가물하고 책을 읽는 내내 머리가 아픈건 왜일까..

 

 

이 책은 용책, 해골책으로 불리며, 스테디설러의 반열에 오른 책으로 나 또한 용책을 소장하고 있다.

비슷한 내용이지만, 이 책을 고른 이유는 번역자가 류광님이기 때문이다. 류광님은 gpgstudy 스터디를 운영하고 있으며, Game Programming Gems 시리즈의 번역자이기도 하다. 그래서 더 믿음이 가서 이 책을 읽어보고자 했다. (하지만 수학의 넘사벽은 ㅜㅜ..)

 

 

 

이 책은 크게 3부로 구성되어 있으며, 1부에서는 3D에 필요한 수학 지식을 설명하고 있으며, 2부에서는 Direct3D 지식, 3부에서는 특수 효과 및 렌더링 기법(셰이더 추가)를 설명하고 있다.

몇 가지 반드시 이해하고 넘어가야 되는 부분이 있다면 파이프라인의 정확한 이해와 법선 그림자이며, 특히 지금은 셰이더를 이해하지 못하면 3D 프로그램을 효율적으로 작성할 수 없을 정도이니 반드시 익혀두길 바란다. 

 

구체적인 내용은 아래와 같으며 알찬 구성임을 느낍니다. 정말 1/10 만큼만 이해해도 성공입니다. ^^

1. 벡터/행렬 대수, 변환

2. 렌더링 파이프라인, 조명

3. 텍스쳐, 혼합, 스텐실

4. 셰이더, 법선 매핑

5. 지형 랜더링

6. 입자, 스트림 출력

7. 그림자, 차폐, 메쉬

8. 캐릭터


 

 

이 책은 소장가치가 충분히 있으며, 3D로 작업을 할 경우가 생긴다면 곁에 두고 볼 내용들이 많이 있다. (문제가 발생했을때 다시 기본으로 돌아가 시작해야 하는 경우가 많기 때문에 그만큼 기초는 중요하다.)


 책 내용을 조목조목 소개하는 것보다 3D 프로그래밍의 기본기 다지기가 중요함을 논하고 싶었으며, 출판사와 역자를 믿고 이책이 소장할 가치가 있음을 다시 한번 강조하고 싶다.

 


0개의 상품이 있습니다.



0개의 상품이 있습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기
 
 
 

 

 

예전에는 게임을 개발한다고 하면 PC용 게임을 말하는 것이고, 이것은 DirectX를 쓴다는 얘기와 상통했었다. 하지만 지금은 다양한 OS환경과 3D툴 및 기술들로 인해 DirectX를 배우지 않는 사람들이 많이 있다. 가령 DirectX는 윈도우에서만 돌아가지만 OpenGL은 멀티 플랫폼을 자랑하며, 특히 모바일 환경에서는 OpenGL ES가 거의 장악하고 있다고 볼 수 있겠다. 거기에 유니티, 토크, 게임브리오, 언리얼 등 3D툴의 성능이 높아 기반지식 습득의 필요성이 약해지고 있는 실정이다. 

 


 

처음에 이 책의 제목을 봤을 때 DirectX를 설명하는 책인줄 알았다. 하지만 목차를 보면 알겠지만, 이 책은 3D 게임 프로그래밍 입문서이며, 샘플로 제공하는게 DirectX라고 보면 좋을 것이다. 그렇게 본다면 DirectX는 부제로 달았으면 더 좋았을 것 같다. (책이 더 많이 팔리지 않았을까..)

 

사회 초년병 시절 게임회사에서 게임을 개발하면서 봤던게 DirectX 7이였는데, 벌써 11이라니 조금은 많은 시간이 지난 것 같아 당황스럽기도 하고, 또 그때와 얼마나 바뀐게 있을까하는 궁금증도 있었다.

그리고 초심으로 돌아가 입문서를 다시 한번 보는게 어떨까하는 마음에서 이 책을 집어들었다. 우선 결과부터 얘기하자면 이제는 수학공식이 가물가물하고 책을 읽는 내내 머리가 아픈건 왜일까..

 

 

이 책은 용책, 해골책으로 불리며, 스테디설러의 반열에 오른 책으로 나 또한 용책을 소장하고 있다.

비슷한 내용이지만, 이 책을 고른 이유는 번역자가 류광님이기 때문이다. 류광님은 gpgstudy 스터디를 운영하고 있으며, Game Programming Gems 시리즈의 번역자이기도 하다. 그래서 더 믿음이 가서 이 책을 읽어보고자 했다. (하지만 수학의 넘사벽은 ㅜㅜ..)

 

 

 

이 책은 크게 3부로 구성되어 있으며, 1부에서는 3D에 필요한 수학 지식을 설명하고 있으며, 2부에서는 Direct3D 지식, 3부에서는 특수 효과 및 렌더링 기법(셰이더 추가)를 설명하고 있다.

몇 가지 반드시 이해하고 넘어가야 되는 부분이 있다면 파이프라인의 정확한 이해와 법선 그림자이며, 특히 지금은 셰이더를 이해하지 못하면 3D 프로그램을 효율적으로 작성할 수 없을 정도이니 반드시 익혀두길 바란다. 

 

구체적인 내용은 아래와 같으며 알찬 구성임을 느낍니다. 정말 1/10 만큼만 이해해도 성공입니다. ^^

1. 벡터/행렬 대수, 변환

2. 렌더링 파이프라인, 조명

3. 텍스쳐, 혼합, 스텐실

4. 셰이더, 법선 매핑

5. 지형 랜더링

6. 입자, 스트림 출력

7. 그림자, 차폐, 메쉬

8. 캐릭터


 

 

이 책은 소장가치가 충분히 있으며, 3D로 작업을 할 경우가 생긴다면 곁에 두고 볼 내용들이 많이 있다. (문제가 발생했을때 다시 기본으로 돌아가 시작해야 하는 경우가 많기 때문에 그만큼 기초는 중요하다.)


 책 내용을 조목조목 소개하는 것보다 3D 프로그래밍의 기본기 다지기가 중요함을 논하고 싶었으며, 출판사와 역자를 믿고 이책이 소장할 가치가 있음을 다시 한번 강조하고 싶다.


0개의 상품이 있습니다.



0개의 상품이 있습니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기