-
-
2022 공개적 빅데이터분석기사 실기 - 필수 합격서, 파이썬, 핵심알고리즘 완전 정복, 최신 출제경향을 반영한 단답형+작업형 기출/예제 수록 ㅣ 2022 공개적 빅데이터분석기사
김원표 지음 / 와이즈인컴퍼니 / 2022년 2월
평점 :
빅데이터분석기사시험이 벌써 4회째가 다가오고 있습니다. 1회는 코로나로 취소되었고 2회부터 시작되어 실제 3회가 되어 열기가 점점 올라가고 있습니다. 빅데이터분석기사는 필기와 실기로 되어 있습니다. 필기를 합격한후에 실기를 임하게 되는데 <2022 공개적 빅데이터 분석기사 실기>가 단답형과 작업형문제를 대비합니다. 2회 실기전에는 실기수험서가 출간이 되지않았습니다. 그것은 어떤 유형으로 실기가 될지 확실치 않아서 였겠죠. 이제 2회와 3회의 시험을 시행되었으므로, 기출시험도 공개되었고, 그 유형은 단답형문제와 작업형문제가 출제되어 단답형문제는 10문제이고, 작업형문제는 2유형으로 파이썬을 통해 문제를 풀수있도록 코딩방법을 알려줍니다.
저자는 와이즈인컴퍼니 대표이고 한양대겸임교수시며 20년경력의 데이터 사이언티스트십니다. 와이즈인컴퍼니는 리서치, 데이터인, 데이터캠퍼스를 운영하는 것으로 보입니다. 저서는 통계분야를 주로 내셨습니다.
본 수험서는 단답형보다는 작업형대비에 대부분을 했고 단답형은 필기책의 내용이기에 필기책으로 대비를 하는 것이 좋습니다. 단답형예상문제 10문제를 1회 제시해둔점이 인상적입니다. 문제는 작업형이죠. 실기시험특징을 보면 시험이 만만치 않음을 느낍니다. 라인별실행, 그래프기능, 단축키, 자동완성기능을 제공하지않는 다고 합니다. 이 기능들은 파이썬프로그램을 다루며 너무 익숙하고 편하게 사용되는 기능들이라 떨리는 시험장에서 이 기능이 안될때 약간의 맨붕이 찾아올수도 있으므로 대부분의 함수나 코드는 외우고 있어야 시험에 합격이 가능할 듯합니다. 코드실행시간을 1분으로 제안을 한것은 다양한 능력을 평가하는 것이 아니라 정말 이 책에 제시된 코드 그대로만 수행해야 된다는 의미(기본적인 수행능력)로 보입니다. 394페이지의 코드를 대부분 외우고 있어야 실기수행시험가능함을 뜻해보입니다.
작업환경은 아나콘다의 주피터노트북을 사용합니다. 파이썬 설치부터 기초, Numpy함수, Pandas 데이터처리, 데이터의 탐색과 정제를 알아보고, 실제 현업에서는 데이터의 탐색과 데이터의 정제가 가장중요하죠. 소위 전처리라는 용어로 사용됩니다. 챕터3장에서 본격적으로 머신러닝의 분류,회귀, 모델검증, 정규화, 모델평가를 다루고 챕터4에서는 18가지 알고리즘을 다룹니다. 이 18가지 알고리즘은 달달달 외우고 있어야 시험에 합격하는 소리일겁니다. 필기도 상상외로 분량이 많은데, 18개 알고리즘 코드를 모두 외우고 있어야 한다는 것이 약간은 무섭습니다. 물론 2회와 3회 기출문제를 보면 모두 LogisticRegression 알고리즘으로 사용했지만 시험출제자가 4회에 생각이 바껴서 어려운 알고리즘을 사용하는 고난이 닥힐지 모르는것이죠. ㅠㅠ 그것이 우려되기에 저자도 18가지 알고리즘을 시험에 사용할 수있도록 소개해 놓았을 겁니다.
저자는 실습문제에 잘적응하도록 코드를 자세히 설명해주고 사용된 코드는 모두 자료실에 올려두었습니다. 사실 빅데이터분석기사를 획득했다고 해서 실제 실무를 할 수있는 실력이 될수 없다는 소리가 많습니다. 데이터분석을 하는 주니어데이터사이언티스트로 출발하는 분들에게는 꼭 필요한 자격증으로 보입니다. 시험을 보지 않는 분들도 빅데이터분석이라는 분야를 배우는 교재로 사용해도 좋을 듯합니다. 4회시험을 보시는 분들에게 저를 포함해서 좋은 성과를 기원합니다.
본 도서는 출판사로부터 무상으로 지원받아 주관적인 리뷰를 했습니다.