파이썬 데이터 과학 통계 학습
황보현우.정지현 지음 / 정보문화사 / 2021년 5월
평점 :
장바구니담기


데이터과학은 빅데이터가 관심받고 나서 많은 사람들이 관심을 보이고 공부를 하려고 하지만 데이터과학을 전반적으로 살펴볼수있게 구성되어 있습니다. 파이썬 기본문법과 지도학습과 비지도학습을 이해하는데 좋은 방향을 제시합니다.

댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
파이썬 데이터 과학 통계 학습
황보현우.정지현 지음 / 정보문화사 / 2021년 5월
평점 :
장바구니담기


몇년전부터 빅데이터가 각광을 받으면서 데이터과학에 대한 관심이 높아졌습니다. 학교에서 이것을 전공으로 배우는 학생들은 문제가 없겠지만 미디어를 통해 데이터과학에 대한 호기심이 생겨 공부하고 싶은 대상에서는 막막할 수도 있는 것이 바로 이 분야입니다. 더우기 이공계가 아니고 인문계출신은 그 막막함이 더욱 배가 될 겁니다. <파이썬 데이터과학통계학습>은 비전공자를 포커싱해서 '데이터과학'을 관통하는 통계학습과 기계학습에 관한 프레임워크를 익히도록 구성했습니다. 물론 이 책을 기반으로 좀더 세부적인 두꺼운 책으로 옮겨갈수있도록 모델링의 핵심부분을 맛볼 수있는 점이 장점입니다.


저자는 한남대 글로벌IT경영학과 황보현우교수입니다. 연대 행정학과를 나오셔서 동대학 글로벌비즈니스학과 박사를 하시고 코오롱베니트, 하나벤처스 등의 현장경력도 있는 분으로 빅데이터분야에서 활발한 활동을 하고 있습니다. 공저자 정지현님은 IBM에서 엔지니어로 근무하시고 연대에서 빅데이터로 석사를 하셨습니다.

책은 파이썬의 기본 문법과 지도학습으로 대표되는 회귀와 분류, 비지도학습방법인 그룹화와 차원축소를 다룹니다. 파이썬은 아나콘다라는 툴을 사용합니다. 아나콘다에서 제공하는 주피터노트부은 많은 데이터를 처리하는데는 문제가 있지만 교육이나 단계별로 결과를 보면서 공부를 하는데는 강점이 커서 많은 교재에서 주피터노트북을 주 에디터로 사용하고 있습니다. 주피터노트북의 사용법을 친절하게 알려주지않는 부분은 있지만 450페이지의 분량에 모델링방법까지 다루고 있기에 어쩔수없는 부분이긴 합니다. 파이썬 문법의 기초인 자료형과 변수부터 제어문, 함수 모듈까지 다루고 넘파이와 판다스도 기본사용법을 알려줍니다. 약간은 이런 부분을 학습하는 것이 지루할 수도 있는데 모두 직접 타이핑을 해야 습득속도가 높아질겁니다. (다운받아서 볼 수있는 코드부분은 따라 쳐보지 않더라도 꼭 하나씩 작동을 시켜서 공부해야 합니다. )


지도학습은 회귀와 분류라는 방법을 이용합니다. 딥러닝에서는 지도학습을 입력값과 출력값을 알려주고 학습하는 방법이죠. 대표적인 방법인 회귀는 결과값(종속변수)이 양적변수입니다. 이곳에서 통계학의 대표적인 방법이 나오죠. T검정, 분산분석, 상관분석, 선형분석을 하게 되고 이것이 대부분 예측을 할 때 사용을 많이 합니다. 분류는 카이제곱, 로지스틱 회귀, 포아송, 서포트벡터머신을 설명합니다. 통계학에서는 서포트벡터머신을 배우진 않죠. 이는 컴퓨터의 기계학습을 분류방식에 도입한 것으로 '초평면'이라는 개념을 알아야 하지만 설명은 좀 아쉽네요. 하지만 '지도학습'이라는 다른 전문책을 보면서 익혀야 하는 부분입니다. 이 책에서는 이론숙지보다는 문제에 활용할 수있는 '실습'부분은 꼭 해보시면 이해를 높일 수있습니다. 분류의 의사결정나무와 앙상블기법은 지난 4월인가 있었던 제2회 빅데이터분석기사 필기문제에도 나왔던 분야입니다. 의사결정나무는 분류의 대표적인 방법이죠. 논리학에서도 많이 사용하고 맥킨지에서 사용하는 문제정의방법으로도 많이언급됩니다. 그것을 기계학습방법으로 구현한겁니다. 앙상블모형은 다수모형을 분류 예측하여 종합하는 의사결정방법입니다. 대표적인 방법인 배깅(데이터를 조절하는 방법)을 통해 실습을 시행합니다.

비지도학습은 군집분석과 주성분분석이 대표적이고 군집분석은 K-평균을 실습합니다. 실습데이터는 IRIS라는 데이터셋을 통해 전처리방법과 군집결과를 시각화로 검토해봅니다. 차원축소는 주성분분석과 요인부분에 사용되는 비지도학습입니다. 차원축소가 재미있는 것이 빅데이터시대에 발생하는 문제를 해결하는 방법이라는 겁니다. 통상적으로 변수보다 관측치가 많은 것이 정상(저차원0인데 그렇지 못한 경우(고차원)가 종종 발생을 합니다. 그럴때 변수등을 줄여야하는 경우가 발생하는데 바로 차원축소라는 방법이 필요합니다. 이 방식의 주축이 요인분석과 주성분분석을 설명합니다. 요인분석은 변수들의 공통인자를 찾는 것이고 주성분분석은 핵심요인으로 줄여나가는 방식입니다.


<파이썬 데이터 과학 통계분석>은 모델판단을 하는 통계모형을 전반적으로 다뤘습니다. 데이터를 다루다보면 데이터를 수집하고 전처리하여서 모델링을 해야 합니다. 그것의 핵심이 통계학습과 기계학습이고 지도학습과 비지도학습으로 표현했습니다. 파이썬의 기본문법을 전반적으로 살펴보고 본격적으로 지도학습과 비지도학습의 핵심을 다뤄보면서 다른 책을 즉 전문적인 데이터분석책을 깊게 숙지하고 관심을 높일수있는 역할을 충분히 했습니다.


서평은 출판사로부터 본 도서를 무상으로 제공받아 작성했습니다. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
Start up 블로그 글쓰기 나만의 콘텐츠로 성공하기 - 블로그 마케팅의 모든 것 Start up 시리즈
남시언 지음 / 아티오 / 2021년 5월
평점 :
장바구니담기


블로그 글쓰기' 시작하기는 쉽지만 그것을 지속하기는 쉽지 않습니다. 개인적으로도 4년차쯤 되는 블로거이지만 시작했던 초심은 저도 사라지고 책을 읽으면 평을 올리는 서평블로거로 전락하고 말았습니다. ㅠㅠ 물론 저자가 이야기한대로 귀찮음도 크게 한몫했지만 어느틈엔가 초창기에 블로그에 많은 사람들이 방문하도록 공부했던 기억들이 많이 흩뜨러져있습니다. <Start up 블로그 글쓰기 나만의 콘텐츠로 성공하기>는 귀찮이즘에 빠진 저같은 블로거에게는 초심을 처음 블로그로 입성하는 사람에게 블로거로써 좋은 습관을 가지도록 방문자를 늘리고 포스팅이 상단에 노출될 수있는 블로그 글쓰기를 달성할 수있는 기본을 다져줍니다.

저자 남시언은 87년생으로 경북콘텐츠진흥원 차장을 역임했고 현재는 프리미엄콘텐츠 제작소 히트메이커스 대표로 남시언닷컴을 운영하는 파워블러거이고 콘텐츠 마케팅으로 강연을 하는 분입니다. 유튜브도 남시언콘텐츠랩으로 약2만명의 구독자를 모은 sns마케팅의 최전선에 서계신 분입니다.

블로그를 운영하려면 가장 중요한 것은 글을 꾸준히 써야 합니다. 이것이 안된다면 블로그에는 방문객(독자)이 오지를 않습니다. 이를 위해서는 귀찮음을 이겨내야 합니다. 그럼 무엇을 써야 할까. 남들이 원하는 글을 써서는 오래쓸수없다고 합니다. 자신의 글을 쓰고 좁은 주제보다는 넓은 주제를 다루라고 합니다. 전문적인 주제에 대한 글을 쓰는 블로그라고 해도 맛집이나 여행 등에 대한 글을 쓰더라도 주제에 벗어난 것이 아니라 글을 계속 쓸수있는 에너지를 주고 방문객들의 범위도 넓힐수있는 좋은 계기가 됩니다. 그것이 더욱 매력적으로 만든다고 강조합니다. 이것을 위해서는 매일 글을 쓰는 습관이 중요합니다. 단 10분이라도 아무글이라도 써서 올려야 블로그가 노출이 더욱 좋아집니다. 이것은 최적화를 위한 첫걸음이고 100일정도 노력을 해야 합니다.

저자는 블로그를 쓸때도 제목의 중요성을 이야기합니다. 어쩌면 글쓰는 시간보다 제목정하는데 더욱 신경을 쓰라합니다. 저는 이 제목을 정하는데 아무 생각없이 정할 때 많음을 반성하게 되네요. 제목을 잘못정해서 방문객이 오지 않는다면 콘텐츠로써는 의미가 줄어듭니다. 평범한 글이라도 많은 사람들이 찾는 글을 써야 합니다. 이를 위해서 창의력을 강조합니다. 창의력은 콘텐츠를 차별화하는데 매우 중요합니다. 여기에다가 짧고 명쾌함이 중요합니다. sns중에 틱톡이 많은 사람들에게 사랑받는 이유도 짧고 확실하게 임팩트가 있기 때문입니다.

블로그 글쓰기콘텐츠를 할때 주의해야 하는 점은 콘텐츠가 무료가 아니라는 겁니다. 많은 콘텐츠가 비용이 투자된 경우가 다반사입니다. 무지하게 끌어다 쓰다가는 큰코를 다칠수가 있습니다.

블로그를 쓸때 항상 명심해야 할 부분은 사람들이 열심히 처음부터 끝까지 글을 읽지 않는다는 점입니다. 더우기 모바일로 볼때는 글보다는 사진을 쓱하고 스크롤을 내려버리죠. 독자들에게 어필할 시간은 극도로 적습니다. 이를 극복하기 위해 강력한 어필을 준비하라합니다. 사진1장에 글 2-3줄이 적당하다합니다. 최대한 지루함을 주지 않고 독자들이 정보를 얻을 수있도록 도와야 합니다. 그리고 대도록이면 소제목을 달아서 어느 내용을 설명하는지 강조해줄 필요가 있습니다. 사진은 직접 찍은 사진을 이용하고 무료이미지사이트를 이용을 권합니다.

끝으로 네이버블로그에는 잘못된 소문이 있다고 합니다. 수정하지 말라, 마케팅글을 쓰면 안된다 등 최xx, 저xx 등의 단어죠. 저도 못사용하네요.ㅎㅎ 저자분은 전문가시니 정담을 제시했을 거라 생각합니다만 블로그에 신경을 쓰는 분들은 자신의 블로그에 나쁜 영향을 미친다는 소문이 난 내용은 무시하기 힘들죠. 오랫동안 공들여 끼어온 블로그에 나쁜 영향이 혹시라도 끼쳐질까봐입니다. 하지만 그런 풍문을 미신처럼 믿으면 곤란하긴합니다.

블로그는 꾸준히 쓰고 진솔한 글쓰기를 한다면 블로그운영사에서도 패널티를 줄 이유는 전혀 없을 겁니다. 제목과 내용 그리고 저자게 제시하는 문단구성들을 신경쓰면서 열심히 꾸준히 글을 쓰다보면 많은 사람들이 사랑하는 블로그가 되어 있겠죠. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
엑셀 데이터 분석 바이블 - 실무에 최적화된 엑셀 사용서, 모든 버전 사용 가능 엑셀 바이블 시리즈
최준선 지음 / 한빛미디어 / 2021년 4월
평점 :
장바구니담기


회사에서 엑셀은 가장많이 사용하는 업무용 프로그램입니다. 대부분 숫자와 서식이 포함된 문서작성에 사용되죠. 여기서 좀 수준을 높이면 함수를 다양하게 사용하고 엑셀고수가 되면 VBA를 사용하는 문서자동화까지 사용자의 능력과 회사의 역량에 따라 엑셀의 사용 방법도 수준이 다릅니다. 하지만 대부분은 복잡하지않은 용도의 서식사용이 대부분일겁니다. 워드프레스 대용이라고나 할까요. 이러한 수준을 뛰어넘어 엑셀실력을 증진하고 능력있는 직장인이 실무에서 사용할 수있게끔 <엑셀데이터분석 바이블>이 친구가 될 수있겠네요.

저자 최준선은 네이버 최대 엑셀카페 '엑셀, 하루에 하나씩"의 대표 매니저입니다. 그리고 마이크로소프트 엑셀MVP라고 합니다. MS MVP는 MS에서 임명하는 자격으로 커뮤니티를 통해 MS의 기술과 확산에 도움을 준 대상자를 선정합니다. 매년 3800명을 선정합니다. 지금까지 엑셀관련 서적을 30여권 저술하신 명실공히 한국 최고의 엑셀 전문가중 한분이십니다.

빅데이터시대를 맞이해서 기업에서는 기업에 필요한 데이터를 축적에 관심이 커졌습니다. 파이썬이나 R등 전문프로그램을 사용하면 좋지만 기업내 대부분이 사용하는 엑셀로도 충분히 전문프로그램에 못지 않는 데이터분석을 할 수있다는 것을 보여주는 것이 바로 <엑셀데이터분석 바이블>입니다. 순서는 데이터관리를 위한 파워쿼리사용방법, 데이터분석을 하기위한 피벗활용법, 데이터분석의 꽃인 데이터시각화까지 다루고 조금더 전문적인 통계분석방법인 기술통계법과 회귀분석까지 어프로치합니다.

데이터전처리는 데이터분석의 생노가다라고 합니다. ㅠㅠ 그부분을 2010버전부터 제공되는 파워쿼리로 적용합니다. 2007사용자는 아웃입니다.ㅎㅎ 그리고 요약분석에 최적화된 피벗테이블을 활용합니다. 사실 피벗테이블을 사용하느냐마느냐에 따라 일의 효율이 달라집니다. 그런데 엑셀사용자의 80%는 사용을 하지 않을겁니다. 피벗테이블을 잘사용하면 파워BI를 새로 배울때는 좀더 편하게 익힐수있습니다.2007~마이크로365까지 모든 사용용이라고 되어 있어서 버젼에서 차이가있는것은 버젼을 표기해서 보완했습니다. 피벗테이블은 엑셀데이터를 사용해서 보고서를 쉽게 만들때 주로 사용하는데 대량의 데이터를 효율적으로 처리하는데도 유용하다고 합니다.

시각화는 통상적으로 엑셀에서는 챠트활용이 기본이죠. 여기다가 추가적으로 쉘에 챠트를 넣을수있는 '스파크라인'(2010버젼~)을 알려줍니다. 데이터분석에 있어서 챠트를 다양하게 표현할 수있는 능력은 분석보고서를 보는 사람을 설득하는데 더욱 효과적입니다. 그리고 웹상에서 대시보드활용법은 고급스런 시각챠트를 활용할수있어서 데이터분석을 표현할수있게 합니다.

분석으로 기술통계량으로 대푯값과 산포도를 알려주고 회귀분석으로 R-제곱값과 결정계수 그리고 예측을 다룹니다. 기술통계량은 데이터의 속성을 파악하는데 핵심입니다. AVERAGE(평균)와 MEDIAN(중간값)그리고 MODESNGL(최빈값)을 구분하여 적절한 사용은 분석의 정확도를 높입니다. 회귀분석은 연속된 데이터를 이용한 미래 예측값을 구하는 방법으로 챠트에 추세선을 넣어서 완성합니다. 즉 데이터의 일정한 경향성을 규명하는거죠. 개인적으로 회귀분석을 잘못사용하는데 좋은 경험이 되었습니다.

요즘 빅데이터 분석을 할 수있는 툴들이 많이 선보이고 있습니다. R, 파이썬, 파워BI 등이 가장 많이 사용합니다. 이 툴들의 특징은 빅데이터를 처리할수있다고 하죠. 그런데 현실적으로 만데이터를 넘기는 자료를 처리할 일은 잘없죠. 해봐야 몇천데이터입니다. R이나 파이썬 파워BI를 배우면 좋지만 우리가 가장 많이 접하는 엑셀로 데이터 분석을 한다면 가성비로는 최고치일겁니다. 온라인서점에서 "엑셀 데이터분석"으로 검색을 해보면 다양한 책들이 소개되어 있지만 700페이지가 넘고 이름도 바이블(이 제목으로 가장 두꺼운 책은 아닙니다.ㅎㅎ)로 되어 있듯 상당히 디테일한 설명이 많습니다. 그리고 전처리부분(파워쿼리)과 보고서(피벗테이블,대시보드)부분에 힘을 주어서 데이터분석의 의미를 잘 살렸습니다. 


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo
 
 
 
한 권으로 종결하는 약국 브랜딩 - 진심약사 현진의 신개념 경영 처방전
심현진 지음 / 행복에너지 / 2021년 5월
평점 :
장바구니담기


약국을 저는 자주가는 편입니다. 오늘도 몸컨디션이 나빠서 악국에 들려 광동쌍화탕을 사서 마셨습니다. 주로 건강과 관련된 제품을 주로 팔죠. 그런데 과거의 약국에 비해 요즘 약국은 건강종합백화점처럼 느껴질 정도로 다양한 제품들로 꽉차있습니다. 의약분업으로 병원의 조제약을 팔고, 일반의약품과 건강기능식품이 다양하게 전시되어 있습니다. 건강에 관련된 판매채널이다보니 다양한 제조사에서 약국을 통해 제품을 판매하기 위해 찾아오고 전시됩니다. 하지만 많은 약국들은 소비자에 대한 관점보다는 자신의 공급자마인드로 판매에 집중하는 경우가 대부분입니다. <한 권으로 종결하는 약국 브랜딩>은 "약사는 약만 조제하는 시대는 갔다!"고 선언하면서 약국 경영의 새로운 시도를 보여줍니다. 물론 이 책이 약국을 운영하는 약사님들이 1차대상이겠지만 저자의 노력이 깃든 약국브래딩을 통해 마케팅에 대한 본질을 생각하는 계기가 될겁니다.

저자 심현진약사는 92년생으로 이대약대를 졸업하고 대학원 석사를 했습니다. 고대를 잘다니시다가 약대로 진로변경을 과감히 하여 2019년 약대를 졸업하셨네요. 그리고 블로그 "진심약사, 현진의 약국 브랜딩"을 운영하고 "약국브랜딩연구소"도 운영중입니다.

저자는 이 책을 통해 브랜딩을 잘하는 약사로 '호스트워커약사'라는 용어를 사용합니다. 스스로 주인이 되는 약사라고 합니다. 블로그를 통해 자신의 블랜드를 만드는 것이 호스트워커약사의 시작입니다. 여기에는 4가지 능력이 필요합니다. 글쓰기, 말하기, 디자인, 마케팅입니다. '글쓰기'는 4MAT법칙을 소개합니다.글을 쓸때 Why, What, How,If를 사용하면 좀더 편하게 글을 쓰수있습니다. 그리고 이것을 설득력있게 구성하는 방법으로 Opinion,Reason,Example, Offer등을 제시합니다. 이렇게 정리된 방법은 글을 쓸때 부담되지 않고 여유를 찾을 수있는 장점이 있습니다. '말하기'는 GROW를 방법을 알려줍니다. Goal(목표)를 파악하고 Reality(현실)을 확인해서 Option(따져보는 단계)으로 방법을 타진하고 Will(해결책)을 점검합니다. 그리고 이러한 요소를 스토리로 만들라합니다. '디자인'입니다. 사람들은 약국에서 약사의말보다 제품의 한쪽에 붙여둔 POP문구를 더 신뢰한다고 합니다. 미리캔버스, 망고보드 등 유용한 사이트는 좋은 팁이네요. '마케팅'은 고객과 라포형성, 경험활용등 어쩌면 당황하면 생각안날 수있는 요소들을 저자는 젊은 나이이지만 전문가로서 능력을 알려주시네요.

저자가 처음 블로그를 시작한 계기는 자신의 외식 식사를 찍어 올리면서 sns를 시작했습니다. 그것이 맛집탐방이 되고 돈을 받고 블러그를 올려주는 수준에 달했습니다. 그 노하우로 요청이 들어오면 주저없이 보여주고, 자신의 능력을 무형문화재라고 표현하는 것도 신선합니다. 블러그가 괘도에 오르자 네이버카페 약국브랜딩연구소를 만듭니다. 약사들의 브랜딩을 돕는 다는 취지입니다. 월간리딩팜개최하고 오토약국 블로그 스터디(오블스)를 열어서 블러그로 자신의 브랜딩법을 알려줍니다. 그것은 전문성, 소통 그리고 자동화를 듭니다. 자동화는 블로그에 올리는 글이 강의도 되고 유튜브영상, 전자책으로 파급되어 수익을 올리는 걸 말합니다.

sns는 그 자체로는 대부분 돈이 되지 않습니다. 지식을 제공하고 사람들에게 도움을 주어야 보답으로 다가옵니다. 그것이 광고수익일수도 있고 일감, 강의의뢰일수도 있습니다. 이것을 위해 고객들 독자들과 소통해야 합니다. 그리고 고객들에게 필요한 정보를 제공해야 합니다. 이런과정을 거쳐서 노력하다보면 전문가반열에 오르는 것은 덤일겁니다. 열심히 노력하는 것 중요합니다. 하지만 노력하다보면 알아준다는 생각은좀 다른영역일겁니다. 브랜딩을 통해 자신의 독자적 블랜드를가져야 합니다. 이것이 저자가 바라는 위치일겁니다.


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo