기본적으로 데이터의 구조와 결과물을 명확하게 이해하고 있어야 각 언어와 툴의 기능을 빠르게 학습할 수 있다. - P70
아주 쉽고 간단한 툴 하나를 배울 때도 어떤 데이터를 집어넣고 분석하면 어떤 결과물이 나오는지 알고 있어야 한다. 그래야 다른 툴에서 언어와 단계가 다르면 어떤 결과물을 낼 수 있는지 차이를 비교하면서 배울 수 있다. - P70
칼의 종류가 많다고 요리가 맛있어지는 건 아니다. 하나의 칼로도 무수한 요리를 만들 수 있다. 하지만 다양한 도구가 있으면 때로 더 편하고 쉽게 요리를 할 수 있다. - P71
채칼이 있으면 더 빨리 채를 썰 수 있지만 채칼이 없다고 채썰기가 불가능한 것은 아니다. 즉, 얼마나 많은 양을 얼마나 빨리 만들어내야 하는지 판단할 필요가 있다. 채칼이 있으면 더 빨리 더 많이 채 썬 재료를 준비할 수 있다는 건 자명한 사실이기 때문이다. - P71
빅데이터를 다루려면 현저하게 빠른 속도, 효율성만으로도 툴의 도입 가치가 충분하다. - P72
내가 하고싶은 일에 필요한 역량이라면 꾸준히 지속할 필요가 있다 - P75
내 전공이 아닌 다른 분야의 공부를 꾸준히 하다 보면 내 전공의 전문성에 그 분야가 더해져 나만의 강점이 생긴다. - P75
커피 로스팅 스펙트럼을 몰랐다면 커피 판매와 소비자 취향을 연결해 분석하기 어려웠을 것이다. 어떤 분야를 공부하면 반드시 내 일에 깊이가 더해진다. - P76
문제를 어떻게 해결할지, 상황을 정리하는 힘을 갖고 있어야 어떤 방법으로 데이터를 분석할지 알 수 있다. - P76
커피에 관해 잘 알고 있으면 커피 회사의 데이터를 더 잘 분석할 수 있다. - P77
우리가 어떤 선택을 한 데엔 분명 이유가 있다. 먼 길을 돌아온 것처럼 느껴지고 ‘내가 저걸 왜 했었지?‘ 싶은 일들도 있을 것이다. 하지만 지금 하는 일에 그때의 경험을 접목해보려고 노력한다면 버려지는 시간은 하나도 없다. - P77
학습시키는 데이터 자체에도 사람의 가치판단이 들어간다. - P78
지금 단계에서 이 기술을 도입하는 것이 어떤 영향을 미칠 수 있는지 가치판단을 해야 한다. 데이터 사이언티스트는 이런 가치판단을 사람들에게 전달할수 있어야 한다. 어떤 데이터에서 어떤 결과를 얻게 되는지 구체적으로 알고 있는 사람이기 때문이다. - P80
데이터의 특성에 따라 생길 수 있는 일들을 설명해줘야 한다. ‘난 그저 지시에 따라 채용을 위한 모델을 만들었다‘고 한다면 그 일에서 파생될 수많은 문제들을 방조하는 셈이다. 이 데이터가 현실에 끼칠 영향을 해석하는 일이 왜 중요한지 잘 생각해봐야 한다. - P80
먼저 제너럴리스트가 되어야 스페셜리스트가 될 수 있는 것 같다. 요즘에는 학문의 경계나 분야도 모호해지고 있다. 연결을 통해 빛나는 아이디어를 만들어낼 수 있는 시대다. - P81
스페셜리스트가 될 수 있는 중심축을 하나 세운 다음 제너럴리스트로서 여러 분야를 두루 알고 차용할 수 있어야 한다. 이것이 진정한 전문가가 되는 길이다. 하나의 전문 분야를 가진뒤 다른 분야를 만날 때 생각의 깊이가 달라진다. - P81
한 영역에만 머무를 때는 좋은 데이터 사이언티스트가 되기 어렵다. 자신의 영역에서 정점에 이르러야 원리가 보이고 다른 영역에 적용하기가 쉬워진다. - P82
마케팅을 하면서 엑셀로 데이터를 잘 만지던 사람은 통계 원리를 파악하고 기술을 통해 어떤 결과물을 내야 하는지 좀 더 수월하게 깨달을 수 있다. 특히 마케팅 결과물을 어떻게 만들어야 시장이 반응하는지 머릿속으로 상상할 수 있기 때문에 어떤 데이터가 필요한지 아이디어도 낼 수 있다. - P82
통계 전문가라면 다양한 툴을 이용해 기술을 배우기가 더 수월하다. 어떤 통계 툴에 정통하면 다른 것도 배우기 쉽다. ‘아, 이 기능은 내가 원래 사용하던 툴의 이 기능과 같구나‘ 하고 이해할만한 기준이 있기 때문이다. 기준과 대조하면서 기술을 익히면 좀 더 빠르게 습득할 수 있다. - P83
거듭 말하지만 이 세 영역(기술, 통계, 인문)을 완벽히 갖춘 사람은 거의 만나본 적이 없다. 다들 하나의 영역에서 최고의 자리에 오른 뒤 다른 영역으로 나아간 사람들이었다. 따라서 어떤 특정 분야에서는 부족한 점이 있었으며, 이는 인간의 시간과 에너지가 한정적인데서 비롯되는 일이기에 단점이라고 보기 어렵다. - P83
다양한 시장을 경험하는 것도 스페셜리스트가 되는 데 도움이 된다. 커피 시장이 어떤 식으로 움직이는지, 휴대전화가 사람들에게 어떻게 이용되는지, 사람들이 도서를 어떻게 사는지 ‘알아야‘ 데이터를 분석하고 이들을 위한 웹/앱을 만들 수 있다. - P84
무엇이든 아는 것은 또 다른 영역에 도움이 된다. 쓸모없는 경험이란 없으며, 언젠가는 분석의 자양분이 된다. - P84
기본적으로 나와 다른 분야에 매진한 사람에 대한 존중이 필요하다. 내가 선택하지 않은 일이라고 해서 덜 중요한 일은 아니다. - P89
클라이언트가 무엇이 필요하다고 했는지, 소비자는 무엇을 원하는지 지속적으로 듣고 자신이 구현할 수 있는 기술과 연결하려는 노력을 해야한다. - P90
데이터를 어떻게 활용할지 충분히 소통하지 않고 단순히 데이터를 요청하면 단답식 대화로 끝날 수밖에 없다. 데이터가 필요한 마케터와 엔지니어가 이 데이터로 어떤 결과를 이끌어낼지 데이터의 목적을 논의하면서 ‘주기‘란 무엇인지, ‘짧다와 길다‘의 기준은 무엇인지 정의하는 과정이 있다면 데이터를 비즈니스에 의미 있게 활용할 가능성이 훨씬 높아진다. - P91
진심으로 지금보다 나아지길 바라는 마음, 지금 있는 문제를 해결하고 더 나은 방법을 찾고 싶은 마음, 새로운 기술이 나왔을 때 기꺼이 자신의 시간을 들여 습득하려는 마음, 이런 마음을 나는 향상심이라고 부르고 싶다. - P94
기본적으로 향상심은 부족함을 느끼는 데서 시작된다. - P96
오히려 어떤 분야에서 경지에 이른 사람들이 "나는 모르는 것이 너무 많다"고 말하는 경우가 많다. - P96
언제나 모든 것을 가질 수는 없다. 포기하고 희생해야 할 것들이 있다. 환경의 제약을 생각한다면 반대로 그 환경에서의 편안함을 선택한 것이다. 뭔가를 얻기 위해서는 약간의 불편함을 감수할 수밖에 없다. 일주일 중 단 몇 시간이라도 짬을 내어 원하지만 못했던 일을 한다면 몇 년 혹은 수십 년 뒤에라도 반드시 돌아온다. - P98
동기는 현실과 이상의 차이를 느낄 때 부여된다. 이상이 없으면 현실에서 더 나아지기 위한 노력의 필요도 못 느낀다. 꿈을 꾸는 건 그래서 중요한 일이다. - P98
데이터 사이언티스트의 업무는 지금 상태를 개선하는 일을 하거나 듣도 보도 못한 프로젝트를 시작하거나 전혀 모르는 새로운 기술을 습득해 적용해야 하는 일이 대부분이다. 향상심이 있는 사람은 이 일들을 하는 데 잘 맞을 것이고 변화없이 편안함을 추구하고 싶은 기질의 사람과는 잘 맞지 않을 수도 있다는 것이다. - P99
현실을 데이터로 변환하는 역량이 필요하다 ...(중략)... 이 역량은 현실에 대한 호기심에서 시작한다. - P99
더 나은 방법은 없을지 생각하는 것의 출발점은 스스로 어느 정도의 불편함을 느끼는 것인데, 그 불편함 자체가 전혀 없다면 개선의 실마리를 찾기 쉽지 않다. - P100
스스로 불편함을 잘 느끼지 못하거나 이 정도는 큰 문제가 아니라는 생각이 든다면 다른 사람에게 물어보는 방법도 있다. 주변에 앉아 있는 사람들이 혹시라도 불편해하는 부분은 없는지 살펴볼 수도 있다. 나는 눈치채지 못했지만 다른 입장 ㅡ 가족단위 고객, 어린아이가 있는 경우, 커다란 짐이 있는 경우 ㅡ 에 따라 전혀 다른 문제들이 생길 수 있다. - P100
나 혹은 타인이 왜 불편했는지 각자의 입장을 돌아보면서 지금 문제가 무엇인지, 이 문제를 수치화할 수 있는지, 수치화할수 있다면 개선 가능성을 데이터로 어떻게 찾아낼 수 있는지 생각하는 것. 이 모든 시작에 약간의 호기심이 필요하다. - P100
질문들의 시작이 지금 내가 보고 있는 것들을 조금 다른 각도에서 보려고 노력하는 태도다. - P101
전혀 궁금하지 않은 사람을 떠올려보자. 물어볼 것도 없고 그사람이 무슨 생각을 하는지도 알고 싶지 않다. 결국 그 사람에게서 뭔가를 더 알아내기 어렵고 관계도 개선될 수 없다. - P101
데이터 분석도 마찬가지다. 모든 현상을 궁금해하지 않는 사람은 그 현상을 더 낫게 만들 가능성이 희박하다. 왜 이런 문제가 생겼는지 데이터로 파볼 생각도 들지 않을 텐데 어떻게 데이터 분석을 시작할 수 있단 말인가. - P101
좋은 데이터 사이언티스트들은 호기심이 많다. 주변의 온갖 것에 ‘왜?‘라는 질문을 던질 줄 안다. 그래야 그 질문에 답하기 위해 데이터를 찾아볼 수 있고 그 데이터에서 답을 찾아내 현실을 바꿀 단초를 제공할 수 있기 때문이다. - P101
사교적이라는 것은 언변이 좋거나 외향적이라는 뜻이 아니다. 우리 회사 제품을 판매하거나 구매하는 사람들이 뭘 원하는지 알기 위해 노력한다는 것이다. - P102
데이터를 분석한 뒤 다시 현실에 도움이 되게 쓰기 위해서는 현장에 있는 사람들과 친해져야 한다. 그들에게서 우리 회사 고객이 일반적으로 느끼는 문제가 무엇인지도 파악할 수 있다. - P102
좋은 데이터 사이언티스트가 되려면 견고한 성에 갇혀 있는 것이 아니라 성문을 열고 마을로 나와 사람들과 함께해야 한다 - P102
자신만의 분석이 아닌 고객이 원하는 분석을 하기 위해서는 영업 조직과 친밀해야 한다 - P102
스스로 제품의 개선점을 찾아낼 수 없다면 무엇을 개선하면좋을지 가장 잘 알고 있는 사람들과 교류하면서 끝없이 새로운 분석 주제를 찾아내야 한다. 사람들에게 필요한 분석이 활용되는 것이지, 1명의 데이터 사이언티스트가 독보적인 천재여서 모두가 납득할 수 있는 분석 결과를 내는 경우는 많지 않다. - P103
데이터가 실제로 살아 움직이게 하려면 현실의 문제를 다루고 있어야 하며 데이터가 다시 현실에 좋은 영향을 미치게 해야 한다. - P103
모든 일을 데이터 사이언티스트 혼자 할 수는 없다. 아이디어가 있는 현실과 가장 맞닿아 있는 사람에게 도움을 요청해야 할 때가 반드시 있다. - P103
데이터에 대해 주도적인 의식을 갖는 것은 개인의 커리어를 위해서도 반드시 필요한 역량이다. 남이 시키는 일을 수동적으로 하는 것이 아니라 스스로 데이터의 주인이 되는 것. 이는 개인의 커리어 방향성과 전반적인 발전 가능성에 아주 큰 영향을 미친다. - P103
철저히 수동적으로 어떤 숫자만 만들어내는 일은 피해야 한다. 스스로 생각하고 숫자를 만들고 여러 팀에 제안할 줄 알아야 한다. - P104
데이터로 분석할 줄 안다는 것은 머릿속에 있는 것을 분석해 구현할 수 있다는 의미이며, 그 분석이 뜻하는 바를 다시 스스로 머릿속에서 해석할 수 있다는 것이다. 이런 완결성을 갖추는 것이야말로 데이터를 갖고 있는 사람에게 힘이 된다. - P104
데이터만큼은 내게 주도권이 있다는 의식을 갖고 적극적으로 분석하는 자세가 필요하다. 새로운 기술이 나왔을 때 적용해보기도 하고 새로운 모델을 공부해 어느 부분에 활용할 수 있을지 고민도 해보면서 데이터 사이언티스트가 성장하면 회사의 데이터 보유와 분석도 성장할 수 있다는 사고방식 - P105
|