[wizmusa님의 서재] : 알라딘

이상적인 MLOps 엔지니어가 썼을 ‘MLOps 실전 가이드‘ｌ마이리뷰

wizmusa l 2023-07-24 00:06

https://blog.aladin.co.kr/773370185/14769779

MLOps 실전 가이드 - DevOps와 MLOps의 이론과 실습부터 클라우드 컴퓨팅, AutoML, 엣지 컴퓨팅까지 | AWS, GCP, Azure 클라우드 기반 환경 실습 노아 기프트.알프레도 데자 지음, 이장후 외 옮김, 맹윤호 감수 / 한빛미디어 / 2023년 7월 평점 :

직업이 직업인지라 MLOps는 물론 여러 가지 인프라, 플랫폼에 대한 책은 꽤 읽은 편이다. 이 책만큼 수다스럽다고 느껴지는 책은 언뜻 기억나지가 않는다. 아래에 옮겨둔 목차를 보아도 알 수 있듯이 MLOps 엔지니어가 능숙하길 기대 받는 영역을 모두 다루었다고 해도 과언이 아니다. 코세라의 MLOps 강좌보다 많은 얘기를 한다. 현장은 코세라에서 다루고 싶어도 그러지 못할 정도로 난장판이기 때문이다.

난장판을 헤쳐왔을 저자들은 하고 싶은 말이 참 많아 보인다. 때문에 MLOps를 해볼까 하는 3년차 이내 엔지니어는 이 책을 보고 장벽을 많이 느낄 듯하다. 출간 전에 이 책을 읽은 베타리더들도 그런 걱정을 해서였는지 광범위하고 어렵게 느껴질 수 있겠지만 다양한 인사이트를 얻을 수 있다거나 다이빙 포인트를 잘 안내한다며 추천하고 있다. 이런 저런 AI 프로젝트를 벌이고 운영했던 경험을 비춰 보았을 때에 이 책이 이야기하는 주제는 2023년 기준 MLOps 기술의 합집합에 가깝다고 본다. 내가 무엇을 모르는지 자각하는 도구로 활용하길 바란다. 더불어 너무 걱정하지 않아도 좋을 게, 이 책의 저자는 두 명이고 모두 말이 많은 직업을 가졌다. 저자들의 해박함에 기가 죽을 필요는 없다. 저걸 한가하게 혼자서 다 하게 하는 조직은 없다.

소소하게 이 책을 소화할 팁을 더해보고자 한다. 쿠버네티스를 마스터하고 이 책을 볼 필요는 없지만 ssh가 뭔지는 알고 도커가 뭔지는 알아야 시작이 가능하다. ONNX가 뭔지 모르면 곤란하다. 어디 블로그를 통하든 뭘 하든 텐서플로나 파이토치로 모델을 만들어 학습하고 API를 띄우는 예제는 실행하며 대략적은 구조는 알아야 이 책을 훑어보는 게 가능하다. Google Colab으로도 할 수 있는 범위다. 이 정도를 할 줄 알면 무슨 얘기인지 도저히 이해가 가지 않는 용어들이 나와도 일단 한 번 완독하는 게 좋겠다. 양산형 인공지능 도서들과는 달리 저자들이 한두 달만에 익힌 경험을 책으로 옮긴 게 아니므로 한번에 이해가 가지 않는 게 당연하다. 회사 자원을 잘 써서 실습을 꼭 해야 자기 것이 되니 눈치 잘 보면서 꼭 클라우드에서 돌려보길 바란다.

안타깝게도 학생은 클라우드 환경에서 실습하기가 꽤 힘들다. 웹 서버 좀 돌려보기와는 차원이 다르게 돈이 나간다. 퍼블릭 클라우드 계정을 계속 만들어 쓰든 어떻게든 무료 포인트를 잘 받아서 일부라도 돌려보면 도움이 크게 되겠다. 취업을 위해서 이걸 다 해내려고 들지는 않는 게 좋겠다. 정말 불가능하다고 단언한다. 왜 해야 하는지 모르기 때문이다. 행여 주니어에게 MLOps 전반적으로 능숙하길 바라는 정신 나간 조직은 피해야 한다. 학생은 앞서 얘기한 것에 이어서 MLflow, BentoML에 Yatai까지만 돌려볼 줄 알아도 사랑 받을 만하다. MLOps도 좋지만 리눅스 OS, 리눅스로 다루는 네트워크, 도커 기술에 친숙해지는 게 더 우선이다. 그걸 모르는 조직 역시 당장은 급해도 피하는 게 낫다. 건투를 빈다.

댓글(0) 먼댓글(0) 좋아요(1)

ｌ

찜하기 ｌ

정말 쉽게 다가오는 ‘박태웅의 AI 강의‘ｌ마이리뷰

wizmusa l 2023-07-08 16:00

https://blog.aladin.co.kr/773370185/14726043

박태웅의 AI 강의 - 챗GPT의 실체부터 AI의 진화와 미래까지 인간의 뇌를 초월하는 새로운 지능의 모든 것 박태웅 지음 / 한빛비즈 / 2023년 6월 평점 :

소셜 미디어에서 크게 인기를 끄는 '박태웅의 AI 강의'를 이제서야 읽었습니다. 저자가 ChatGPT가 나오지 않았으면 쓰지 않았을 거라고 인터뷰에서 밝힌 적이 있음에도, 인공지능의 원리를 설명하는 대목은 기초적인 원리부터 다룹니다. ChatGPT가 뭔데 사람들이 저러나 궁금하거나, 알파고 열풍 때에는 뭘 바둑갖고 저러는지 거들떠 보지 않았더라도 이제는 인공지능이 궁금해졌다면 교양서라는 관점을 지키는 이 책을 추천합니다.

이런 걸로 구구절절 설명하지 않습니다.

인공지능 개념과 원리를 다루는 책에서는 입문서가 아니어도 loss function이 어떻고 저떻고 batch 크기가 이러쿵 저러쿵 설명하느라 AI 업계에 종사하지 않는 비전문가 독자들이 머리를 쥐어뜯게 하는 일이 흔히 벌어집니다. 이 책은 다릅니다. 위와 같은 그림이 나오긴 하는데 인공지능이 학습하는 매개변수가 막대하다는 근거 정도로만 쓰고 산뜻하게 넘어갑니다.

인공지능이 동작하는 원리를 쉽게 설명하는 이유는 인공지능이 우리 사회에 끼칠 영향을 설명하기 위해서라고 봅니다. 다짜고짜 인공지능이불러오는 리스크가 크다고만 하면 넋두리나 잔소리일 수밖에 없습니다. 이 책은 기본 개념부터 시작하여 ChatGPT, GPT 모델이 그럴싸하게 동작하게 되는 원리를 설명하며 독자와 출발선을 맞춥니다. GPT와 비슷한 기술이 '요 며칠 새'에도 어마어마한 속도로 발전하는 중이라든가 할루시네이션이랍시며 얼마나 어이 없는 실수를 하는지 등 '비교적' 최근 트렌드까지 섭렵하고 나면 본론이 나옵니다.

일단은 성능에 감탄하고 있지만, 올바른 방식과 절차로 만들었는지 이대로 계속 인공지능이 발전해도 될지 우리 사회가 공감대를 이뤄나가야 할 사안을 다룹니다. 디스토피아가 온다며 설레발치지 않고, 우리가 같이 고민하며 대비할 사항에 대해 세계적인 석학과 공공은 어떻게 대응하는지 공유하고 대한민국은 어떻게 해야할지 제언하면서 마무리합니다. 이를 잘 소화하면 인공지능이 발전하며 세상에 일으키는 격랑에 대비할 마음가짐을 갖추게 될 겁니다.

책을 덮고 꽂아두기 전에 포스트잇을 붙여뒀던 부분을 다시 보며 저자가 견지하는 자세를 많이 참고해야겠다는 생각이 들었습니다. '당신이 생각하는 식으로 인류는 절멸하지 않는다'라는 글을 쓴 적이 있는데, 근본적으로는 오로지 사람 탓으로 인공지능이 인류에게 큰 해를 끼칠 거라는 내용입니다. 이 책에서도 인공지능을 잘못 활용하여 의료사고가 날 거라는 석학이 예상했다는 말을 인용했습니다만, 제가 썼던 글처럼 난리 난다며 꽹가리를 치는 게 아니라서, 독자가 불안해하지 않고 저자를 의지하며 귀를 더 기울일 거라고 생각했습니다. 가능한 한 세상을 널리 이롭게 해야겠다고 마음 먹었으니 기분에 못 이겨 말로, 글로 발산하지 않고 전달하는 방법을 고민하겠다고 반성했습니다.

댓글(0) 먼댓글(0) 좋아요(0)

ｌ

찜하기 ｌ

걱정스러운 눈길이 느껴지는 ‘랜선 사회‘ｌ마이리뷰

wizmusa l 2023-06-26 12:54

https://blog.aladin.co.kr/773370185/14691242

랜선 사회 - 온라인 커뮤니티에서는 어떤 일이 일어나는가 에이미 S. 브루크먼 지음, 석혜미 옮김 / 한빛미디어 / 2023년 5월 평점 :

2023년을 살면서 내가 사는 우리 사회가 어떻게 흘러가는가 가끔 고민을 합니다. 그러다 인터넷과 요즘 세태를 다룬 몇몇 글을 찾아 보면 관점이 제각각이며 최근 이슈에 국한한 글이 태반이라 아쉬움을 많이 느끼곤 했습니다. 이 책은 그리 두껍지 않은 분량인데도 인터넷 태동부터 커뮤니티를 형성하며 변화해온 이력을 빼곡하게 전해줍니다.

인터넷이 웹 브라우저를 통해 대중화됐다고 치면 대략 30년, 유즈넷까지 감안하면 그보다 오랫동안 인터넷 커뮤니티는 우리 사회 한 구석에 이미 자리를 잡고 있었습니다. 스마트폰, 소셜 미디어의 등장과 더불어서 기존 매체에 비해 더 생활에 밀착하면서부터는 변화하는 속도를 우리 사회가 온전하게 받아들이지 못해 이런 저런 문제가 생기는 형국이 된 지도 오래입니다. 문제가 없었다면 이 책이 나오지 않았을 것입니다.

인터넷 커뮤니티를 둘러싼 삐걱임과 누구도 확연한 대안을 제시하지 못하는 상황의 면면을 짚고 나서, 저자는 아주 나즈막하게 당장 시작할 수 있는 대안을 제시합니다. 책을 읽다가 종종 참 조용조용한 양반이겠다는 생각이 들었을 지경입니다. 정치인이 아닌 학자로서의 입장이라서 그랬을까요? 때문에 이 책에서 논지를 전개하는 내내 시원시원하다는 느낌은 전혀 들지 않습니다. 독자 성향에 따라 완독하기 힘들 수도 있겠습니다.

그렇다 하더라도 목차를 보면 알겠지만 뭐 하나 뺄 내용이 없습니다. 조곤조곤 필요한 사항을 추렸기 때문이겠습니다. 우리 사회를 이해하고, 현재 상황을 근거로 삼아 내 논지를 전개하고자 할 때, 이 책은 객관적이자 따스한 근거를 제시해 주리라 믿습니다.

댓글(0) 먼댓글(0) 좋아요(1)

ｌ

찜하기 ｌ

인과추론 입문서 ‘원인과 결과의 경제학‘ｌ마이리뷰

wizmusa l 2023-06-18 19:01

https://blog.aladin.co.kr/773370185/14671972

원인과 결과의 경제학 - 넘치는 데이터 속에서 진짜 의미를 찾아내는 법 나카무로 마키코.쓰가와 유스케 지음, 윤지나 옮김 / 리더스북 / 2018년 9월 평점 :

트위터에선가 '인과추론'을 익히기에 좋은 책이라고 추천한 글을 보고 냅다 사서 읽었습니다. 저자가 아주 쉬운 인과추론 입문서라고 밝혔듯이 통계학 지식이 거의 없어도 찬찬이 읽으면 오롯이 이해가 갈 정도로 쉬운 수준입니다. Python에서는 무슨 라이브러리를 쓴다든가 하는 내용은 없습니다. 실무를 시작하며 인과추론을 어떻게 시작해야 할지에 대한 내용은 딱히 없어서 다른 책을 더 찾아 읽어야 하겠습니다만, 원론적인 지침을 이해하기에는 좋았습니다. 어떻게 보면 통계학도보다는 사람들이 악의적인 속임수로 쓰인 숫자에 농락 당하지 않고 현실을 온전히 관찰하기를 바라는 마음에 쓴 책이 아닐까 싶습니다.

댓글(0) 먼댓글(0) 좋아요(1)

ｌ

찜하기 ｌ

A~Z가 다 나온 ‘데이터 품질의 비밀‘ｌ마이리뷰

wizmusa l 2023-05-23 16:59

https://blog.aladin.co.kr/773370185/14606371

데이터 품질의 비밀 - 데이터 신뢰를 쌓는 데이터옵스의 핵심과 엔드 투 엔드 단계별 가이드 바 모세스.라이어 개비쉬.몰리 보르웨르크 지음, 데이터야놀자 옮김 / 디코딩 / 2023년 4월 평점 :

IT 일을 하는 내내 데이터와 어울렁더울렁하며 살았기에 데이터 품질과 거버넌스라는 개념 자체에는 익숙합니다. 그럼에도 속시원하게 데이터 품질관리를 했거나 거버넌스를 실현했다고 감히 말하지 못합니다. 업무 관련 법규에 따라 강제로 DBMS 메타데이터 관리를 도입했던 조직은 필요한 데이터를 모두 DB에 넣지 못했고, 그런 관리 솔루션을 도입하지 못했던 조직은 뭐는 'T', 뭐는 '1', 뭐는 TRUE, 뭐는 'Y' 혹은 'y' 같은 식으로 이력을 모르면 분석할 엄두를 내지 못하는 지경이기도 했습니다. 2023년을 기준으로 '데이터 거버넌스'는 민망하거나 엄두가 나지 않아 꺼내기 힘든 어휘이기도 합니다. 전산실에서 일하던 때에는 어떻게든 데이터 거버넌스를 도입하고 싶어서 선두주자이지만 고가였던 전문 솔루션은 제치고 MS Data Quality Services(https://learn.microsoft.com/ko-kr/sql/data-quality-services/data-quality-services) 자료를 탐독하기도 했습니다. 그나마 도입 가능하다고 보았었지요.

빅데이터가 대세가 되자 데이터 거버넌스의 전 단계로 데이터 카탈로그 도입을 많이 거론했습니다. Hadoop 에코 시스템의 Atlas(https://atlas.apache.org/)는 일견 매력적이었으나 클라우드 시대를 맞아서는 들어맞지 않는 부분이 생겨서 개인적으로는 작별을 고했습니다. 그렇게 AI 열풍을 맞아 지내다 이 책을 만났습니다. 꽤 놀라웠습니다. 고민하고 살던 이슈 중 상당 부분을 이 책에서 거론하고 있었습니다. 저자들의 식견이 상당합니다. 데이터 웨어하우스, 데이터 레이크, 데이터 플랫폼, 데이터 거버넌스 등 데이터를 기술 관점만이 아니라 경영과 운영(Operation) 면에서도 수준 높게 다루고자 하는 이는 이 책을 가이드 삼아 action plan을 만들어도 좋겠습니다.

다만, 예시를 너무 자세히 보이거나 통계지표를 나열하다가 IT 아키텍처를 논하면서 나중에는 정책과 방향성을 다루는 이 책의 내용이 널뛰는 듯하게 느껴질 수도 있겠다는 우려가 들었습니다. 저자가 여럿이어서 그럴 만하긴 한데, IT 부서만 잘한다고 데이터 품질이 잘 관리되는 게 아니기 때문이기도 하겠습니다. 더불어 TO-BE 이미지를 명확히 제시하지는 않기에 IT 경험이 적은 독자는 두루뭉술하다고 오해하여 짜증이 날 수 있습니다. 이 사안은 조직문화와 직결하기에 정답이 나오지 못하다는 현실을 알아주길 바랍니다. 누가 뭐래도 데이터 업무 종사자라면 한 번 읽고 버릴 책은 아니라고 봅니다. 내가 뭘 빼먹고 있지는 않은가 가끔씩 살피기에 적당하겠습니다.

댓글(0) 먼댓글(0) 좋아요(0)

ｌ

찜하기 ｌ

wizmusa님의 서재

리스트

마이리뷰

마이페이퍼

방명록

서재 태그

이상적인 MLOps 엔지니어가 썼을 ‘MLOps 실전 가이드‘ｌ마이리뷰

wizmusa l 2023-07-24 00:06

정말 쉽게 다가오는 ‘박태웅의 AI 강의‘ｌ마이리뷰

wizmusa l 2023-07-08 16:00

걱정스러운 눈길이 느껴지는 ‘랜선 사회‘ｌ마이리뷰

wizmusa l 2023-06-26 12:54

인과추론 입문서 ‘원인과 결과의 경제학‘ｌ마이리뷰

wizmusa l 2023-06-18 19:01

A~Z가 다 나온 ‘데이터 품질의 비밀‘ｌ마이리뷰

wizmusa l 2023-05-23 16:59

서재지수 : 5977점

오늘의 마이리스트

최근 댓글

먼댓글 (트랙백)