-
-
머신러닝 시스템 설계 - 프로젝트 범위 산정부터 프로덕션 배포 후 모니터링까지, MLOps 완벽 해부하기
칩 후옌 지음, 김대근.김영민 옮김 / 한빛미디어 / 2023년 3월
평점 :
챗GPT는 인터넷에 존재하는 모든 지식을 습득해 궁금한 질문에 대한 의견을 생성하는데요. ML(머신러닝)은 사용하는 데이터를 기반으로 학습 및 성능 향상을 지원하는 시스템을 구축하는 데 초점을 맞춥니다. ML의 실제 적용 사례가 늘어나고 관련 산업이 익숙해집니다. 많은 기업에서 ML 모델을 활용한 비즈니스를 시도하기 시작하면서 모델을 빠르게 개발, 훈련, 배포, 운영할 자동화 프로세스를 고민하며 이에 머신러닝 운영의 줄임말인 MLOps가 대두되었습니다.
이번에 소개할 머신러닝 시스템 설계 저서는 ML 시스템을 전체적인 관점으로 바라보고 접근합니다. 시스템의 다양한 구성 요소와 이해관계자들의 목표를 고려해 다양한 사례 연구를 바탕 된 내용을 설명하고 있습니다.
MLOps 분야의 대표 강의인 스탠퍼드 CS329S: 머신러닝 시스템 설계를 기반된 내용을 담고 있습니다. 저자인 칩 후옌은 넷플릭스부터 스타트업까지 다양한 기업에서 ML을 배포하고 운영한 경험들도 만날 수 있습니다. 답을 찾기 어려웠을 법한 질문에 대한 접근법과 특정 도구 사용법보단 각 ML기법의 개념 및 장단점과 트레이드오프에 집중합니다.
MLOps의 Ops는 Developments Operations의 줄임말인 DevOPs에서 유래합니다. 무언가를 운영함은 그것을 프로덕션 환경에 적용함을 의미해 여기엔 배포, 모니터링, 유지관리가 포함됩니다. MLOps는 ML을 프로덕션 환경에 적용하기 위한 도구와 모범 사례의 집합입니다.
ML이라고 하면 보통 모델 개발과 알고리즘을 떠올리지만 실제로 프로덕션 환경에서 ML을 운영할 때는 그 외에 생각해야 하는 부분들이 많습니다. 프로덕션용 ML은 대부분 비즈니스를 중심으로 하는 만큼 비즈니스 문제에 따른 요구사항과 이해관계자 또한 중요한 점을 자세하게 말합니다.
이 책에서 ML은 딥러닝과 고전적인 알고리즘을 모두 의미하며, 중견 기업이나 빠르게 성장하는 스타트업에서 볼 수 있는 대규모 ML 시스템에 중점을 둡니다. 소규모 ML 시스템은 상대적으로 덜 복잡하기에 이 책에 제시하는 포괄적인 접근법에서 얻는 이점이 담겨 있습니다.
머신러닝 시스템 설계는 데이터 과학자가 ML 프로젝트 수명 주기의 각 단계를 진행하면서 맞닥뜨린 문제를 반영합니다. 1~2장에는 가장 기초적인 질문, 프로젝트 목표를 잘 선택하고 간결한 솔루션에 도달하기 위해 문제를 구성하는 방법을 다룹니다.
4~6장은 ML 프로젝트의 배포 전 단계인 학습 데이터를 생성하고 피처 엔지니어링을 수행하는 일부터 개발 환경에서 모델을 개발하고 평가합니다. 이 부분에서는 ML과 문제 도메인 모두에 대한 전문성이 필요합니다.
7~9장은 ML 프로젝트의 배포와 배포 후 단계로 모델 배포가 배포 프로세스의 끝은 아닙니다. 배포한 모델은 지속해 모니터링하면서 변화하는 환경과 비즈니스 요구 사항에 발맞춰 업데이트합니다.
ML 시스템 구축하려면 각기 다른 배경의 이해관계자들이 협업해야 합니다. 3장은 데이터 시스템에 10장은 컴퓨팅 인프라와 ML 플랫폼에 원활한 협업에 필요한 인프라에 중점을 둡니다. 11장은 ML 모델의 확률론적 특성에 따라 사용자 경험이 어떻게 영향받는지 논의합니다. 한 시스템을 개발하는 구성원들이 효과적으로 협업하기 위한 조직 구조를 알아보고, ML 시스템이 사회 전체에 미치는 영향을 들여다봅니다.
머신러닝 시스템 설계는 MLOps에 시스템으로 접근하며, 시스템의 각 요소와 이해관계자가 협업함으로써 정해진 목표와 요구사항을 충족하도록 ML 시스템을 총체적으로 고려합니다.
이 책은 특정 개념과 솔루션을 설명하면서 현재 사용되는 도구를 언급하지만, 튜토리얼은 아닙니다. 기술을 점점 진화하며, 도구는 새로운 것이 나오면 곧 유행에 뒤처지지만, 문제에 대한 근본적인 접근법은 더욱 길게 지속되는데요. 유스케이스에 어떤 도구가 가장 적합한지 판단하는 데 도움이 되는 정보를 제공합니다. 코드 스니펫이 거의 없으며 트레이드오프, 장단점, 구체적인 예시를 논의하는 데 중점을 둡니다.
이제는 오프소스 생태계의 활성화, ML 프레임워크의 급격한 발전 그리고 수많은 개발 도구의 등장으로 ML의 진입 장벽이 많이 낮아졌는데요. 머신러닝 시스템 설계는 MLops에서 가장 중요한 요소를 다루는 실용 책이라고 할 정도로 ML 시스템을 만들 때 고려해야 하는 모든 요소를 다룹니다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."