머신러닝 리스크 관리 with 파이썬 - 안정성과 신뢰성 높은 견고한 모델을 구축하는 방법
패트릭 홀 외 지음, 윤덕상 외 옮김 / 한빛미디어 / 2024년 5월
평점 :
장바구니담기


요즘 인공지능을 많이 활용해보면서 걱정 되는 부분은 관련 법규와 잠재적 위법 요소가 빠른 속도로 바뀌면서 해당 모델이 법적으로 적합한지가 가장 많이 걱정이 되었다. 이에 대한 책을 리뷰할 수 있게 되어 감사를 표하고 읽어보면서 느낀 점을 간단하게나마 설명해보고자 한다.

목차 1부에서는 현대의 머신러닝 위험관리, 해석 및 설명 가능한 머신러닝, 안전성과 성능을 높이는 머신러닝 시스템 디버깅, 머신러닝 편향관리, 머신러닝 보안을 알려준다. 2부에서는 설명 가능한 부스팅 머신과 XGBoost 설명, 파이토치 이미지 분류기의 모델 선택 및 디버깅, XGBoost를 사용한 평향 테스트 및 개선, 레드 팀 XGBoost 관련 파트가 있다. 3부 결론에서는 고위험 머신러닝에서 어떤 방법을 써야 안전한 결과를 낳는지를 자세하게 알려준다.

각 파트의 구성은 한 뭉텅이처럼 자연스럽게 과거부터 지금까지의 역사를 시작으로 디테일하게 알려준다. 인상적인 부분은 미리 해커들을 공격을 파악해보는 레드 팀 기능이다. 모델에 데이터를 제공하고 해당 데이터의 예측 결과를 받아보는 모델 추출 공격, 데이터 입력에 접근한 다음 모델과 상호작용을 통해 개별 예측을 받는 대립예제 공격, 데이터 유출이나 탈취를 목적으로 하는 소속 추론 공격, 데이터에 접근해 망가뜨리는 데이터 오염 등 여러 공격 유형을 알아본다. 내가 보안 팀에 근무하는 것은 아니지만 이러한 공격이 있다는 것을 알고 있다는 것이 큰 도움이 될 것 같다.

파트 끝부분에 참고자료가 종종 있는데 관련 논문이나 사이트를 참조하면서 공부하는 부분이 이해가 되는 도움이 컸다.

그리고 경험으로 얻은 교훈이 있는데 이를 통해 '이러한 문제가 있을 때 해야 하는 것'을 알 수 있어서 대처할 때 시간을 많이 쓰지 않을 수 있을 것 같아 개인적으로 마음에 들었다.

부록에는 파트 중간중간에 시각화를 해놓은 그림이 실려있어서 따로 시각화를 해볼 시간을 줄일 수 있어서 좋았다.

머신러닝을 비즈니스에 적용하면서 어떠한 부분을 조심해야하는지 알고 싶은 분들에게 추천해주고 싶다.


"한빛미디어 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다."






댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo