-
-
이미지 처리 바이블 - 파이썬, OpenCV, 텐서플로로 배우는 이미지 처리와 컴퓨터 비전의 모든 것!
류태선.콥스랩 연구원 지음 / 길벗 / 2024년 4월
평점 :
유튜브를 보다보면 LLM 인공지능의 발달(생성형AI포함)로 개발자의 위기를 토로합니다. 페이스북도 분위기가 비슷합니다. 개발자들의 푸념이 가득합니다. 그런데 정말 개발자는 끝난걸까요. 아직은 아니라고 봅니다. 왜냐하면 챗GPT의 능력을 제대로 발휘할 수있는 사람이 바로 개발자이기때문입니다. 아직 미완이기때문입니다. 물론 인공지능의 능력은 발전하겠지만 GPT/BARD의 코딩능력을 이용해서 더 빨리 개발할수있는 대상이 바로 개발자이기에 <이미지 처리 바이블>은 직접 코딩할 필요는 줄었지만 분명한건 원리를 더욱 튼튼히 이해를 하는 것이 아직도 확실히 중요합니다. 그래서 이 책의 가치는 훼손되지 않았고 이미지처리와 컴퓨터비전에서 꼭 알아야 할 용어와 개념을 담았습니다.

져자는 류태선 '딥러닝논문읽기모임'운영자십니다. 유튜브와 단톡방에서만 뵌분인데 이런 좋은 책을 내셨다니 매우 기쁘네요. 인공지능 교육 및 솔루션개발전문기업 콥스랩 CEO이기도 하십니다. 공저자로 콥스랩연구원은 조해창, 김태균,오근철님등이 참여하십니다.

우선 이미지처리와 컴퓨터비전의 차이를 설명합니다. 같은거 아닌가라는 생각도 들죠. 이미지처리는 아날로그로는 사진일거구 디지털은 픽셀처리라고 보심됩니다. 이미지획득-이미지개선-이미지분석-이미지해석의 단계를 거칩니다. 컴퓨터비전은 기계가 시각적 데이터를 이해하고 분석하는 능력을 개발하는 분야입니다. 물론 공통점이 많지만 차이점은 추구목표가 다르다는 거죠. 이미지처리는 이미지의 개선에 포커싱되어 있다면 컴퓨터비전은 객체인식 패턴분석, 이미지분류 등의 작업을 합니다.

이미지처리에서는 openCV를 잘알아야죠. 이 라이브러리는 이미지나 영상처리 오픈소스죠. 즉 프로그램입니다. 이미지 사이즈 변환,회전, 필터링, 색상공간변환 등 다양한 기능을 제공합니다. 이외에도 다양한 강점을 체계적으로 설명합니다. openCV를 간략하게 코드로 실습할 수있게 짧게 짤게 따라할 수있게 하고 푸리에 변환을 통해 수학적 신호로 변환의 과정도 집고 갑니다.
현대는 이미지의 시대죠 각종이미지가 쏟아져나오고 있습니다. 이 이미지를 어떻게 디지털화하고 고유한 시각과 수학의 조화를 알아야 합니다. 이미지처리에 관한 내용을 다루다보니 많은 이미지들이 등장을 합니다. 미술의 색상에 관한 지식이 있다면 좀더 편하게 이해할 수있는 면도 있습니다. 이미지처리의 방식은 딥러닝입니다. 이 딥러닝때문에 이미지처리를 하는 기술도 종국에 가서는 인공지능스스로 처리하는 날이 오겠죠. 하지만 그날이 올때까지는 누군가 전처리를 하고 그 과정을 정확히 이해를 하고 딥러닝이 이미지처리를 하는데 문제가 없도록 서포트를 해야 합니다. 그것을 위해 인공신경망의 기초부터 퍼셉트론, 활성화함수의 종류와 기능, 모델최적화, 시각화 등을 설명합니다. 이미지처리라면 CNN이죠. 그리고 이를 텐서플로로 어떻게 학습하는지를 코딩으로 실습을 합니다.
이미지분류부분은 딥러닝의 성적이 폭발한 시기인 구글넷, 레즈넷 등의 등장과 트랜스포머의 성격도 설명합니다. 트랜스포머가 발표되고 나서 딥러닝의 성능은 향상되었고 챗GPT의 근간이기도 합니다. 그리고 이미지생성에서 이미지변환은 생성형AI의 기본개념입니다. GAN이라는 적대적 신경망기술의 등장은 페이크라는 우스광스러운 모습으로 등장을 했지만 지금은 다른 인간의 능력을 뛰어넘는 이미지생성능력을 보여줍니다. 마지막은 건설현장에서의 사례와 의료 인공지능 사례를 설명하면서 길수도 있는 이미지처리의 기술전반을 살펴볼수있게 했습니다. 최소 저자가 소개하는 이미지처리 기술을 머리속에 담고 있어야 챗GPT를 사용한 이미지처리를 할때라도 매우 유용하게 효율적으로 작업을 할수가 있습니다. 아직까지는 인공지능혼자 마무리를 깔끔하게 할수있는 기술수준이 아니고 아직도 10년은 봐야하지 않을까요.
본 도서는 출판사로부터 무상으로 제공받아 주관적인 리뷰를 했습니다.