닥터, 코드를 만나다 - 코드를 직접 작성하여 익힐 수 있는 의료인을 위한 실무형 워크북
유준일.박현우.김현수 지음 / 군자출판사(교재) / 2025년 3월
평점 :
장바구니담기


'이 리뷰는 컬처블룸을 통해 출판사에서 도서를 제공 받아, 직접 읽고 작성한 리뷰입니다.'





의료 현장의 AI 사용법







책을 선택한 이유


인공지능의 등장은 놀랍다.


컴퓨터 의 등장이 단순 반복 업무를 사라지게 했지만,

인공지능의 등장은 전문직의 입지를 위협한다.


의료는 인공지능이 대체할 가능성이 가장 높은 직업으로 꼽힌다.

의료 AI 에 대해 알아보기 위해 "닥터, 코드를 만나다"를 선택한다.





1장 AI와 함께 성장하는 미래의 의사들: 의대생과 전공의를 위한 필수 가이드 에서는


AI가 의사를 대체할 것인가라는 두려움에 의료 AI를 공부하기 사작한다.


머신 러닝 과 딥 러닝은 AI의 핵심 개념으로 주어진 데이터에서

패턴 을 파악하여 새로운 입력 값에 대한 결과나 분류를 예측한다.


AI를 공부하는 이유는 AI의 구조와 한계를 파악하고, 발전방향을 예측하기 위해서다.


빅데이터 시대의 도래, 의료 서비스 접근성 향상, 임상플로우 최적화,

정밀 의료의 실현으로 놀랄 정도로 빠르게 성장한다.


의료 정보의 접근성 향상, 의학 연구 가속화, 임상 의사결정 지원,

의료 교육 혁신의 변화를 일으킨다.



의대생은 미래의 의료 기술들을 미리 접하며, AI를 학습 보조 도구로 활용하고,

전공의는 AI를 통해 임상 학습을 효과적으로 수행할 수 있다.


전문의는 AI로 진단의 정확성을 높이고 업무 효율을 극대화할 수 있으며,

의료 AI 개발자는 의료 현장의 문제와 요구사항을 이해할 수 있다.



파이썬 은 의료 AI 를 만들 수 있는 강력한 도구다.


파이썬 설치 및 환경 설정, 구글 코랩 접속 방법,

파이썬 개발 환경 관리 도구들을 설명한다.


파이썬 개발 환경 도구들은 각각의 장단점이 있으며,

프로젝트 요구사항과 개발자 선호도에 따라 선택 및 조합할 수 있다.






2장 임상 연구와 데이터 분석의 열쇠, 파이썬 알아보기 에서는


파이썬 은 알기 쉬운 코드와 간결함이 특징이다.


파이썬 은 아이디어 를 빠르게 구현하고, 데이터 분석부터,

AI 모델 개발까지 전 과정을 지원하며 생산성을 극대화할 수 있다.




파이썬의 기본 데이터 타입에는 문자열, 숫자, 불리언 이 있으며,

의료 정보를 다룰 때 다양하게 활용할 수 있다.


파이썬의 주요 데이터 구조로는 리스트, 튜플, 딕셔너리, 세트 가 있다.


데이터 구조들은 각각의 특성에 따라 의료 정보를 효율적으로

저장, 관리, 분석하는 데 활용될 수 있다.



진단 알고리즘 은 매우 복잡할 뿐만 아니라, 연산자로 구현하기 쉽지 않다.


파이썬 조건문을 활용하면 복잡한 진단 알고리즘 도 체계적으로 구현할 수 있다.

비교 연산자, 문자열 연산자, 조건문, 함수에 대해 설명한다.



코드 구조는 실제 진단 알고리즘 이해에 도움이 된다.



복잡한 알고리즘 도 파이썬 을 이용하면 쉽게 구현할 수 있다.


알고리즘 은 의료진들이 복잡한 진단 과정을 보다 쉽고 정확하게

수행하는 데 도움을 줄 수 있다.



진단 알고리즘에 따라 감별 진단을 할 때에는

반복문을 이용하는 것이 좋다.


for문과 while문을 사용하면 코드 를 더 단순화 할 수 있다.

input() 함수를 추가하면 활용성이 높아진다.


while문은 특정 조건이 만족되는 동안 계속해서

코드 를 반복 실행하는 데 유용하다.


데이터 분석에 활용되는 대표 모듈 에는 NumPy, matplotlib, pandas 등이 있다.


현재 프로세스 는 단순해 보일 수 있지만, 딥러닝 학습까지 적용하게 되면

코드의 양이 급격히 증가하게 된다.


개발하고자 하는 프로젝트 의 전체 프로세스 를 구상한 후 코딩을 시작하는 것이

더욱 효율적인 개발 방법이다.



병원 EMR 시스템 과 병원 내 SNS 소프트웨어 를 코드 로 연동하면,

자동 알림을 받을 수 있고, 진료과별 적절한 알림 시스템 을 만들 수 있다.


일일이 검사 결과를 확인하며 회진 준비를 할 필요가 없다.

유사 환자의 처치 자료를 기반으로 처방 추천을 받을 수 있으며,

더욱 효율적이고 정확한 의사결정을 내릴 수 있다.





3장 의료 AI의 모든 것: 기초 개념부터 최신 기술까지 에서는


코드 를 무작정 짜기 보다는 전체 과정을 먼저 구상하고,

이를 구현하는 것이 효율적이다.


의료 AI 개발의 7단계 파이프라인 은 데이터 마이닝, 데이터 전처리,

데이터 피팅, 모델 학습, 모델 평가, 모델 미세 조정, 모델 배포 다.


머신 러닝 은 의료 데이터 로부터 패턴 을 학습하여 예측 모델 을 만든다.


딥 러닝 은 다층 신경망을 이용해 복잡한 의료 데이터 의 패턴을 자동 학습한다.



데이터 라벨링 정도에 따라 인공 지능 학습을 지도학습, 비지도학습,

준지도학습으로 나눈다.


머신 러닝에서는 로지스틱 회귀, 랜덤 포레스트,

딥 러닝 에는 합성곱 신경망, 순환 신경망 등이 많이 사용된다.




최적화는 전공의가 진단 능력을 향상시키는 과정이다.


과적합은 AI 모델이 훈련에 사용된 특정 환자 데이터 에 너무 잘 맞춰져

새로운 환자 데이터 에 대해 성능이 떨어지는 현상이다.



민감도는 실제 양성 중 AI가 올바르게 양성으로 예측한 비율이다.


AUC-ROC는 다양한 진단 기준값에서 모델 성능을 종합적으로 평가한다.

AU-PRC는 양성 사례가 드문 경우에 유용하다.


의사들이 AI의 판단 근거를 이해하고 임상적 경험과 결합하여

최종 의사결정을 내릴 수 있도록 돕는 것이 중요하다.


NLTK를 활용하여 관련 의료 보고서나 환자의 증상 설명을 분석하고,

영상 데이터와 결합하여 더 정확한 진단을 내리는 통합 시스템 을

구축할 수 있다.



머신 러닝 은 다양한 기법으로 활용되며, 각각의 특성에 따라

다양한 임상 문제 해결에 적용된다.


K-means 군집화는 비지도 학습 알고리즘 으로 환자 그룹화,

질병 하위유형 분류에 사용된다.


SVM은 지도학습 기법으로 작은 데이터셋 에서도 안정적 성능을 보여주며,

유전자 데이터 기반 질병 예측이나 임상 검사 데이터 분류 상황에서 유용하게 사용된다.



의사 결정 트리 는 질문을 기반으로 데이터 를 분류하는 직관적 모델이며,

임상 의사결정 지원 시스템에 활용되며, 진단 과정을 모델링한다.


앙상블 분석은 여러 개의 예측 모델 을 결합하여 단일 모델 보다 더 높은 성능을 얻는 기법이다.


랜덤 포레스트는 여러 개의 의사결정 트리 를 독립적으로 학습시켜,

결과를 종합하는 대표적 기법이다.



인공신경망은 입력층, 은닉층, 출력층으로 구성된다.


입력층은 데이터 를 처음으로 받아들이는 층이다.


은닉층은 입력층과 출력층 사이에 있는 층이다.

은닉층이 많을수록 신경망이 복잡해지고 더 복잡한 문제를 학습할 수 있다.


출력층은 최종 예측 결과난 분류 결과가 나오는 층이다.



가중치, 활성화 함수, 학습, 드롭아웃 은 과적합을 방지하는

핵심적인 정규화 기법이다.


인공신경망의 학습은 순전파와 역전파를 통해 이루어진다.


순전파는 입력층에서 출력층으로 데이터 가 전달되는 과정이며,

역전파는 순전파의 결과로 나온 예측값과 실제값의 오차를 계산하고,

오차를 입력한다.


딥러닝 기법들은 의료 분야에 응용된다.


CNN은 의료 영상 분석에 널리 사용되며,

GAN은 의료 데이터 생성과 증강에 사용된다.


RNN과 LSTM은 시계열 의료 데이터 분석에 주로 사용된다.


ICU 모니터링 데이터, 연속 혈당 측정 데이터, 심전도 데이터 등을

분석하여 환자의 상태 변화를 예측하거나 이상 징후를 감지한다.



LLM은 전자건강기록에서 주요 정보를 추출하거나,

의학 문헌을 요약하고 임상 질의에 답변하는 데 활용된다.



AI는 의료 시스템 의 효율성을 높이고 진단의 정확도를 개선하며,

의료 서비스 의 질을 획기적으로 향상시킨다.



의료 분야는 인공지능 기술의 도입으로 변화의 속도가 더욱 가속화되고 있다.


의료 시스템 효율화, EMR, 신약 개발, 개인 맞춤형 의료 서비스 구현,

스마트 병원 시스템 구축 등의 의료 분야의 변화를 가져온다.





4장 의료 인공지능 개발의 출발선: 환경 구축부터 리소스 탐색까지 에서는


Github 는 단순한 코드 저장소를 넘어 연구 과정의 문제나 아이디어 를 공유할 수 있다.


Hugging Face는 AI 모델과 데이터셋 을 공유하고 활용할 수 있는 커뮤니티 플랫폼 이다.

다양한 방식으로 AI 개발을 지원하는 다목적 플랫폼 으로 자리 잡는다.


Papers with Code는 AI 연구 논문과 구현 코드 를 연결해주는 플랫폼 이다.

논문의 핵심 아이디어가 실제로 구현되었는지 직접 확인하고 연구에 적용할 수 있다.


Kaggle은 데이터 과학과 AI를 학습하고 실습할 수 있는 플랫폼이다.



의료 AI의 성능과 신뢰성은 학습에 사용된 데이터셋 의 품질에 크게 좌우된다.


딥러닝 모델 은 방대한 데이터 를 요구하며, 데이터 균형성도 고려해야 한다.

양질의 데이터셋 수집의 어려움을 극복하기 위해 공공 데이터셋 활용이 중요해진다.



LLM은 의료 AI 프로젝트 를 빠르고 효과적으로 진행할 수 있게 도와준다.


ChatGPT는 의료 AI 개발에서 코드 를 작성하고, 의료 데이터 를 분석하며,

질병 예측 모델 을 설계하는 데 활용할 수 있다.


LLaMA는 로컬 환경에서도 실행이 가능하므로, 의료 데이터 의 보안을 유지하며,

AI의 강력한 기능을 활용할 수 있게 해준다.


LLM을 최대한 활용하기 위해서는 효과적인 질문 작성을 위해,

Persona, Task, Action, Output Format을 고려해야 한다.


LLM은 의료 데이터 전처리부터 특징 추출, 모델 설명까지 여러 단계에서

도움을 줄 수 있으며, 비정형 데이터 구조화, 복잡한 패턴 찾기, AI 예측 결과를

쉽게 설명해 주는 등 의료 AI의 성능과 신뢰성을 크게 높여준다.





5장 영상 이미지 분석을 위한 딥 러닝 에서는


의료 분야에서 영상 이미지 분석을 위한 딥 러닝 기술 개발이 매우 활발하게 이루어진다.


탐지는 의료 영상에서 특정 해부학적 구조나 병변을 자동으로 찾아내는 과정을 의미하며,

AI 시스템 은 이미지 를 분석하여 중요한 특징이나 이상 소견을 식별하고 표시함으로써,

의사가 주목해야 할 영역을 쉽게 파악할 수 있도록 돕는다.



전처리된 영상은 딥 러닝 기반의 모델 에 입력되어 분석된다.


CNN은 이미지 처리에 특히 뛰어난 성능을 보이는 딥 러닝 모델로,

입력층, 합성곱층, 풀링층, 완전 연결층으로 구성된다.


CNN구조는 이미지 의 공간적 특성을 효과적으로 활용할 수 있게 해주며,

전통적 완전 연결 신경망에 비해 훨씬 적은 파라미터로도

높은 성능을 달성할 수 있게 한다.



GAN은 기본 구조에서 생성자는 랜덤한 노이즈 벡터 를 받아 가짜 데이터를 만들어내며,

가짜 데이터가 실제 데이터와 비슷하게 만드는 것을 목표로 한다.


판별자는 가짜 데이터가 실제인지 가짜인지 판별하는 역할을 하면서,

두 모델이 경쟁적으로 발전하게 된다.



분할 도구는 모델을 분할하며, 분할을 끝낸 후에는 후처리 작업이 이어진다.

분할 결과가 정확한지 판단하기 위해 검증 지표를 사용한다.


MedMNIST는 다양한 의료 데이터 를 표준화하고 빠르고 경량화된 학습과

평가를 지원하는 데이터셋 모음이다.


데이터셋 은 초보자들이 의료 데이터 를 기반으로 AI 모델을 학습하고

평가하기에 이상적이다.


MONAI는 의료 영상 처리에 특화된 기능을 제공하는 라이브러리 다.


MONAI 데이터셋 다운로드, 설치, 데이터셋 폴더에서 이미지 파일 이름 읽기,

학습 검증 테스트 데이러 리스트 준비, 데이터 전처리를 위한 변환,

데이터셋 및 데이터로더 정의, 학습 모델 아키텍처 와 옵티마이저 정의,

모델 훈련, 손실 및 평가 지표 시각화, 테스트 데이터셋에서 모델 평가를 설명한다.



chest X-ray를 이용한 AI 모델로 폐렴을 진단하기 위해

DenseNet 모델을 사용한다.



DenseNet 121은 효율적인 딥 러닝 모델 이다.

4개의 dense block으로 이루어져 있고 다양한 수의 층을 포함한다.


이미지 파일과 그에 맞는 라벨 을 불러오고, 필요한 변환을 적용한 뒤

텐서 형식으로 바꿔서 학습에 사용할 수 있게 한다.


데이터셋 클래스를 사용해 모델이 쉽게 이해하고 학습할 수 있는 형태가 되도록

데이터 전처리 및 데이터 로더 설정을 실습해 본다.



U-Net은 CNN 아키텍처 의 한 종류로, 네트워크 의 전체적인 구조가

U자 형태를 닮았으며, 적은 양의 학습 데이터만으로도 의료 영상 분석 분야에서

뛰어난 성능을 달성할 수 있다.


nnUNet 기반 예측 함수 정의, 모델 예측 초기화 및 실행에 대해 설명한다.




UNETR은 전체적으로 장기나 병변의 특징을 파악하고,

세세한 부분까지 놓치지 않게 한다.



세분화 기법을 이용해 허벅지 내 각 개별 근육을 구분하고,

근육 부피와 지방 침착도를 계산하는 모델 을 개발하는 모델을 실습해 본다.



병리학 분야에서 GAN을 사용하면 레이블링 없이도 조직의 정상과

비정상 패턴을 학습할 수 있다.


GAN은 합성 이미지 를 생성하여 데이터셋 을 확장하는 데 기여할 수 있다.


PathologyGAN은 병리 조직 분석을 위해 GAN 기술을 활용한 혁신적 접근 방식이다.

GAN의 두 가지 주요 구성 요소인 생성자와 판별자의 역할과 특징을 살펴본다.



초음파는 개원을 위한 필수적인 덕목이다.


대부분의 전공의들은 수련 과정에서 초음파 술기를 익힐 시간이 없고,

초음파 기술을 익힌 후에도 숙달되기까지 많은 노력이 필요하다.


UCLA 연구팀이 개발한 모델은 저품질 초음파 이미지 를 고품질로 재구성한다.


CycleGAN은 서로 다른 두 종류의 이미지 사이의 변환을 학습하는 인공지능 모델이다.

첫 번째 생성기는 저해상도 초음파 영상을 고해상도로 변환하고,

두 번째 생성기는 반대로 작동한다.


오래된 초음파 기기로 촬영한 저품질 영상을 개선하면서,

저품질 영상을 재 해석하거나 영상의 품질 개선에 도움을 줄 수 있다.



동영상 데이터 는 기하급수적으로 증가하고 있으며,

수작업으로 분석, 진단, 치료 계획 수립은 엄청난 시간과

인력이 소요되는 작업니다.


BlazePose는 CNN 아키텍처 를 기반으로 한 움직임 예측 알고리즘 으로

33개의 신체 키 포인트 를 추출하여 사람의 자세를 상세히 분석할 수 있다.


Pseudocode를 활용하여 MediaPipe BlazePose의 작동 과정을 살펴보고,

MediaPipe framework로 실제 데이터를 분석해 본다.





6장 시계열 자료 분석을 위한 딥 러닝 에서는


시계열 데이터 는 시간에 따라 순차적으로 기록된 정보다.


RNN은 의료 시계열 데이터 분석에 있어 딥 러닝 모델 중

대표적으로 활용된다.


RNN의 특징은 이전 단계의 출력을 현재 단계의 입력으로

사용하는 순환 구조에 있다.



시간에 따른 데이터 의 의존성을 효과적으로 포착할 수 있으며,

의료 데이터 에서 중요한 변화나 경향을 분석하는 데 유용하다.


LSTM과 GRU는 시계열 데이터에서 우수한 성능을 보여주는 모델이지만

데이터셋 의 특성에 따라 단독으로는 충분한 성능을 내지 못할 수도 있다.



CNN의 공간적 특징 추출 능력과 RNN 계열 모델 의 시간적 의존성

학습 능력을 결합하여, 복잡한 의료 시계열 데이터 의 다차원적 특성을

더욱 효과적으로 분석할 수 있도록 한다.


LSTM과 CNN을 결합한 하이브리드 모델을 사용하면서,

심전도의 시간적 패턴 과 공간적 특징을 동시에 학습하여,

더욱 정확한 판독 결과를 얻는다.



RNN 모델 로 시계열 데이터를 분석하면 장기 의존성 문제에 직면한다.


시퀸스 가 길어질수록 과거의 정보를 점차 잃어버리는 경향이 있어

장기적인 패턴 을 포착하기 어렵다.


LSTM은 혈당과 같이 장기적인 패턴과 단기적인 변동이 공존하는

복잡한 시계열 데이터 를 분석하는 데 매우 적합하다.



Ohio TIDM Dataset은 제1형 당뇨병 환자의 연속 혈당 모니터링

데이터 를 포함하는 공개 데이터셋 이다.


LSTM 기반 확률적 혈당 예측 모델 을 구현해 본다.


LSTM은 시계열 데이터 분석에 유용한 모델이며,


LSTM 기반 확률적 혈당 예측 모델 은 시간 흐름에 따른

혈당 수치 패턴 을 학습하고, 미래의 혈당 수치를 예측하며,

예측값의 신뢰에 대한 정보를 제공한다.



EKG 판독은 심장 리듬의 생리학적 기전과 다양한 질환의 패턴 을

이해해야 하는 복잡한 과정이다.


LSTM은 시간적 패턴 을 잘 포착하지만, EKG 신호의 공간적 특성을

효과적으로 분석하는 데 어려움이 있다.


CNN은 EKG 데이터 의 시공간적 특징을 더 정확하게 분석할 수 있다.


CNN, RNN 인코더, RNN 디코더 로 구성된

CNN과 LSTM을 결합한 딥 러닝 아키텍처 모델을 소개한다.


시퀸스 투 시퀸스 구조를 사용하면서, end-to-end 방식으로 학습하며,

역전파를 통해 전체 네트워크 의 가중치를 조정한다.



MIT-B1H Arrhythmia Database는 심장 부정맥 연구를 위해 수집된 데이터셋 이며,

의료 연구 및 교육 목적으로 광범위하게 활용되고 있다.





7장 생성형 AI 및 자연어 처리 에서는


의무 기록 텍스트 데이터 를 효과적으로 분석하기 위해,

자연어 처리 기술과 대규모 언어 모델이 활용되고 있다.


NLP는 컴퓨터 가 인간의 언어를 이해하고 처리할 수 있게 하는

인공지능의 한 분야로, 의학 분야에서 다양한 영역에서 활용된다.


NLP는 EMR에서 중요 정보를 추출하고 진단 코딩 을 자동화하며,

약물 부작용을 모니터링 하는 데 활용된다.



LLM의 핵심 구조는 Transformer 아키텍처 를 기반으로 한다.


LLM은 복잡한 의학 논문이나 장문의 임상 기록도 정확하게 분석하고,

다양한 의료 관련 작업에서 뛰어난 성능을 발휘한다.


다양한 의료 환경에 빠르게 적응할 수 있으며, 새로운 의학 지식과

데이터 를 학습하여 성능을 확장할 수 있다.


메타 에서 개발한 LLaMA는 기존 모델 보다 적은 매개변수로

유사한 성능을 달성하는 높은 효율성이 특징이다.


LLaMA에 LoRA 기술을 결합하면 의료 특화 모델 개발이 더욱 용이해진다.


LoRA의 작은 저장 공간 요구와 빠른 적용 특성은 실제 임상 환경에서

유연한 활용을 가능케 한다.


LoRA와 같은 경량화, 미세 조정 기법은 의료 도메인 에서 빠른 모델 개발과

배포를 가능케 해주지만, 모델 안정성과 정확성을 확보하기 위해서는

적절한 데이터 확보, 고도화된 평가 전략, 보안 규제 요건 충족 등이 필수적이다.



AI를 활용해 의대생을 위한 족보를 만들어 본다.


OpenAI의 GPT-4o API를 활용해서, 의대생들이 효율적으로

족보를 만들고 공부할 수 있는 방법을 찾아본다.


다양한 교재 PDF 파일들을 불러와서 전체적인 텍스트 를 요약하여

같이 공부할 수 있는 프로그램 을 만들어본다.


요약된 족보를 실질적인 학습 자료로 활용하고 학습자의 이해도를 높이기 위한

문제 생성 및 질문 응답 시스템 을 구축한다.


ChatGPT는 요약본을 만들어 의대 공부를 하는 데 많은 도움을 줄 수 있지만,

아직까지 대용량 파일 데이터 처리에 어려움이 있다.





8장 Medical GitHub: 미래 의사를 위한 AI 플레이그라운드 에서는


Github Action를 이용한 CI/CD 환경 구축으로 개발 프로세스 를 자동화하고,

다양한 코드 품질 관리 도구를 통해 더 나은 코드 를 작성할 수 있다.


Github 저장소 생성, 로컬 환경 설정, 프로젝트 구조화,

README 작성 방법을 설명한다.


의료 데이터 를 다룰 때는 개인정보 보호가 가장 중요한 요소다.


의료 데이터 의 품질 관리도 매우 중요하며, 법적 규제 준수는 필수 사항이다.

데이터 의 윤리적 사용이 중요하다.


SAM은 사전 훈련 데이터 없이도 다양한 이미지 에서 객체나 영역을

자동으로 식별하고 분할할 수 있는 범용적 능력을 갖춘다.


SAM은 복잡한 구조의 장기나 조직의 병변을 정확히 탐지하는데 탁월하고,

특정 영역을 신속하게 분할할 수 있다.


SAM은 의료 AI 분야에서 정확하고 신속한 영상 분석을 가능케 하며,

데이터 준비와 레이블링 과정에서 시간 절약으로 실무 적용 가능성이 높다.


SAM을 활용하는 가이드라인 에 대해 설명한다.





혁신적 기술의 도입은 의료 서비스 품질을 높일 수 있다.


AI의 효과적으로 사용 여부가 의료 경쟁력의 질을 결정하는

핵심 요소가 될 것은 의심할 여지가 없다.




"닥터, 코드를 만나다"는 의료 AI를 배워야 하는 이유,

파이썬 기초 문법, 의료 AI의 기본 개념,

의료 AI 플랫폼, 영상 이미지 분석, 시계열 분석,

자연어 처리, 깃허브에 대해 다룬다.


머신 러닝 과 딥 러닝은 AI의 핵심 개념으로 주어진 데이터에서

패턴 을 파악하여 새로운 입력 값에 대한 결과나 분류를 예측한다.


파이썬 은 의료 AI 를 만들 수 있는 강력한 도구다.


파이썬 개발 환경 도구들은 각각의 장단점이 있으며,

프로젝트 요구사항과 개발자 선호도에 따라 선택 및 조합할 수 있다.



파이썬 은 아이디어 를 빠르게 구현하고, 데이터 분석부터,

AI 모델 개발까지 전 과정을 지원하며 생상성을 극대화할 수 있다.



복잡한 알고리즘 도 파이썬 을 이용하면 쉽게 구현할 수 있다.


알고리즘 은 의료진들이 복잡한 진단 과정을 보다 쉽고 정확하게

수행하는 데 도움을 줄 수 있다.


개발하고자 하는 프로젝트 의 전체 프로세스 를 구상한 후 코딩을 시작하는 것이

더욱 효율적인 개발 방법이다.



코드 를 무작정 짜기 보다는 전체 과정을 먼저 구상하고,

이를 구현하는 것이 효율적이다.


의료 AI 개발의 7단계 파이프라인 은 데이터 마이닝, 데이터 전처리,

데이터 피팅, 모델 학습, 모델 평가, 모델 미세 조정, 모델 배포 다.



데이터 라벨링 정도에 따라 인공 지능 학습을 지도학습, 비지도학습,

준지도학습으로 나눈다.


머신 러닝에서는 로지스틱 회귀, 랜덤 포레스트,

딥 러닝 에는 합성곱 신경망, 순환 신경망 등이 많이 사용된다.



최적화는 전공의가 진단 능력을 향상시키는 과정이다.

민감도는 실제 양성 중 AI가 올바르게 양성으로 예측한 비율이다.


의사들이 AI의 판단 근거를 이해하고 임상적 경험과 결합하여

최종 의사결정을 내릴 수 있도록 돕는 것이 중요하다.


머신 러닝 은 다양한 기법으로 활용되며, 각각의 특성에 따라

다양한 임상 문제 해결에 적용된다.



앙상블 분석은 여러 개의 예측 모델 을 결합하여 단일 모델 보다 더 높은 성능을 얻는 기법이다.



인공신경망은 입력층, 은닉층, 출력층으로 구성된다.


입력층은 데이터 를 처음으로 받아들이는 층이다.


은닉층은 입력층과 출력층 사이에 있는 층이다.

은닉층이 많을수록 신경망이 복잡해지고 더 복잡한 문제를 학습할 수 있다.


출력층은 최종 예측 결과난 분류 결과가 나오는 층이다.



인공신경망의 학습은 순전파와 역전파를 통해 이루어진다.




딥러닝 기법들은 의료 분야에 응용된다.


AI는 의료 시스템 의 효율성을 높이고 진단의 정확도를 개선하며,

의료 서비스 의 질을 획기적으로 향상시킨다.



의료 분야는 인공지능 기술의 도입으로 변화의 속도가 더욱 가속화되고 있다.




의료 AI의 성능과 신뢰성은 학습에 사용된 데이터셋 의 품질에 크게 좌우된다.


딥러닝 모델 은 방대한 데이터 를 요구하며, 데이터 균형성도 고려해야 한다.

양질의 데이터셋 수집의 어려움을 극복하기 위해 공공 데이터셋 활용이 중요해진다.




의료 분야에서 영상 이미지 분석을 위한 딥 러닝 기술 개발이 매우 활발하게 이루어진다.



전처리된 영상은 딥 러닝 기반의 모델 에 입력되어 분석된다.


판별자는 가짜 데이터가 실제인지 가짜인지 판별하는 역할을 하면서,

두 모델이 경쟁적으로 발전하게 된다.


분할 도구는 모델을 분할하며, 분할을 끝낸 후에는 후처리 작업이 이어진다.

분할 결과가 정확한지 판단하기 위해 검증 지표를 사용한다.



병리학 분야에서 GAN을 사용하면 레이블링 없이도 조직의 정상과

비정상 패턴을 학습할 수 있다.


GAN은 합성 이미지 를 생성하여 데이터셋 을 확장하는 데 기여할 수 있다.



시계열 데이터 는 시간에 따라 순차적으로 기록된 정보다.



시간에 따른 데이터 의 의존성을 효과적으로 포착할 수 있으며,

의료 데이터 에서 중요한 변화나 경향을 분석하는 데 유용하다.


LSTM은 혈당과 같이 장기적인 패턴과 단기적인 변동이 공존하는

복잡한 시계열 데이터 를 분석하는 데 매우 적합하다.


의무 기록 텍스트 데이터 를 효과적으로 분석하기 위해,

자연어 처리 기술과 대규모 언어 모델이 활용되고 있다.


NLP는 컴퓨터 가 인간의 언어를 이해하고 처리할 수 있게 하는

인공지능의 한 분야로, 의학 분야에서 다양한 영역에서 활용된다.



LLM은 복잡한 의학 논문이나 장문의 임상 기록도 정확하게 분석하고,

다양한 의료 관련 작업에서 뛰어난 성능을 발휘한다.


다양한 의료 환경에 빠르게 적응할 수 있으며, 새로운 의학 지식과

데이터 를 학습하여 성능을 확장할 수 있다.



메타 에서 개발한 LLaMA는 기존 모델 보다 적은 매개변수로

유사한 성능을 달성하는 높은 효율성이 특징이다.


LLaMA에 LoRA 기술을 결합하면 의료 특화 모델 개발이 더욱 용이하며,

LoRA의 작은 저장 공간 요구와 빠른 적용 특성은 유연한 활용이 가능하다.



Github Action를 이용한 CI/CD 환경 구축으로 개발 프로세스 를 자동화하고,

다양한 코드 품질 관리 도구를 통해 더 나은 코드 를 작성할 수 있다.


SAM은 사전 훈련 데이터 없이도 다양한 이미지 에서 객체나 영역을

자동으로 식별하고 분할할 수 있는 범용적 능력을 갖춘다.


SAM은 의료 AI 분야에서 정확하고 신속한 영상 분석을 가능케 하며,

데이터 준비와 레이블링 과정에서 시간 절약으로 실무 적용 가능성이 높다.




"닥터, 코드를 만나다"는 AI의 기초 개념, 파이썬 프로그래밍 언어부터

AI 환경 구축과 리소스 탐색, 자연어 처리에 대한 기초 개념을 이해하고,

영상 이미지 분석, 시계열 자료 분석, 의학 교재 요약 등을 할 수 있도록 한다.


데이터 전처리 및 데이터 로더 설정,

세분화 기법을 이용한 허벅지 근육을 부피와 지방 침착도 계산 모델,


MediaPipe BlazePose로 환자의 실시간 자세 모니터링,

LSTM 기반 확률적 혈당 예측 모델 을 구현해 본다.


AI를 활용한 의대생 족보를 만들기 등을 실습하면서,

의료분야에 AI를 활용하는 노하우를 익히도록 한다.



인공지능은 놀라운 속도로 모든 분야를 바꾸고 있다.


의학과 AI가 융합하면 의료 품질을 놀랍게 향상시킬 수 있다.

AI는 디지털 헬스케어 의 관건으로 떠오르고 있다.


AI를 이용해 임상 데이터 를 효과적으로 분석하고,

임상 현장에 활용하기 위해서는 코딩 능력은 필수다.



"닥터, 코드를 만나다"는 인공지능의 기초 개념부터,

실제 의료 AI적용 사례까지 체계적으로 다루면서,

의료 AI의 실체에 접근할 수 있도록 한다.



"닥터, 코드를 만나다"는 AI를 이용한 의료 분야의 개선 방향을 설명하고,

실제 코드 작성 사례를 소개하므로, 의료 AI를 이해하고 활용할 수 있도록 안내한다.


군자출판사 와 컬처블룸 서평단에서 "닥터, 코드를 만나다"를 증정해주셨다.

감사드린다.


#군자출판사 #유준일 #박현우 #김현수 #서평 #닥터코드를만나다

#의료인을위한실무형워크북 #컬처블룸 #컬처블룸서평단 #의료AI


댓글(0) 먼댓글(0) 좋아요(0)
좋아요
북마크하기찜하기 thankstoThanksTo