구글 코랩
코랩은 구글에서 제공하는 클라우드 기반의 주피터 노트북 환경입니다. 구글 드라이브에 주피터 노트북 결과를 저장한 후 다른 사람에게 공유할 수 있습니다. 구글 클라우드 기반의 환경으로 GPU,TPU 자원을 사용할 수 있기 때문에 고성능의 자원이 필요한 환경에 유용합니다.
구글 코랩의 가장 큰 장점은 설치 및 구성 없이 바로 머신러닝, 딥러닝 분석을 시작할 수 있다는 것입니다. (-8-)
데이터 전처리 과정은 모델이 학습할 수 있는 형태로 데이터를 전처리하는 대표적인 과정에는 3가지가 있습니다. 지도학습의 경우, 훈련 데이터셋의 피처와 라벨을 분리하는 과정이 있을 수 잇습니다. 그리고 결측값을 제거하는 경우도 있습니다. 결측값의 경우, 주어진 문제 및 데이터의 특징을 잘 파악해 세심하게 처리할 필요가 있습니다. 결측값을 처리하는 방법에는 결측값이 포함된 행을 삭제하는 방법, 평균 및 중앙값, 최빈값으로 대체하는 방법, 결측값의 앞뒤 데이터로 채워주는 방법 등 다양한 전처리 방법이 잇습니다. (-89-)(
전이학습(Transger Learning)은 사전 하습된 모델의 네트워크 및 매개변수(가중치, 편향) 를 가져와 새로운 모델을 구성할 때 재사용하는 방법입니다. 전이학습을 사용하면 적은 데이터로도 좋은 모델 성능을 기대할 수 있으며 학습 속도도 높일 수 있습니다. (-219-)
1990년대 인간과 기계의 체스 게임이 있었다. 그때 당시 게임은 머신러닝에 의한 프로그램 환경이었으며, 비정형 데이터를 기계가 학습하여, 인간과 체스 게임을 통해 서로 승부를 겨루는 독특한 게임이다.머신러닝 프로그램에 있어서 중요한 것은 그 게임이 기계의 지능이 인간의 지능에 비해 어느 수준에 이르렀는지 비교하고, 발전시키는데 있었다.
이후 29여년 동안 컴퓨터의 비약적인 발전이 있었다. 슈퍼 컴퓨터에 의해, 기후와 날씨 예측이 가능해졌으며, 컴퓨터의 성능 또한 상당한 수준에 다다르게 된다. 물론 이 때, 알파고와 이세돌의 바둑 대결이 예고되었다. 대다수의 사람들은 이세돌의 승리를 예상했다. 바둑은 체스와 달리 수많은 경우의 수가 있었고, 컴퓨터의 성능이 아무리 뛰어나다 하더라도,인간의 뇌를 기계가 따라잡기에는 역부족이라고 생각했기 때문이다. 하지만 예상과 달리 딥러닝 프로그램에 의한 알파고의 승리로 끝났다.
체스 게임은 머신러닝 프로그램이었으며, 바둑 대결은 딥러닝 프로그램에 의해 진행되었기 때문이다. 그리고 딥러닝이 인간이 바둑을 두는 것처럼 패턴을 읽고 예측하고, 기계 학습하는 기계학습을 추구한다는 것이다. 즉 파이썬에 의한 딥러닝 케라스는 딥러닝 프로그램의 개발환경 설정 뿐만 아니라, 실제로 어떻게 딥러닝을 가능하게 구현하는지 배울 수 있다.데이터 전처리 과정 뿐만 아니라 데이터가 비정형, 반정형, 그리고 정형 데이터로 구분하며, 비정형 데이터를 정형 데이터로 전환하는 과정에서 파이썬 프로그램에 의한 데이터 처리 모델의 특징을 나열하고 있었다. 특히 딥러닝은 전이학습이라는 특징을 가지고 있으며, 전이학습을 통해서, 모델과 출력을 강능하게 한다. 컴퓨터 공학에서, 알고리즘,딥러닝에 대해 배울 때, 획뒤와 분류에 대한 개념이 실제 기계에 의한 학습, 데이터 처리과정에서 어떻게 완성되며, 데이터, 런타임,미들웨어, 운영체제, 가상화, 서버, 스토리지 네트워크에 의한 애플리케이션이 딥러닝 케라스(Deep Keras) 라는 파이썬 기반 딥러닝 라이브러리의 특징과 개념을 기초부터 심화과정까지 정리할 수 있다.