사이킷런(sklearn) 패키지는 붓꽃 데이터셋을 내장하고 있다. load_iris( ) 함수로 붓꽃 데이터를 불러온다. 딕셔너리 형태로 제공되므로 keys( ) 메소드로 키 값을 추출할 수 있다.

x, y 변수 사이의 관계식을 그래프로 그려본다. 맷플롯립(matplolib) 패키지를 활용한다.

fit 메소드는 입력 데이터를 모델에 전달하여 학습시키는 함수 명령이다.

4개의 피처(설명 변수)에는 꽃받침(sepal)과 꽃잎(petal)에 대한 각각의 가로 길이, 세로 길이 값이 들어 있다. 분류 대상이 되는 목표 레이블은 3가지 범주(클래스)에 속하는 붓꽃 품종을 나타낸다. 3가지 품종 중에서 하나를 선택하는 다중 분류(multi classification) 문제이다.


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
북마크하기찜하기 thankstoThanksTo