Page 937 - 3-3
P. 937
- 지도 학습
먼저 지도학습이란 데이터에 대한 라벨, (label), 즉 정답값이 주어진 상태에서 컴퓨터를 학습시키
는 방법이다 데이터셋이. (data,label) 의 형태로 이루어지게 되는데 예를 들어 아래와 같이 크기가,
28x28 의 이미지인 Mnist 데이터 셋이 있다고 가정해 보자.
이 이미지에는 각각 data 에 대한 label 값이 있을 것이다.(0,1,2...) 그렇다면 이 이미지와 이미지
의 정답을 통해 학습을 시키고 답이 주어지지 않은 채로 이미지만 주어지면 답이 무엇이다 는 출, ‘ ’
력을 얻을 수 있게 된다 이러한 이미지와 같이 예측해야 하는 결과값이 이산값이면 이 문제는.
classification( 분류 문제라고 할 수 있다 즉 이 이미지는) . 1 인가 2 인가 를 맞추는 예측하는 문제
라고 할 수 있다.
예측해야 하는 결과값이 연속값이라면 (x=10,20,30 y=1,2,3) 이 문제는 regression( 회귀 문제)
라고 할 수 있다 즉. x 가 40 이 되면 이 때 y 값을 예측하는 문제라고 할 수 있다.
- 비 지도 학습
비 지도 학습은 데이터에 대한 label 값이 주어지지 않은 상태에서 컴퓨터를 학습시키는 방법이
다 즉. data 형태로 학습을 진행하는 방법이다 예를 들어서 데이터가 무작위로 분포되어있을 때.
이 데이터들을 비슷한 부류끼리 묶는 Clustering( 클러스터링 알고리즘이 있다) .
비 지도 학습은 데이터의 숨겨진 특징이나 구조 규칙 및 어떠한 관계를 발견하는데 사용된다 학, .
습은 주로 군집화에 사용되는데 입력이 비슷한 군집을 추정하는 것이다 예를 들어 비슷한 구매. ,
습관을 가진 고객에 관한 통계가 필요한 경우 이러한 비지도 학습을 사용하면 된다.
- 937 -