top of page
dhkim480

머신러닝의 학습방법

머신러닝을 통해 시스템이 어떻게 스스로 학습을 한다는 것일까요?

결론부터 말하면, 어떤 데이터를 분류하거나 값을 예측하는 것입니다.

분류하거나 값을 예측하는 것은 통계학을 토대로 합니다.



위의 사진을 보고 어떻게 강아지라고 알 수 있을까요?


눈코입의 위치, 4개의 다리, 귀의 모양 등이 특징을 빠르게 스캔하면서, 강아지의 모습이라고 판단했을 것입니다. 이렇게 데이터를 잘 분류하기 위한 특징을 머신러닝에서 "feature"라고 부릅니다.


그렇다면 머신러닝, 기계는 어떻게 학습을 하고 결과를 맞힐까요?

머신러닝의 학습 방법은 크게 3가지로 분류됩니다.


1. 지도학습(Supervised Learning)

- 회귀

- 분류

2. 비지도 학습(Unsupervised Learning)

- 군집화

- 변환

- 연관

3. 강화학습(Reinforcement Learning)



1. 지도 학습 (Supervised Leaning)


정답이 있는 문제를 해결하는 것을 지도학습이라고 합니다.

과거의 데이터 기반을 기계에 학습을 시키면, 모델을 만들어서 미지의 데이터를 예측 방법입니다.

지도학습은 다시 회귀, 분류로 나누어집니다.

예를 들어 온도와 판매량의 관계 데이터를 컴퓨터에 학습을 시키면, 컴퓨터는 그 관계를 설명할 수 있는 공식을 만들어 냅니다. 이 공식을 머신러닝에서 모델이라고 하며, 좋은 모델이 만들어지려면 데이터가 많고 정확할 수록 좋습니다. 컴퓨터에 온도(독립변수) 30을 주면 판매량(종속변수) 60을 예측 할 수 있게 되는 것 입니다.


- 회귀 (Regression)

간단하게 설명하면 숫자를 예측하고 싶을 때 회귀 방법을 사용합니다.

어떤 문제를 예측하고 싶은데 그 정답이 숫자라면 회귀방법입니다.


예시)

독립변수: 공부시간

종속변수: 시험점수(80점, 90점)

예측 모델: 사람들의 공부시간을 입력받고 점수를 확인 (숫자)


- 분류 (Classification)

일반적으로 알고 있는 개념이랑 동일합니다.

바이러스 검사를 받았는데 양성, 음성으로 분류 혹은 와인의 등급, 소고기 등급 등

여러 가지로 분류가 되는 방법입니다 (숫자가 아닌것)


종속변수가 숫자일 때 회귀

종속변수가 이름일 때 분류



2. 비지도 학습 (Unsupervised Leaning)


정답을 알려주지 않고, 비슷한 데이터들의 구성 또는 특징을 밝히는 방법입니다.


- 군집화

비슷한 것을 찾아서 그룹을 만드는 것입니다. 지도학습의 분류와 개념이 다릅니다.

예를 들어 이삿짐을 정리하는데 방마다 들어가는 가구들을 그룹화 것이 군집화 이고.

그룹을 만들고 난 후에 각각의 가구에 물건을 위치시키는 것이 분류 입니다.

정리하면 어떤 대상들을 구분해서 그룹으로 만드는 것이 군집화이고, 어떤 대상이 어떤 그룹에 속하는지 판단하는 것이 분류 입니다.

위의 그림은 군집화를 하는 과정입니다.

만약 군집이 1,000개 이상이면? 위도, 경도 외에 컬럼이 많다면?

사람이 작업하기 힘듭니다. 이러한 것을 도와주는 것이 머신러닝의 비지도 학습에 군집화입니다.

즉, 비슷한 행을 그룹핑하는 것


- 연관 (Association)

고객의 장바구니에 담긴 상품 바탕으로 관심을 가질 상품을 추천하는 방법

위의 사진은 고객의 판매내역입니다. 구입을 했다면 O 아니라면 X 입니다.

라면을 구매하는 사람은 계란을 구매 확률이 높고, 둘은 연관이 있다고 생각할 수 있습니다.

많은 양의 데이터의 연관성을 찾아주는 것이 연관입니다.



3. 강화학습 (Reinforcement Learning)


경험을 통해서 좋은 답을 찾는 것입니다.


게이머가 게임을 하면서 더 좋은 결과를 얻기 위해서 게임을 반복하면서 진행합니다.

위의 그림처럼 반복을 무한히 기계가 학습하면 좋은 결과를 얻을 수 있을 것입니다.


이러한 방법이 강화학습 입니다.



Comments


bottom of page