생활코딩 머신러닝1

머신러닝1

머신러닝의 분류

  • 머신러닝은 크게 지도학습, 강화학습, 비지도학습의 분야로 나뉜다.

  • 각각의 분야는 아래와 같이 비유된다.

지도학습

  • 독립변수와 종속변수의 관계를 컴퓨터에게 학습시키면 컴퓨터는 그 관계를 설명할 수 있는 공식을 만들어낸다.

  • 이 공식을 ‘모델’ 이라고한다.

회귀

  • 예측하고 싶은 종속변수가 숫자일 때 보통 회귀라는 머신러닝의 방법을 사용한다.

분류

  • 예측하고 싶은 종속변수가 이름일 때 분류라는 머신러닝의 방법을 사용한다.

회귀 vs 분류

비지도 학습

군집화(Clustering)

  • 그룹을 만드는 것이 군집화이다.
  • 어떤 대상들을 구분해서 그룹을 만드는 것이 군집화라면, 분류는 어떤 대상이 어떤 그룹에 속하는지를 판단하는 것이라고 할 수 있다.

  • 군집화라는 도구에 1000만개의 관측치(행)를 입력하고 100개의 클러스터가 필요하다고 알려주면, 유사한 속성을 가진 관측치끼리 분류하여 총 100개의 클러스터를 만들어준다.

연관규칙학습(Association rule learning)

  • 연관규칙학습은 서로 연관된 특징을 찾아내는 것이다.
  • 일명 장바구니 분석이라고 불린다.

  • 관측치(행)를 그룹핑 해주는 것은 군집화, 특성(열)을 그룹핑 해주는 것은 연관규칙이다.

비지도 학습 정리

  • 비지도 학습
    • 비지도학습은 데이터들의 성격을 파악하는 것이 목적이다.
    • 군집화와 연관규칙만을 놓고 봤을 때 데이터의 성격을 파악하는 작업은 비슷한 것은 모으고 다른 것은 떨어뜨리는 것이다. 즉, 그룹핑을 하는 것이다.
    • 독립변수와 종속변수의 구분이 중요하지 않고, 데이터만 있으면된다.
  • 지도 학습
    • 과거의 원인과 결과를 바탕으로 결과를 모르는 원인이 발생했을 때 그것은 어떤 결과를 초래할 것인가를 추측하는 것이 목적이다.
    • 그래서 원인인 독립변수와 결과인 종속변수가 꼭 필요하다.

강화학습

  • 강화학습의 핵심을 일단 해보는 것이다.
  • 비유하자면 지도학습이 배움을 통해서 실력을 키우는 것이라면, 강화학습은 일단 해보면서 경험을 통해서 실력을 키워가는 것이다.
  • 그 행동의 결과가 자신에게 유리한 것이었다면 상을 받고, 불리한 것이었다면 벌을 받는 것이다.
  • 이 과정을 매우 많이 반복하면 더 많은 보상을 받을 수 있는 더 좋은 답을 찾아낼 수 있다는 것이 강화학습의 기본 아이디어이다.

나에게 필요한 머신러닝을 찾아내는 방법

Leave a comment