Machine Learning

  • 일종의 소프트웨어이다.
  • Limitations of explicit programming. (e.g. spam filter, automatic driving)
  • 개발자가 일일이 어떻게 하는지 정하지 않고, 프로그램 자체가 스스로 학습해서 동작하는 방식

 

supervised/unsupervised learning

  • 학습을 위해서 데이터가 미리 주어져야 한다.
  • 학습하는 방법에 따라 supervised/unsupervised learning로 나뉜다.
  • supervised learning:  learning with labeled examples (= training set)
  • unsupervised learning: un-labeled data (e.g. google news grouping, word clustering)

 

supervised learning

most common problem type in ML

(e.g. image labeling, email spam filter, predicting exam score)

 

types of supervised learning

  1. regression : predicting final exam score based on time spent (0~100)
  2. binary classification : pass/non-pass based on time spent
  3. multi-label classification : letter grade (A, B, C, E and F) based on time spent

 

Simple Linear Regression

Regression

  • 우리말로 하면 퇴보, 후퇴 -> 오해가 될 수 있음
  • 정확하게는, Regression toward the mean을 의미한다.
  • 전체의 평균으로 되돌아가려는 속성이 있다는 통계적 원리를 설명하는 말

 

Linear Regression

  • 데이터를 가장 잘 대변하는 직선의 방정식을 찾는 것
  • 즉, y = ax + b 의 기울기와 y 절편을 찾는 것

 

Cost = Loss = Error

  • How fit the line to our (training) data
  • 우리가 할려고 하는 것은 이 Cost, Loss, Error을 최소화하는 방법을 찾는 것이다.
  • 하지만, 이 값은 양수가 될 수도 있고, 음수가 될 수도 있기 때문에 에러 제곱의 평균을 사용한다.

 

 

 

참조

boostcourse - 텐서플로우로 시작하는 딥러닝 기초

squareyun