본문 바로가기
카테고리 없음

Machine Learning Vs. Deep Learning

by OKOK 2018. 5. 7.

Machine Learning 이란 무엇일까요? 

Tom Mitchell의 정의가 가장 많이 인용되고 있습니다. 어떠한 작업에 대해 꾸준한 경험을 통해 작업에 대한 성능을 높이는 것입니다. 이해를 돕기 위한 예제로 키를 기반으로 몸무게를 예측한다고 해봅시다. 가장 첫번째로 해야 할 일은 데이터를 수집하는 것입니다. 데이터가 이런 형태를 보인다고 가정해봅시다. 

그래프의 각 점은 하나의 데이터를 뜻합니다. 키를 기반으로 하여 몸무게를 예측하기 위해 선 하나를 그어볼 수 있습니다. 몸무게 = 키 - 100 입니다. 이 공식만으로도 만족스럽긴 하지만 우리는 서응을 이해하고 향상시키기 위해 노력해야 할 거 싱비니다. 실제값과 예측값의 차이를 줄여야 할 것 입니다. 데이터가 많을수록 더 나은 성능의 모형이 만들어질 것입니다. 


Deep Learning 이 무엇일까요? 

 

어떻게 인간이 정사각형과 다른 도형을 인지하는지 알아봅시다. 가장 먼저 우리의 눈은 도형에 4개의 선들이 있는지 없는지를 확인합니다. (Simple concept) 우리가 4개의 선을 찾는다면, 그 다음 스텝으로 이 선들이 연결되어있는지, 닫혀있는지, 직각인지, 선의 길이가 동일한지 찾아봅니다. (nested hierachy of concepts) 복잡한 task(정사각형을 구분하는 일)을 좀 덜 추상적인 task로 구분하였습니다. 


사진을 보고 개인지 고양이인지 구분하는 것을 예로 들어봅니다. 동물이 수염이 있는지 없는지, 귀가 있는지 없는지, 만일 있다면 솟아있는지 등을 확인할 것입니다. 정리하자면 우리는 시스템 feature 중 무엇이 특정 동물을 더 잘 묘사하는지를 구분할 것입니다. 딥러닝은 분류에 있어 중요한 feature를 자동적으로 골라냅니다. 머신러닝은 수동적으로 중요한 feature 를 제공하는 반면. 정리하자면 딥러닝은 어떤 정보가 개와 고양이를 가장 잘 구분할지를 찾는 것입니다.


머신 러닝과 딥러닝의 비교 

1. 데이터 의존도

데이터 양이 작다면 딥러닝 알고리즘의 성능은 잘 나오지 않습니다. 왜냐하면 딥러닝 알고리즘은 어떤 과제를 이해하기 위해서 매우 큰 데이터가 필요하기 때문입니다.

 

2.2 하드웨어 의존도

딥러닝 알고리즘의 요구사항은 GPU가 포함되기 때문입니다. GPU는 작업에서 숫자 계산을 담당합니다. 딥러닝 알고리즘은 본질적으로 많은 양의 행렬 곱셈을 수행합니다.  


추가 자료 

슈퍼바이즈, 언슈퍼바이즈의 차이는 레이블링에 따른 분류입니다. 딥러닝은 레이블 이용에 따른 분류가 아니기에 슈퍼바이즈 딥러닝, 언슈퍼바이즈 딥러닝, 강화학습 러닝 다 있습니다. 그럼 딥러닝의 반댓말은 무엇일까요? 쉘로우 러닝입니다. 쉘로우 러닝은 인풋이 있으면 아웃풋 이렇게 한단계입니다. 딥러닝은 층수가 늘어나는 것입니다. 사용자가 관여하는 것은 인풋밖에 없습니다. 그 내부에서 컴퓨터가 재가공해서 새로운 인풋을 만들어 냅니다. 가장 마지막에 아웃풋을 내는 구조를 말합니다. 안에 있는 과정 자체에서 인풋들을 가공한다는 점이 딥러닝입니다! 유사한 단어는 end-to-end learning, representation learning, deep neural network 입니다. 거의 90%는 dnn 을 사용합니다. 인공지능, 머신러닝, 딥러닝 모두 다른 단어입니다. 


https://www.youtube.com/watch?v=mH3w-OmHQK0