Machine Learning Vs. Deep Learning
Machine Learning 이란 무엇일까요? |
Tom Mitchell의 정의가 가장 많이 인용되고 있습니다. 어떠한 작업에 대해 꾸준한 경험을 통해 작업에 대한 성능을 높이는 것입니다. 이해를 돕기 위한 예제로 키를 기반으로 몸무게를 예측한다고 해봅시다. 가장 첫번째로 해야 할 일은 데이터를 수집하는 것입니다. 데이터가 이런 형태를 보인다고 가정해봅시다. 그래프의 각 점은 하나의 데이터를 뜻합니다. 키를 기반으로 하여 몸무게를 예측하기 위해 선 하나를 그어볼 수 있습니다. 몸무게 = 키 - 100 입니다. 이 공식만으로도 만족스럽긴 하지만 우리는 서응을 이해하고 향상시키기 위해 노력해야 할 거 싱비니다. 실제값과 예측값의 차이를 줄여야 할 것 입니다. 데이터가 많을수록 더 나은 성능의 모형이 만들어질 것입니다. |
Deep Learning 이 무엇일까요? |
어떻게 인간이 정사각형과 다른 도형을 인지하는지 알아봅시다. 가장 먼저 우리의 눈은 도형에 4개의 선들이 있는지 없는지를 확인합니다. (Simple concept) 우리가 4개의 선을 찾는다면, 그 다음 스텝으로 이 선들이 연결되어있는지, 닫혀있는지, 직각인지, 선의 길이가 동일한지 찾아봅니다. (nested hierachy of concepts) 복잡한 task(정사각형을 구분하는 일)을 좀 덜 추상적인 task로 구분하였습니다. 사진을 보고 개인지 고양이인지 구분하는 것을 예로 들어봅니다. 동물이 수염이 있는지 없는지, 귀가 있는지 없는지, 만일 있다면 솟아있는지 등을 확인할 것입니다. 정리하자면 우리는 시스템 feature 중 무엇이 특정 동물을 더 잘 묘사하는지를 구분할 것입니다. 딥러닝은 분류에 있어 중요한 feature를 자동적으로 골라냅니다. 머신러닝은 수동적으로 중요한 feature 를 제공하는 반면. 정리하자면 딥러닝은 어떤 정보가 개와 고양이를 가장 잘 구분할지를 찾는 것입니다. |
머신 러닝과 딥러닝의 비교 |
1. 데이터 의존도 데이터 양이 작다면 딥러닝 알고리즘의 성능은 잘 나오지 않습니다. 왜냐하면 딥러닝 알고리즘은 어떤 과제를 이해하기 위해서 매우 큰 데이터가 필요하기 때문입니다.
2.2 하드웨어 의존도 딥러닝 알고리즘의 요구사항은 GPU가 포함되기 때문입니다. GPU는 작업에서 숫자 계산을 담당합니다. 딥러닝 알고리즘은 본질적으로 많은 양의 행렬 곱셈을 수행합니다. |
추가 자료 |
슈퍼바이즈, 언슈퍼바이즈의 차이는 레이블링에 따른 분류입니다. 딥러닝은 레이블 이용에 따른 분류가 아니기에 슈퍼바이즈 딥러닝, 언슈퍼바이즈 딥러닝, 강화학습 러닝 다 있습니다. 그럼 딥러닝의 반댓말은 무엇일까요? 쉘로우 러닝입니다. 쉘로우 러닝은 인풋이 있으면 아웃풋 이렇게 한단계입니다. 딥러닝은 층수가 늘어나는 것입니다. 사용자가 관여하는 것은 인풋밖에 없습니다. 그 내부에서 컴퓨터가 재가공해서 새로운 인풋을 만들어 냅니다. 가장 마지막에 아웃풋을 내는 구조를 말합니다. 안에 있는 과정 자체에서 인풋들을 가공한다는 점이 딥러닝입니다! 유사한 단어는 end-to-end learning, representation learning, deep neural network 입니다. 거의 90%는 dnn 을 사용합니다. 인공지능, 머신러닝, 딥러닝 모두 다른 단어입니다. https://www.youtube.com/watch?v=mH3w-OmHQK0 |