본문 바로가기
Programming/Deep learning

machine learning

by OKOK 2018. 1. 22.

룰 베이스느 러닝이 있습니다. 레코드가 있습니다. 기록이 있습니다. 특정한 태스크 티를 정의해보도록 하겠습니다. 이 퍼펙트한 월드에서는 어떻게 하는지, 놀 수 있다. 없다는 클래스파이 에스오억 노라고 하는 것입니다. 그런 태스크를 만들도록 하겠습니다. 완벽한 세상, 완전한 세상. 관측의 에러는 없습니다. 일관적이지 않은 관측도 없다고 하겠습니다. 날이 맑으면, 일관적인 행동이 있습니다.  


데이터 중에 어떤 것이 가장 중요한지 임무를 돌아보도록 하겠습니다. 펑션 어프로시멩션을 어떻게 하면 좋을까? 현실감있게, 하무를 근접화하는 것입다. 훌륭한 에이아이 라고 할 수 있습니다. 인스턴스를 정의하겠습니다. 하나의 예를 들면, 4개의 인스턴스가 있습니다. 트레이닝 데이터 셋이 있습니다. 그리고 가설이 있습니다 오케이요. 여러개의 가설이 가능합니다. 데이터를 통해서 추정하려는 함수 입니다. 터갯 함수 씨가 있습니다. 에이치를 정확한 씨로 만드는 것이 중요합니다. 인풋 벡터가 있다고 생가갷봅니다. 오케이요. 돈케어 입니다. 가설을 세움니다. 에이치3 기준입니다. 물음표 물음표 돈 케어 입니다. 라이트 입니다. 웜, 돈케어가 됩니다. 즉 엑스2 케이스에서는 에이치쓰리 기준에서 판별했을 때, 나가놀지 않습니다. 빼고, 맞습니다. 스펭스르 정의하고 정의하고 스펭스를 정의하고 맵핑 관계를 만들어 낼 수 있습니다.  


파인트 에스라는 알고리즘을 한번 정의해보도록 하겠습니다. 데이터 여러개으 데이터가 모여가지고, 모든 데이터가 엑스 인스터스 중에서 엑스가 긍정이라면, 그런 케이스 경우에는 그런 피쳐들을 가지고 판단을 하는 것입니다. 하이퍼시스에 있는 값과 그 피쳐값이 같다고 하면 할 필요가 없다. 파인드 에스라는 알고리즘이 있습니다.  합집합 파트에 의해서 합집합이 되어서 써니로 들어오게 됩니다. 웜이 들어오고, 이렇게 이렇게 됩니다. 트레이닝 인스턴스에 대해서는 그 값을 받아들이게 도비니다. 2번째 인스턴스 엑스 2로 됩니다. 써니 웜이 되고 놜, 라이트, 스트롱이 다릅니다. 러너가 새로운 경험에 의해서 배우는 것입니다. 스트롱 하지 않아도 나가 노는 구나 싶습니다. 돈케어가 되는 것입니다. 바람의 세기, 물음표가 됩니다. 써니 웜 노말이 되고 돈케어가 되고, 웜하고 체인지가 됩니다. 특정한 커버리지를 가진, 가설을 찾아나가는 과정이 파로 이 알고리즘입니다.  트루 펑션 씨에 가까운가요. 물음표가 있는게, 씨일 수 있습니다.  만족하는 것들, 가장 스페서픽한 것 제너럴한 것 특정 버젼 스페이스만 찾아내비다. 데이터의 셋에 있는 인스턴트를 활용하여, 레이블이 긍정이라면 참으로 설명을 해야합니다. 


다른 결정 팩터가 있을 수 있습니다. 노이즈에 의해서 정확히 가설이 지워질 수 있습니다. 완벽한 세상에서는, 에러가 있는 경우에는 잘 돌아가지 않는 것입니다. 노이즈한 부분을 잘 처리하기 위해서 다양한 러닝 알고리즘이 있습니다. 결정 트리를 배워보도록 하겠습니다.  룰 베이스 러닝에 대해서 통계에 대해서 러닝 모델에 대해서 알아보도록 하겠습니다. 룰 베이스가 어렵다 생각합니다. 에러가 있는 것을 어떻게 통계적으로 활용할 수 있을까? 러닝 결정 트리가 접근하기 쉽습니다. 하나의 가설 일 수 있습니다. 하나의 형태로 표현이 가능합니다. 삼각형을 제한해서 두고 옛로 오케이요. 


바람, 해, 비, 결정 트리로 표현할 수 있습니다. 이것을 조금 더 진행하기 위해서 하나의 구체적인 사례를 들려고 합니다. 이런 형태의 데이터 셋이 있습니다. 간단하게 데이터 셋에 대해서 설명하고 있습니다.  


하나의 특성을 보고 에이원 에이나인을 봐야하는지, 왜 결정됬는지, 그 다음에는 여러개로 해서 디시전 트리로 만드는 과정에 대해서 알아보도록 하겠습니다. 엔트로피에 대해서 러닝 알고리즘을 이해할 수 있습니다. 어떤 랜덤 베리어블로 판단을 할 수 있는 것입니다. 얼만큼 불만확실성이 높으냐 적으냐 판단하는 것입니다. 그러면 간단하게 생각할 때,  엑스가 연속적인 공간에서 정의되어 있다 하면 인테그랄 적부니로 바뀌게 됩니다. 정의해보았을 때, 프로바빌리티를 배우고 난 뒤, 컨디션을 주어져서 엔트로피. 다음과 같이 정의할 수 있습니다. 


linear regression 기계학습 방법론 중에서 리니어 리그레션에서 영감을 받은 것들이 많이 있습니다. 가장 쉬운 것입니다. 자 어프로취는 어떤가? 룰 기반의 방법을 활용했다고 하면, 통계적인 방법, 크레딧 어프로브 하우징 인포메이션, 한개의 트루 벨류가 있습니다. 디펜던트 베리어블이 있습니다. 하이퍼시스를 정해보도록 하겠습니다. 디시전 트리에서 보면, 오케이요.  세타라고 하는 방법은 엑스와이는 아는 텀입니다. 요 파트를 뒤로 나누고 이런식으로 하면 됩니다. 인벌스하는 부분이 들어 있습니다. 세타르 확실하게 만들 수 있습니다. theta 리니어 하게 표현할 수 있습니다. 자 그럼 다음에 프로그램을 활용하여서 알아보도록 하겠습니다.