본문 바로가기
Programming/Deep learning

네이버 클로바는 무엇?

by OKOK 2018. 4. 9.

네이버 클로바

용도: 음성 인식 비서 서비스

지원 기기: 안드로이드, IOS

출시일: 2017.05


대부분의 음성 이닉 비서 서비스들과 비슷하게, 자연어 처리, 음성 인식 철에 딥러닝 기술을 사용합니다. iOS 11 이후의 Siri처럼 음성 합성 기술에도 머신러닝을 사용해 다른 비서보다 음성이 더 자연스럽고, 감정을 담은 것 같다.


음성을 통해 네이버의 검색 엔진을 사용하거나 외국어를 번역할 수 있으며 개인 일정, 알람, 메모 등을 등록 및 질의할 수 있다.


네이버 뮤직, 지니 뮤직, 벅스와 연동되어 음성으로 음악 추천을 요청하거나 특정한 음악의 제목을 마하면 자동으로 음악을 찾아서 재생합니다. 국내 비서 플롯폼 중 유일하게 여러 음원 서비스를 이용 할 수 있습니다. 


현재 영어 프리토킹 모드는 앱에서 지원되지 않습니다. 개선해서 재출시 예정입니다. 클로바는 네이버가 장시간 서비스를 운여앟면서 축적해 놓은 크고 아름다운 한구겅 기반의 데이터들을 이용하고 있다는 것이 가장 큰 이점으로 평가되고 있습니다. 


확장기능을 지원합니다. node.js 기반으로 작성하여 서버를 운영해 클로바 콘솔과 연동하여 서비스를 제공할 수 있습니다. 딥러닝을 지속적인 발전이 이루어지는 음성 합성, 음성 인식 처리 기술의 API도 제공되어 직접 사용할 수 있습니다. 


다른 음성 이신 비서 서비스에는

자사  플랫폼 종속형은 블렉베리, 어시스턴스, 빅스비, 누구, 에스보이스, 시리, 큐보이스가 있습니다. 그리고 크로스 플랫폼형에는 구글 나우, 구글 어시스턴스, 네이버 클로바, 네이버 아이, 마이크로소프트 코타나, 알렉사, 카카오아이가 있습니다. 


자사 플롯폼 종소형으로는 서비스 제공자가 개발한 특정 플랫폼 내에서만 서비스를 제공하는 경우입니다.

그리고 크로스 플랫폼형 특정 플랫폼을 가리지 않고 다양한 환경에서 버시를 제공하는 경우 입니다. 


음성 인식 비서 서비스 

사람이 컴퓨터에 음성 명령을 주어서, 그 일을 대신 수행해주는 기능입니다. 음성 인식. 옜날에는 간단한 기본 단어로 명령을 줬지만, 지금은 유연하게 말하면서 명령을 줄 수 있고 웬만한 음성 비서들은 TTS가 기본으로 탑재되어 있어 말도 할 수 있습니다.  


기계학습이란? 

전문가 시스템 사람이 직접 많은 수의 규칙을 집어넣은 것을 전제로 하였습니다. 이같은 접근 방법은 과학에 기반한 학문들, 의학이나 생물 분야에서는 큰 역할을 할 수 있어다. 의사들의 진단을 도와주는 전문가 시스템에 기반한 프로그램을 생각해보면 인간이 지그까지 발견한 의학적인 규칙들을 데이터베이ㅅ화 하여 등록시켜주면 되는 것이었습니다.  


어떠한 작업에 대해서 꾸준한 경험을 통하여 그 작업에 대한 성능을 높이는 것. 이것을 기계학습이라고 할 수 있따. 좋은 품질의 데이터를 많이 가지고 있다면 보다 높은 성능을 끌어낼 수 있습니다. 학습 종류에 따른 분류 지도 학습 사람이 교사로서 각각의 입력에 대해 레이블을 달아놓은 데이터를 컴퓨터에 주면 컴퓨터가 그것을 학습하는 것이다. 정확도가 높은 데이터를 사용할 수 있다는 장점이 있다. 로지스틱 회귀법, KNN, 서포트 벡터 머신, 의사 결정 트리가 있습니다. 


분류에는 주차게이트에서 번호판 인식, 페이스북이나 구글 포토의 얼굴 인식, 친구 얼굴 위에 이름이 자동으로 달리고는 하는데, 이것 역시 기계학습을 이용한 것입니다. 음성 인식, 음성 way 파일에 대해서 해당 wav 부분이 어떤 음절인지를 인식하는 것. 애플 시리, 구글 보이스 등에서 사용된다.


회귀: 레이블 y가 실수인 경우 회귀문제라고 부른다. 보통 엑셀에서 그래프 그릴 때 많이 접하는 바로 그것입니다. 직선 혹은 곡선이므로 기계학습 문제가 맞다. 통계학의 회귀분석 기법 중 선형회귀 기법이 이에 해당하는 대표적인 예입니다.


앞으로 기계학습이 나아갈 방향으로 설정되어 있기도 합니다. 통계학의 군집화와 분포 추정 등의 분야와 밀접한 관련이 있습니다. 데이터가 쭉 뿌려져 있을 때 레이블이 없다고 해도 데이터간 거리에 따라 대충 두 세개의 군집으로 나눌 수 있습니다. 


분포 추정: 군집화에서 더 나아가서, 데이터들이 쭉 뿌려져 있을 때 얘네들이 어떤 확률 분포에서 나온 샘플들인지 추정하는 문제입니다. 


강화 학습. 현재의 상태에서 어떤 행동을 취하는 것이 최적인지를 학습하는 것입니다. 행동을 취할 때마다 외부 환경에서 보상이 주어지는데, 이러한 보상을 최대화 하는 방향으로 학습이 진행됩니다. 


지도학습에서 학습이라고 써놨으니 거창하지만, 그 원리는 데이터에 맞춰서 오차값을 최소화하면서 회귀식을 만드는 것입니다. 오차함수가 오목, 볼록함수라는 전제하에, 반드시 최소점이 존재하므로, 이를 찾아내는 알고리즘이 바로 경사 하강법입니다. 기울기는 아주 특별한 의미를 지니는 벡터장인데, 방향도함수가 최대의 변화를 갖는 방향이 바로 기울기가 가리키는 방향이기 때문입니다. 시작 위치를 잘 고르고 기울기의 반대방향으로 계속 내려가다보면 최소점을 언젠가는 찾아낼 수 있습니다. 


기하기반 케이민스 클러스터링 

주어진 입력을 군집화 하는 비교사 학습 방법입니다. 총 K개의 클러스터가 있다고 가정하고, 특징 공간에서 K개의 중간점을 찾는