반응형

핵심 정리

이 글은 챗봇 특강에서 다룬 사례와 대화 모델의 현실적인 제약을 기록한 메모입니다. 도메인을 제한한 주문 대화, RNN 기반 encoder-decoder, 룰 기반 처리와의 혼합, 데이터 부족 때문에 생성형 대화가 어려운 이유를 함께 훑습니다.

  • 카페 주문처럼 범위를 제한한 대화는 자연스러운 시나리오 설계가 상대적으로 쉽습니다.
  • 발화 의도 분류는 평가하기 쉽지만 자연스러운 응답 생성은 훨씬 어렵습니다.
  • 실무 챗봇은 데이터 부족 때문에 RNN만 사용하기보다 룰 기반 흐름을 섞는 경우가 많습니다.
  • 기계번역과 챗봇의 기본 구조로 encoder RNN과 decoder RNN 흐름이 언급됩니다.
  • MDP 상태를 딥러닝 표현으로 바꾸는 연구 방향과 상담 도메인의 데이터 한계도 기록돼 있습니다.

이 글은 강연 당시의 메모이므로 특정 제품의 현재 성능 비교보다는 챗봇 설계에서 데이터, 도메인 범위, 평가 가능성이 왜 중요한지 읽는 용도로 적합합니다.

이어서 볼 글

 

jibo: The World's First Social Robot for the Home

사진도 찍어주고, 등.. 누구..같은 로봇임

Pororo Story QA

Cafebot Scenario 2:복합 주문

카페도메인으로 한정하면 자연스러운 대화 가능?

최신트렌드: 리즈닝이 가능한 딥러닝

MS루이스, ibm왓슨

대화의 템플릿필요 (완전 프리한 모델은 아님)

질문: CNN활용은 안하나?

최근 미국 챗봇업체

RNN과 휴리스틱(룰) 섞어서 하는 추세

대화알고리즘은 매져가 어려움

발화의도는 매져가능

90%이상 분류성능 달성

설문으로 자연스러운지 설문했다. 5점가까운 점수 받았다.

딥러닝만으로는 성능향상이 어려워서

룰베이스랑 섞어서 하는게 요즘 추세다(데이터가 많으면 RNN만으로 될거다)

판별은 쉬운데 생성은 어렵다.

MDP노드를 딥러닝 히든노드로 대치하는게 최근 연구 추세

워드넷?

http://github.com/kimeunsol

eskim@bi.snu.ac.kr

상담용 챗봇의 데이터 사이즈가 작을경우는 불가능하다고 본다함

기계번역이나 챗봇의 기본구조는 P(R|S)를 구하는거고

인코더 RNN, 디코더 RNN을 사용한다.

디코더 BP시 인코더 파라미터까지 학습하도록 한다.

http://www.cleverbot.com/

99% 챗봇업체는 딥러닝 사용한다고 해도 실제로는 룰베이스다

실제는 구글이나 페북 제외하면 데이터 부족으로 할 수가 없다.

아주 일부 부분만 머신러닝 나머지는 룰베이스

https://github.com/Kyung-Min/Seq2Seq-TensorFlow

실습

https://147.46.219.138:9900/notebooks/30/BabySeq2Seq.ipynb

kmkim@bi.snu.ac.kr 김경민

반응형

+ Recent posts