-
Notifications
You must be signed in to change notification settings - Fork 19
A Deep Reinforcement Learning Chatbot
Higepon Taro Minowa edited this page Apr 8, 2018
·
19 revisions
- Amazon Alexa Prize competition で MILABOT を deep reinforcement learning で開発した。
- よくある small talk topi に対応していて人と会話できる
- bot は
- natural language generation model と retrieval model を組み合わせてつくられている
- template-based model, bag-of-words model, seq2seq, latent variable などなど。
- crowd source と実際のユーザーとのやりとりで、複数のモデルから適切な response を選ぶように reinforcement learning で train した。
略
- rule base は限界があるのでほぼ全て Statistical machine learning にした。
- 全てのコンポーネントが独立して大量データを使って ML で training された
- dialogue manager
- モデルたちから reponse 候補をもらう
- priority response があったら即返す (what's your name?)
- なかったら selection policy で選ぶ