The paper list of MSR in task-oriented dialog system
任务型对话系统论文列表,总结了Sih一直以来对MSR对话研究的朝拜之路~
Budgeted Policy Learning for Task-Oriented Dialogue Systems
ACL 2019
https://arxiv.org/pdf/1906.00499
在DDQ基础上的改进,增加一个BSC模块,DDQ中的world model模块没有改进,sih认为也是用于改进训练数据的质量。
ConvLab: Multi-Domain End-to-End Dialog System Platform
2019.4 提出ConvLab对话系统模块集成的平台
GitHub链接:https://github.com/ConvLab/ConvLab
https://arxiv.org/pdf/1904.08637
Switch-based Active Deep Dyna-Q: Efficient Adaptive Planning for Task-Completion Dialogue Policy Learning
AAAI209
https://arxiv.org/pdf/1811.07550
加一个Switch,也是在生成质量上的改进,调整用于训练的数据的比例。
Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning
ACL2018
https://arxiv.org/pdf/1801.06176
基于model based的模型Dyna-Q (DQN的一种改进), 引入world model用来生成模拟的用户经验。
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning
EMNLP 2018
https://arxiv.org/pdf/1808.09442
D3Q在DDQ基础上的改进, 在world model 后加判别器,模拟器生成的经验质量好的话再给agent作为训练数据
Subgoal Discovery for Hierarchical Dialogue Policy Learning
EMNLP 2018
https://arxiv.org/pdf/1804.07855
应用层级神经网络,提出SDN网络模型,把对话任务分解成subgoal,完成travel planning。
Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning
https://arxiv.org/pdf/1704.03084
上一篇文章的开端,EMNLP是在这一篇基础改进的。
Adversarial Advantage Actor-Critic Model for Task-Completion Dialogue Policy Learning
ICASSP 2018
https://arxiv.org/pdf/1710.11277
A3C, Adversarial 的 AC
End-to-End Task-Completion Neural Dialogue Systems
https://arxiv.org/pdf/1703.01008
Xiujun Li最早提出的任务型对话系统的pipeline 模型。
A User Simulator for Task-Completion Dialogues
https://arxiv.org/pdf/1612.05688
Xiujun Li 最早提出的User simulator.