MSR任务型对话系统论文列表

MSR任务型对话系统论文列表

The paper list of MSR in task-oriented dialog system

任务型对话系统论文列表,总结了Sih一直以来对MSR对话研究的朝拜之路~

  1. Budgeted Policy Learning for Task-Oriented Dialogue Systems

    ACL 2019

    https://arxiv.org/pdf/1906.00499

    在DDQ基础上的改进,增加一个BSC模块,DDQ中的world model模块没有改进,sih认为也是用于改进训练数据的质量。

  2. ConvLab: Multi-Domain End-to-End Dialog System Platform

    2019.4 提出ConvLab对话系统模块集成的平台

    GitHub链接:https://github.com/ConvLab/ConvLab

    https://arxiv.org/pdf/1904.08637

  3. Switch-based Active Deep Dyna-Q: Efficient Adaptive Planning for Task-Completion Dialogue Policy Learning

    AAAI209

    https://arxiv.org/pdf/1811.07550

    加一个Switch,也是在生成质量上的改进,调整用于训练的数据的比例。

  4. Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning

    ACL2018

    https://arxiv.org/pdf/1801.06176

    基于model based的模型Dyna-Q (DQN的一种改进), 引入world model用来生成模拟的用户经验。

  5. Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning

    EMNLP 2018

    https://arxiv.org/pdf/1808.09442

    D3Q在DDQ基础上的改进, 在world model 后加判别器,模拟器生成的经验质量好的话再给agent作为训练数据

  6. Subgoal Discovery for Hierarchical Dialogue Policy Learning

    EMNLP 2018

    https://arxiv.org/pdf/1804.07855

    应用层级神经网络,提出SDN网络模型,把对话任务分解成subgoal,完成travel planning。

    Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning

    https://arxiv.org/pdf/1704.03084

    上一篇文章的开端,EMNLP是在这一篇基础改进的。

  7. Adversarial Advantage Actor-Critic Model for Task-Completion Dialogue Policy Learning

    ICASSP 2018

    https://arxiv.org/pdf/1710.11277

    A3C, Adversarial 的 AC

  8. End-to-End Task-Completion Neural Dialogue Systems

    https://arxiv.org/pdf/1703.01008

    Xiujun Li最早提出的任务型对话系统的pipeline 模型。

  9. A User Simulator for Task-Completion Dialogues

    https://arxiv.org/pdf/1612.05688

    Xiujun Li 最早提出的User simulator.

Comments

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×