MSR任务型对话系统论文列表

The paper list of MSR in task-oriented dialog system

任务型对话系统论文列表，总结了Sih一直以来对MSR对话研究的朝拜之路～

Budgeted Policy Learning for Task-Oriented Dialogue Systems

ACL 2019

https://arxiv.org/pdf/1906.00499

在DDQ基础上的改进，增加一个BSC模块，DDQ中的world model模块没有改进，sih认为也是用于改进训练数据的质量。
ConvLab: Multi-Domain End-to-End Dialog System Platform

2019.4 提出ConvLab对话系统模块集成的平台

GitHub链接：https://github.com/ConvLab/ConvLab

https://arxiv.org/pdf/1904.08637
Switch-based Active Deep Dyna-Q: Efficient Adaptive Planning for Task-Completion Dialogue Policy Learning

AAAI209

https://arxiv.org/pdf/1811.07550

加一个Switch，也是在生成质量上的改进，调整用于训练的数据的比例。
Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning

ACL2018

https://arxiv.org/pdf/1801.06176

基于model based的模型Dyna-Q (DQN的一种改进), 引入world model用来生成模拟的用户经验。
Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning

EMNLP 2018

https://arxiv.org/pdf/1808.09442

D3Q在DDQ基础上的改进, 在world model 后加判别器，模拟器生成的经验质量好的话再给agent作为训练数据
Subgoal Discovery for Hierarchical Dialogue Policy Learning

EMNLP 2018

https://arxiv.org/pdf/1804.07855

应用层级神经网络，提出SDN网络模型，把对话任务分解成subgoal，完成travel planning。

Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning

https://arxiv.org/pdf/1704.03084

上一篇文章的开端，EMNLP是在这一篇基础改进的。
Adversarial Advantage Actor-Critic Model for Task-Completion Dialogue Policy Learning

ICASSP 2018

https://arxiv.org/pdf/1710.11277

A3C, Adversarial 的 AC
End-to-End Task-Completion Neural Dialogue Systems

https://arxiv.org/pdf/1703.01008

Xiujun Li最早提出的任务型对话系统的pipeline 模型。
A User Simulator for Task-Completion Dialogues

https://arxiv.org/pdf/1612.05688

Xiujun Li 最早提出的User simulator.

2020-07-01

Data Augmentation for NLU -- Sih调研

NLU

MSR任务型对话系统论文列表

Comments

Links

Categories

Tag Cloud

Recent

Archives

Tags

Your browser is out-of-date!