Multi-task Learning for Natural Language Generation in Task-Oriented Dialogue

EMNLP 2019 任务型对话整理

创新点:将NLG的响应生成与语言模型结合,共享encoder,作为多任务学习。

Abstract

在面向任务的对话中,自然语言生成(NLG)是生成面向用户系统话语的最后一步。NLG的结果直接关系到对话系统的质量和可用性。尽管大多数现有的系统在给出目标时都能给出正确的响应,但它们很难与人类语言的多样性和流利性相匹配。在本文中提出了一个新的多任务学习框架,NLG-LM,用于自然语言生成。除了生成传递所需信息的高质量响应外,它还通过一个未配置的语言模型明确地针对生成响应的自然相关性。这对提高人类语言的风格和多样性有重要意义。

Domain Adaptive Dialog Generation via Meta Learning

应用meta learning进行对话系统的领域适配,在MAML基础上提出DAML,未开源代码,MAML作为meta learning的具体方法之一,值得学习。

Visual Dialogue 总结

  1. CLEVR-Dialog: A Diagnostic Dataset for Multi-Round Reasoning in Visual Dialog

    NAACL 2019

    链接: https://arxiv.org/pdf/1903.03166.pdf

    摘要:可视对话是一种多模态任务,使用对话历史作为上下文,以图像为基础回答一系列问题。它是视觉、语言、推理和基础方面的挑战。然而,在大型真实数据集上单独研究这些子任务是不可行的,因为它需要对所有图像和对话框的“状态”进行代价高昂的完整注释。我们开发了一个大型诊断数据集,用于研究可视化对话框中的多轮推理。具体地说文章构建了一个基于CLEVR dataset 图像的场景图的对话语法。 其中可视对话的所有方面都得到了完整的标注。

Rethinking Action Spaces for Reinforcement Learning in End-to-end Dialog Agents with Latent Variable Models

Naacl 2019

Abstract

为对话定义action space并通过强化学习来优化其决策的过程是一个长期以来的挑战。通常的做法是使用手工来定义对话动作或者词表作为动作空间,两者都有各自的局限性。本文提出了一种潜在动作框架,将端到端agent的动作空间作为潜在变量,并应用非监督方法,从数据中归纳出自己的动作空间。

医疗对话系统总结

Sih对目前医疗诊断领域任务型对话的总结。

ConvLab - Multi-Domain End-to-End Dialog System Platform

微软和清华在对话系统领域的合作:ConvLab - Multi-Domain End-to-End Dialog System Platform

提出ConvLab—多领域端到端对话系统平台,它一方面提供一些可复用的组件来帮助实验人员快速实验,另一方面还可基于它在通用环境中对比大量不同方法(包括从pipeline到完全端到端好几个层级的方法,后面会细说)。另外,ConvLab还提供了一些完全标注的数据集和一些相关的预训练模型。作为一个演示,我们使用用户对话行为标注扩展了multiwoz数据集(记得好像是EMNLP2018 best paper提出来的,不仅有数据还有相应的任务)用来训练系统的所有组件,同时演示convlab如何使在多领域的端到端对话中进行复杂实验变得简单和高效。

本文主要贡献包括:ConvLab是第一个涵盖多个可训练模型和相关标注数据集的开源多领域端到端对话系统;ConvLab提供一套丰富的工具和组件用于开发不同类型的对话系统,使研究人员能够在相同条件下比较不同的方法;ConvLab通过人工和仿真器提供端到端的评估;ConvLab作为DSTC8的标准平台。

Anyway, 期待!

Today's User simulator

Dialogue Simulation

Simulation-Based Evaluation

  • 为什么用User simulator:

    • 通常,RL算法需要与用户交互才能学习。但是,在招募的用户或实际用户上运行RL可能是昂贵的,甚至是有风险的。解决这一挑战的一种方法是构建一个模拟用户,与RL算法交互几乎不需要任何成本。
      本质上,User simulator试图模拟真实用户在对话中的行为: a. 跟踪对话状态,b.并与RL对话系统进行对话

jupyter的安装和配置

1.安装jupyter

pip install jupyter

如果安装报错,则安装

sudo apt-get install libsqlite3-dev

w2v词向量模型的训练和使用

0.数据处理

针对wiki 数据集:

    opencc -i wiki.zh.fanti.text -o wiki.zh.jianti.text -c t2s.json
+
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×