Rethinking Action Spaces for Reinforcement Learning in End-to-end Dialog Agents with Latent Variable Models

Naacl 2019

Abstract

为对话定义action space并通过强化学习来优化其决策的过程是一个长期以来的挑战。通常的做法是使用手工来定义对话动作或者词表作为动作空间,两者都有各自的局限性。本文提出了一种潜在动作框架,将端到端agent的动作空间作为潜在变量,并应用非监督方法,从数据中归纳出自己的动作空间。

+
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×