Dialogue Simulation
Simulation-Based Evaluation
为什么用User simulator:
通常,RL算法需要与用户交互才能学习。但是,在招募的用户或实际用户上运行RL可能是昂贵的,甚至是有风险的。解决这一挑战的一种方法是构建一个模拟用户,与RL算法交互几乎不需要任何成本。
本质上,User simulator试图模拟真实用户在对话中的行为: a. 跟踪对话状态,b.并与RL对话系统进行对话
Update your browser to view this website correctly. Update my browser now