Visual Dialogue 总结

  1. CLEVR-Dialog: A Diagnostic Dataset for Multi-Round Reasoning in Visual Dialog

    NAACL 2019

    链接: https://arxiv.org/pdf/1903.03166.pdf

    摘要:可视对话是一种多模态任务,使用对话历史作为上下文,以图像为基础回答一系列问题。它是视觉、语言、推理和基础方面的挑战。然而,在大型真实数据集上单独研究这些子任务是不可行的,因为它需要对所有图像和对话框的“状态”进行代价高昂的完整注释。我们开发了一个大型诊断数据集,用于研究可视化对话框中的多轮推理。具体地说文章构建了一个基于CLEVR dataset 图像的场景图的对话语法。 其中可视对话的所有方面都得到了完整的标注。

+
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×