视觉-语言导航视觉-语言交互跨模态语义对齐行为决策视觉-语言导航是近年来出现并蓬勃发展的新兴研究方向,是视觉-语言交互前沿领域中的代表性研究任务之一,其目标是根据人类给出的语言指令基于环境视觉感知实现自主导航.首先介绍该任务的研究内容,分析其面临的跨模态语义对齐,语义理解与推理和模型泛化能力增强3个方面的问题...
2022 视觉-语言导航的研究进展与发展趋势 牛凯, 王鹏* (西北工业大学计算机学院 西安 710129) (peng.wang@nwpu.edu.cn) 摘要: 视觉-语言导航是近年来出现并蓬勃发展的新兴研究方向, 是视觉-语言交互前沿领域中的代表性研究任务 之一, 其目标是根据人类给出的语言指令基于环境视觉感知实现自主导航. 首先介绍该任务...