目前数据集已开源至https://github.com/baidu/DuReader/tree/master/DuReader-vis。 1. 背景 现有开放域问答系统主要以文本集合作为信息来源回答用户提问,如图1所示,现有系统通常需要花费大量成本根据不同的文档格式设计特定的内容抽取算法,预先从异...