输出(生成图像): Multimodal Retrieval Dataset 多模态检索评价模型进行图文理解和匹配的能力,是电商场景中满足用户需求、促成点击交易不可缺少的一环。在此次任务中,我们准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品(样例如下图)。为了更好评价模型跨模态理...
Multimodal Retrieval Dataset 多模态检索评价模型进行图文理解和匹配的能力,是电商场景中满足用户需求、促成点击交易不可缺少的一环。在此次任务中,我们准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品(样例如下图)。为了更好评价模型跨模态理解的效果,我们此次...
Multimodal Retrieval Dataset 多模态检索评价模型进行图文理解和匹配的能力,是电商场景中满足用户需求、促成点击交易不可缺少的一环。在此次任务中,我们准备了来自于淘宝电商平台的真实搜索 query 及商品图,要求模型从给定的商品池中检索出与搜索 query 相匹配的商品(样例如下图)。为了更好评价模型跨模态理解的效果,我...
简介:MUGE全称是Multimodal Understanding and Generation Evaluation Benchmark,是由达摩院智能计算实验室认知智能团队推出了大规模中文多模态评测基准,拥有当前最大规模的中文多模态评测数据集,覆盖多种类型的任务,包括图文描述、基于文本的图像生成、跨模态检索等。MUGE的推出旨在解决当前中文多模态领域下游任务数据集匮乏的...
Multimodal Retrieval Dataset 多模态检索评价模型进行图文理解和匹配的能力,是电商场景中满足用户需求、促成点击交易不可缺少的一环。在此次任务中,我们准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品(样例如下图)。为了更好评价模型跨模态理解...
数据集名称为:Multimodal Retrieval Dataset 数据集下载文件为:Multimodal_Retrieval.zip,包括: MR_train_imgs.tsv:训练集图片集合(base64编码) MR_train_queries.jsonl:训练集搜索query及对应商品id MR_valid_imgs.tsv:验证集图片集合(base64编码) MR_valid_queries.jsonl:验证集搜索query及对应商品id MR_test_...
下游任务主要包括视觉问答(visual question answer),看图说话(image captioning),图文检索(image-text retrieval)和以文生图(text-to-image generation)等。MUGE(Multimodal Understanding and Generation Evaluation)是业界首个大规模中文多模态评测基准,截止11.9日,融智团队在参与评测的以文生图,看图说话,图文检索三个赛道...
Multimodal Retrieval Dataset 多模态检索评价模型进行图文理解和匹配的能力,是电商场景中满足用户需求、促成点击交易不可缺少的一环。在此次任务中,我们准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品(样例如下图)。为了更好评价模型跨模态理解的效果,我们此次...
Multimodal Retrieval Dataset 多模态检索评价模型进行图文理解和匹配的能力,是电商场景中满足用户需求、促成点击交易不可缺少的一环。在此次任务中,我们准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品(样例如下图)。为了更好评价模型跨模态理解的效果,我们此次...
Multimodal Retrieval Dataset 多模态检索评价模型进行图文理解和匹配的能力,是电商场景中满足用户需求、促成点击交易不可缺少的一环。在此次任务中,我们准备了来自于淘宝电商平台的真实搜索query及商品图,要求模型从给定的商品池中检索出与搜索query相匹配的商品(样例如下图)。为了更好评价模型跨模态理解的效果,我们此次...