数据集 模型结构 Result 使用方式 Demo 数据预处理 训练 可视化训练过程 网页展示 图像中文描述 图像中文描述问题融合了计算机视觉与自然语言处理两个方向,对图片输出一句话的描述。 描述句子要求符合自然语言习惯,点明图像中的重要信息,涵盖主要人物、场景、动作等内容。
E-Commerce IC共包含5w条训练数据和5k条验证集数据,同时提供1w张图片用于在线评测,是目前业界最大的中文电商Caption数据集。 下面是两个样例: 例子1: 输入(商品图片): 输出(商品文案描述):使用原始北欧风格,崇尚自然,以木色、黑色、白色作为整体色调,给人舒适宁静的感觉,轻松就餐,才能留住好食光,在极简风的北欧...
http://lixirong.net/research/fluency-guided-cross-lingual-image-captioninglixirong.net/research/...
训练模型使用的数据集来源(https://challenger.ai/competition/caption) 数据集对给定的每一张图片有五句话的中文描述。数据集包含30万张图片,150万句中文描述。 训练集:210,000 张 验证集:30,000 张 测试集 A:30,000 张 测试集 B:30,000 张 Result 使用方式 Demo 下载[预训练模型]放在models目录,并上传...