2022人民网算法赛:对话生成任务 比赛地址:http://data.sklccc.com/2022 赛题介绍 新浪微博作为新型社交媒体积累了各领域的海量数据,从中挖掘出潜在的特征并及时识别出话题,能够带来可观的社会价值。本次比赛提供微博识别数据集,每条数据包括微博文本数据及对应的话题标签,每个数据样本可能包含一个或多个话题标签。参赛...
参赛选手需要通过训练集数据建立预测模型,对测试集数据的话题标签作出识别。 数据说明 训练集包含一批文本信息样本及其标签,文件名为train.csv,各字段以tab分隔,格式如下: Text,微博文本内容 Label,话题标签 测试集包含一批不含标签的样本,文件名为test.csv,格式如下: ID,样本ID Text,微博文本内容 评价指标 在此任...