CCF BDCI “技术需求”与“技术成果”项目之间关联度计算比赛由中国计算机学会和八六三软件发起,赛题目的是发现好的方法、算法或模型,并提供用于验证的程序源代码,可应用于平台模拟人工,实现“需求——成果智能匹配服务”。 文本将介绍冠军团队"莽就完事了"的赛题分享,冠军团队由马凯欣一人组成。凯欣来自东北林业大学,...
代码详见https://gitee.com/wang-qiangsy/bdci 目录 一.赛题介绍 1.赛题背景 2.赛题任务 二.关于Google T5预训练语言模型 1.T5模型主要特点 2.T5模型与赛题任务的适配性分析 3.模型的优化 三.解题思路 1.数据准备 2.数据处理 3.模型训练 4.模型评估 ...
ModelArts的雪中送炭,让我拿下CCF BDCI华为Severless工作负载预测亚军 摘要:中国计算机学会大数据与计算智能大赛(CCF BDCI)华为Severless工作负载预测亚军方案和ModelArts使用体验分享 本文分享自华为云社区《免费薅ModelArts算力资源-拿下CCF BDCI华为Severless工作负载预测亚军》,原文作者:wyhhyw 。 赛题简介 基于历史数据...
【本期推荐】8岁小朋友的儿童节,有点硬核,一起来认识这些小小程序员,看他们如何coding出一个与众不同的童年。 摘要: 中国计算机学会大数据与计算智能大赛(CCF BDCI)华为 Severless 工作负载预测亚军方案和 ModelArts 使用体验分享 本文分享自华为云社区《免费薅ModelArts算力资源-拿下CCF BDCI华为Severless工作负载预测...
从爱奇艺官方写的博客来看,说明句子当前的情感与上下文都有很深的联系。所以拼接的上下文一定是需要正确的上下文关系的,之前很多参加比赛的同学反馈说拼接了上下文反而效果更差了,很重要的一点就是拼接错了上下文。 对数据集进行排序 #剧本角色数据集排序path1='data_sort.tsv'path2='data.tsv'text_list=[]s=...
本文是作者参加CCF BDCI获得冠军的比赛经验总结以及语义分割trick的整理。作者的比赛方案最大的特点是将连通性问题转换为二分类问题解决,结果优异,传统图像形态学后处理仍然可靠。且无须针对性设计loss和module,分类器可用多种小模型,实际环境下并行处理也更快。
近日,在2019 CCF大数据与计算智能大赛(CCF Big Data & Computing Intelligence Contest,简称CCF BDCI)决赛中,华为云语音语义创新Lab获得金融实体级情感分析大赛冠军,体现了在文本情感分析和知识图谱领域的实力。 图1 华为云获2019CCF BDCI金融信息负面及实体判定大赛冠军 ...
本文以CCF大数据与计算智能大赛(CCF BDCI)图书推荐系统竞赛为实践背景,使用Paddle构建用户与图书的打分模型,借助Embedding层来完成具体的匹配过程。后台回复 211208 可获取完整代码。 代码地址: https://aistudio.baidu.com/aistudio/projectdetail/2556840 ...
最简单的方式就是新词/短语挖掘,而新词/短语挖掘最常用的方法是计算左右熵和紧密度,不过这种方式计算量较大,这次比赛笔者舍弃了这种方式,采用借鉴苏神的博客最小熵原理(二):“当机立断”之词库构建中的思路,用PMI表征紧密度,用相邻两个字之间的紧密度判断两者是否存在“固定搭配”,最终未被切分的为一个整体。
2020CCF BDCI 企业非法集资风险预测-线上0.848(水哥的baseline),在此基础已做到线上0.848,排名前1%(参赛队伍3000+))。,首先感谢DataWhale这个组织,今年上半年在学校机器学习的过程中得知有这么个开源组织,南瓜书也是他们一起编写,看过西瓜书《机器学习-周志华》