阿里云天池是阿里云面向开发者和教育行业的资源输出部门,天池大赛是国内最大规模的人工智能算法赛事,致力于汇聚全球AI精英为企业解决真实问题。自2014年至今已举办数十次行业顶级算法赛事,全球参赛开发者超过30万人。然而对于更广大的普通开发者和大学生群体来说,高规格的算法大赛仍然具有很高的门槛。本书就是针对受众最广...
非常适合新手,读过后可以对机器学习项目流程有一个基本的了解。对竞赛中涉及的方法进行了简要的梳理,但是并没有做深入探讨,一些方法如果之前没有了解过,可能读过后还是无法理解具体原理和操作。然而既然面对新手,书中提供的代码几乎没有注释讲解,可能还是需要自己去网络上查一些信息来帮助理解。对于有经验的人,没必要浪...
机器学习之阿里云天池大赛—新闻分类 简介:本文为作者参加阿里云天池大赛入门赛中新闻分类比赛的记录。 在学习了循环神经网络之后,进行一次实践,参与一下阿里云天池大赛中入门级比赛—新闻文本分类,使用长短期记忆网络(LSTM)来完成,长短期记忆网络是循环神经网络的变体,建议从最普通的循环神经网络开始。 一、赛题数据 数据...
作为大数据行业的从业人员和数据分析的爱好者,长期关注于kaggle和天池的比赛情况,也慢慢的见证了天池平台的成长。得到天池团队赠送的《阿里云天池大赛赛题解析(机器学习篇)》一书后,花了2个月的时间仔细读了一遍,可以用爱不释手来形容。因此,有了写一篇导读将这本书介绍给对于大数据算法有兴趣的朋友们。
《阿里云天池大赛赛题解析——机器学习篇》聚焦机器学习算法建模及相关技术,以工业蒸汽量预测、天猫用户重复购买预测、O2O优惠券预测和阿里云安全恶意程序检测等四个天池经典赛题作为实战案例,针对实际赛题按照赛题理解、数据探索、特征工程、模型训练、模型验证、特征优化、模型融合等步骤,将赛题的解决方案从0到1层层拆解...
阿里云作为国内最大的云服务提供商,每天都面临着网络上海量的恶意攻击。 本题目提供的一堆恶意文件数据,包括感染性病毒、木马程序、挖矿程序、DDoS木马、勒索病毒等等,总计6亿条数据,每个文件数据会有对API调用顺序及线程等相关信息,我们需要训练模型,将测试文件正确归类(预测出是哪种病毒),因此是典型的多分类问题。
显然,一本基于天池大数据竞赛实战经验和技术积累、从应用场景出发的算法图书是最好的输出形式,因此,天池平台联合电子工业出版社博文视点出版了《阿里云天池大赛赛题解析——机器学习篇》,并且正式预售啦! 天池平台 著 国内第一本针对竞赛实操的图书 揭开人工智能算法的神秘面纱 ...
强烈建议每一个深度学习初学者作为第一个项目入门,YOLO v9教你快速上手实操(附全流程代码实现)——人工智能/机器学习/深度学习 强化AI的Zero 343 3 强烈建议所有入门大模型的初学者,一定一定要好好看这份中文教程手册!吴恩达联合OpenAI重磅推出LLM Cookbook,我愿意称为今年最伟大的发现!!! 强化AI的Zero 237 2 ...
1.单变量分析 连续型变量:中心分布趋势,变量的分布 类别型变量:频次,频率 2.双变量分析 连续型-连续型:散点图,相关性 np.corrcoef 类别型-类别型:双向表,堆叠柱状图,卡方检验 sklearn SelectBest 类别型-连续型:小提琴图(结合箱线图和密度图) Seaborn violinplot...