不但提高算法效率,而且强化了算法的功能,即遗传算子作用于字符串上,有利于提高效率,利用表达式树有利于扩大和提高其功能。 (2)在GEP算法中,利用多基因编码方法与遗传规划算法比较,更加方便、有效地描述较复杂且规模庞大的实际问题,也就是说,把非常庞大的树状结构,分解为层次的相应嵌套的子树结构,非常适于发展复杂计算机...
该部分默认读者已经掌握,若需要自行补充知识,见oi-wiki。后续笔者会补充这一块的笔记 传送门:点这里 引入 莫比乌斯反演: 大致过程:给定一个求和式子,对求和式子进行变量替换、反演(交换求和顺序)等运算,最终化简为一个能在题目给定时间范围内求解出来的式子。 核心技巧:[k=1]=\varepsilon(k)=\sum _{d\mid k...
演算法的優劣是以「時間複雜度」(time complex)以及「空間複雜度」(space complex)評判之。所謂的時間複雜度,是指演算法執行所需的時間;空間複雜度,是指演算執行所需使用到的記憶體大小。不過,魚與熊掌難以兼得,好的演算法必需佐以資料結構(data structure),方能擁有較佳的時間複雜度,但有些資料結構會佔用...
5. GBDT/xgboost/lightgbm 直接使用机器学习算法中的集成学习方法。 6. GBDT+LR/FM/FFM 利用GBDT自动进行特征筛选和组合,进而生成新的离散特征向量,再把该特征向量当作LR模型的输入。 7. MLR 在LR的基础上采用分而治之的思路,先对样本进行分片,再在样本分片中应用LR进行CTR预估。 以上1-7部分可以总结为传统的C...
关于聚类算法的介绍,欢迎浏览我的另一篇博客:机器学习中的聚类算法演变及学习笔记,这里不再赘述。 此类方法主要有三种假设,三种假设下有各自的方法。 1. 假设一:不属于任何聚类的点是异常点 主要方法:DBSCAN、SNN clustering、FindOut algorithm、WaveCluster Algorithm。 缺点:不能发现异常簇 2. 假设二:距离...
【绩加加】4小时搞定离散数学 等值演算法验证等值式 期末补考,重修 不挂科 期末速成课 绩加加期末不挂科 1.1万 3 一听就懂 期末不挂科 离散数学 二元关系,知一求二 绩加加期末不挂科 2.7万 18 一听就懂 期末不挂科 离散数学 求关系闭包 绩加加期末不挂科 4.5万 40 【绩加加】4小时搞定离散数学 【求...
【再说一句】本文主要介绍机器学习中聚类算法的演变路径,和往常一样,不会详细介绍各算法的具体实现,望理解! 一、相似性衡量方法1. 基于距离 闵可夫斯基距离(Minkowski Distance):计算距离的通用的公式 曼哈顿距离(即城市块距离Manhattan distance):h=1(例如用于L1正则化等) ...
基于聚类算法的推荐:k-means、层次聚类等 基于分类算法的推荐:最近邻、朴素贝叶斯、决策树等 基于回归算法的推荐:线性回归、逻辑回归等 基于集成学习的推荐:gbdt、xgboost、lightgbm等 (5)CTR预估模型演变之路(手动划重点) LR/GBDT/xgboost:机器学习算法的直接使用 ...
EM算法(Expectation maximization algorithm) 极大似然估计 极大似然估计定义 求解过程 EM算法 EM算法和极大似然估计的区别 鸡生蛋,蛋生鸡问题 EM算法思想 三硬币模型 jensen不等式 Q函数 EM算法的推导 K-means中EM思想 参考资料 纠结了好几天,总算搞清楚了EM算法的大概。因此写下这篇博客做个笔记,由于这方面懂得...
形式1:表示“至多 \(x\) 个 \(y\) 种的方案数量”与“恰好 \(x\) 个 \(y\) 种的方案数量”之间的关系。形式2:表示“至少 \(x\) 个 \(y\) 种的方案数量”与“恰好 \(x\) 个 \(y\) 种的方案数量”之间的关系。接下来,通过具体例题说明二项式反演的应用。例题 1:错排问题(...