K均值(K-Means)算法,是一种无监督学习(Unsupervisedlearning)算法,其核心是聚类(Clustering),即把一组输入,通过K均值算法进行分类,输出分类结果。 由于K均值算法是无监督学习算法,故这里输入的样本和之前不同了,输入的样本只有样本本身,没有对应的样本分类结果,即这里的输入的仅仅是{x(1),x(2),…x(m)},每个x...
遗传算法是一种概率搜索算法,它使用达尔文的自然选择原则,并使用在自然发生的遗传操作(如交叉(重组)和突变)之后形成的操作,迭代地将一组数学对象(通常是固定长度的二进制字符串)(通常具有相关的适应度值)转换为一个新的后代对象群体。 1.1 遗传算法...
所以作为推荐算法"鼻祖",我们还是非常有必要先来了解一下这个算法的。 所谓协同过滤(Collaborative Filtering)算法,基本思想是通过用户的行为去挖掘某种相似性(用户之间的相似或者物品之间的相似), 通过相似性为用户做决策和推荐, 这其中,仅仅是用户的行为数据(评价,购买,加载等),而不依赖于任何附加信息(物品自身特征...
一、机器学习理论 1. 专著推荐 2. 网课资源推荐 二、算法理论 1. 专著推荐 2. 网课资源推荐 三、信息论与无线通信理论 1. 专著推荐 2. 网课资源推荐 作为一个从通信专业跨到CS读博的苦逼研究生,因为博士阶段的研究方向与无线联邦学习理论,以及信息论在机器学习理论中的应用(信息论意义与PAC-Bayesian泛化误差界...
但NSW没有采用德劳内三角剖分法来构成德劳内三角网图,原因之一是德劳内三角剖分构图算法时间复杂度太高,换句话说,构图太耗时。原因之二是德劳内三角形的查找效率并不一定最高,如果初始点和查找点距离很远的话我们需要进行多次跳转才能查到其临近点,需要“高速公路”机制(Expressway mechanism, 这里指部分远点之间拥有线段...
1.一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。
【算法理论】经典SGM:(3)代价聚合(CostAggregation) 由于代价计算步骤只考虑了局部的相关性,对噪声非常敏感,无法直接用来计算最优视差,所以SGM算法通过代价聚合步骤,使聚合后的代价值能够更准确的反应像素之间的相关性,如图1所示。聚合后的新的代价值保存在与匹配代价空间C同样大小的聚合代价空间S中,且元素位置一一...
输入: 算法具有0个或多个输入 输出: 算法至少有1个或多个输出 有穷性: 算法在有限的步骤之后会自动结束而不会无限循环,并且每一个步骤可以在可接受的时间内完成 确定性:算法中的每一步都有确定的含义,不会出现二义性 可行性:算法的每一步都是可行的,也就是说每一步都能够执行有限的次数完成 ...
分支切割(branch-and-cut)算法理论及其应用 分支切割算法是解决整数规划问题的有效方法,融合了分支定界与切割平面两种策略。整数规划问题要求变量取整数值,例如物流路径规划中的车辆调度或生产排程中的设备分配,这类问题往往存在大量可能解,直接计算容易陷入组合爆炸。分支切割通过动态剪枝和约束增强,大幅提升求解效率...
集成学习:算法理论 (超详细) 1 决策树 1.1 分类树 1.1.1 信息熵 信息熵是用来衡量信息不确定性的指标,不确定性是一个事件出现不同结果的可能性,计算方法如下所示: 其中: 为随机变量x取值为i的概率 条件熵 在给定随机变量Y的条件下,随机变量X的不确定性...