二维空间不可分到三维空间可分对于非线性问题将其映射到一个高维空间转化为线性可分问题 通过高维空间求解线性超平面的方法来解决。线性超平面的求解思路如下 以二维平面空间为例 依据间隔最大化原则 通过定义最优划分超平面和支持向量 把线性可分的两类分类问题转化成一个凸约束条件下的凸规划问题。利用已有的最优化...
第二是如何解决维度问题,衡量数据相似性无可避免的面临高维问题,是在全部特征上衡量还是随机选择subspace做检测并合并多个subspace上的结果。subspace代表算法有isolation forest和feature bagging。第三是如何解决数据不平衡的问题(异常点的数量<<正常点)。这个特性其实很有用,因为我们可以尝试直接学习正常点的数据分布(因为...