本笔记为Coursera在线课程《Machine Learning》中的数据降维章节的笔记。 十四、降维(Dimensionality Reduction) 14.1动机一:数据压缩 本小节主要介绍第二种无监督学习方法:dimensionality reduction,从而实现数据的压缩,这样不仅可以减少数据所占磁盘空间,还可以提高程序的运行速度。如下图所示的例子,假设有一个具有很多维特...
应用大致就是我们使用PCA的两大动机,数据压缩以及可视化。 这里有一个为有监督学习(Supervised Learning)的例子: 我们的训练集为 (x(1),y(1)), (x(2),y(2))...(x(m),y(m)),其中y(i)为标签,x(i)∈R10,000。我们只对x(i)进行操作。经过PCA后,x(i)∈R10,000→z(i)∈R1,000。 我们新的训...
经典问题:clustering, dimensionality reduction and association rule learning.(聚类、降维、规则学习) 经典算法:the Apriori algorithm andk-Means.(这个专用名词就不翻译了) 3. Semi-Supervised Learning(半监督学习) 顾名思义,半监督学习意味着训练数据有一部分有标签,而一些没有,一般而言,当训练数据量过少时,监...
降维Dimensionality Reduction 数据降维主要是有两个动机: 数据压缩Data Compression 数据可视化Data Visualization 数据压缩Data Compression 上图解释: 在一个三维空间中的特征向量降至二维的特征向量。 将三维投影到一个二维的平面上,迫使所有的数据都在同一个平面上。
目前最流行的实现Dimensionality Reduction(降维)的算法是PCA.算法步骤如下: 1.Feature Scaling/mean normalization Preprocess 2.求协方差矩阵并通过svd函数求出U 协方差矩阵 此时U是一个n*n的矩阵 svd 3.求对应的新特征矩阵 size(X)=m*n,size( )=n*k ...
优化(Optimization) Q-学习(Q-learning) (2)按学习方式分类 有监督学习指利用一组带标签的数据(已知输出的数据)训练学习模型,然后用经训练的模型对未知数据进行预测。 无监督学习根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题。 强化学习(Reinforcement Learning,RL)又称为再励学习、评价学习,是一...