1. 回归算法 回归算法用于建立两个或多个变量之间的关系模型,通过对数据进行拟合,预测一个或多个连续变量的值。回归算法的目标是找到一条最佳拟合曲线(直线、二次曲线等),使得该曲线在训练数据上的误差最小化。常见的回归算法包括线性回归、岭回归和Lasso回归等。线性回归:寻找一条最佳的直线来拟合数据,使得该...
本文将介绍机器学习中的三种常见算法:分类、回归和聚类。 一、分类算法 分类是机器学习中最基本的任务之一,其目的是根据给定的数据集将实例划分到不同的类别中。常见的分类算法有决策树、朴素贝叶斯分类器和支持向量机。 1.决策树:决策树是一种基于树形结构的分类方法。它通过对数据集进行递归划分,每次都选择最能...
比如常见的k-Means,分层聚类法,密度聚类等。 k近邻算法(KNN) 方法简介 k近邻算法(k-Nearest Neighbors)是一种基于实例的学习方法,通过计算新样本与训练集中样本之间的距离,选取k个距离最近的样本的标签进行分类或回归预测。分类问题中,采用投票法确定新样本的类别;回归问题中,采用平均值法确定新样本的输出值。 基本...
2.1 Logistic 回归(正则化) Logistic 回归是与线性回归相对应的一种分类方法,且该算法的基本概念由线性回归推导而出。Logistic 回归通过 Logistic 函数(即 Sigmoid 函数)将预测映射到 0 到 1 中间,因此预测值就可以看成某个类别的概率。 该模型仍然还是「线性」的,所以只有在数据是线性可分(即数据可被一个超平面...
在这个过程中,从获得到具体的样本向量,到得出聚类结果,人们是不用进行干预的,这就是“非监督”一词的由来。 二、回归 回归是一种解题方法,或者说“学习”方法,也是机器学习中一块比较重要的概念。 回归的英文是Regression,单词原型的regress大概的意思是“回退,退化,倒退。”其实Regression——回归分析的意思是借用...
分类(Classification)、回归(Regression)、聚类(Clustering) 降维(Dimensionality Reduction)、去噪(Denoising) 机器翻译(Machine Translation)、异常检测(Anomaly Detection)等 1.2 基本流程 1.3 概念 特征值 特征值(Eigenvalue):将数据的特征用数值表达的结果即为该数据的特征值。
优点:深度学习非常适用于分类音频、文本和图像数据。 缺点:和回归问题一样,深度神经网络需要大量的数据进行训练,所以其也不是一个通用目的的算法。 2.4 支持向量机 支持向量机(SVM)可以使用一个称之为核函数的技巧扩展到非线性分类问题,而该算法本质上就是计算两个称之为支持向量的观测数据之间的距离。SVM 算法寻找...
缺点:和回归问题一样,深度神经网络需要大量的数据进行训练,所以其也不是一个通用目的的算法。 Python 资源:https://keras.io/ R 资源:http://mxnet.io/ 2.4 支持向量机 支持向量机(SVM)可以使用一个称之为核函数的技巧扩展到非线性分类问题,而该算法本质上就是计算两个称之为支持向量的观测数据之间的距离。
分类的训练过程和回归的训练过程一样,都是极为套路化的程序。 第一,输入样本和分类标签。 第二,建立映射假说的某个y=f(x)的模型。 第三,求解出全局的损失函数Loss和待定系数w的映射关系,Loss=g(w)。 第四,通过迭代优化逐步降低Loss,最终找到一个w能满足召回率和精确率满足当前场景需要。注意这说的尤其指的...