K-近邻分类算法(KNN) C语言实现 /* 输入:数据集 输出:键入预测数据,输出预测类别 在txt文件中修改N和D的值 */ #include<stdio.h> #include<math.h> #include<stdlib.h> #define K 3 //近邻数k,决定模型的拟合能力 typedef float type; //动态创建二维数组 type...
3.算法实现步骤 下将通过通过多C文件,以鸢尾花数据集为例,使用朴素贝叶斯算法,对该数据进行分类。 3.1 read_csv.c 该步骤代码与前面代码一致,不再重复给出。 3.2 k_fold.c 该步骤代码与前面代码一致,不再重复给出。 3.3 test_prediction.c #include<stdlib.h> #include<stdio.h> extern double predict(doub...
鸢尾花主要分为狗尾草鸢尾(0)、杂色鸢尾(1)、弗吉尼亚鸢尾(2)。 人们发现通过计算鸢尾花的花萼长、花萼宽、花瓣长、花瓣宽可以将鸢尾花分类。 所以只要给出足够多的鸢尾花花萼、花瓣数据,以及对应种类,使用合适的神经网络训练,就可以实现鸢尾花分类。 搭建神经网络 输入数据是花萼长、花萼宽、花瓣长、花瓣宽,是n行...
排序算法的稳定性:若待排序的序列中,存在多个具有相同关键字的记录,经过排序, 这些记录的相对次序保持不变,则称该算法是稳定的;若经排序后,记录的相对 次序发生了改变,则称该算法是不稳定的。 稳定性的好处:排序算法如果是稳定的,那么从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个...
C4.5分类树算法介绍 为什么C4.5会出现? 因为ID3算法节点的分支越多,信息增益也就越大,这会出现过拟合的现象,因此提出C4.5算法。 图1 C4.5的属性选择方法——获利比例 获利比例=信息增益/分支度IV 分支度IV与各分支下的类别数目之比成负相关: 假如14个样本一共分4支:...
数据结构是计算机存储,管理数据的方式。数据必须依据某种逻辑联系组织在一起存储在计算机内,数据结构研究的就是这种数据的存储结构和数据的逻辑结构。 1.2、数据的逻辑结构的4种分类 二、线性表 2.1、线性表概述 线性结构是简单而且常用的数据结构 ,而线性表则是一种典型的线性结构。
C4.5分类决策树算法 C4.5是机器学习算法中的分类决策树算法,对于一个具有多个属性的元组,用一个属性就将它们完全分开几乎不可能,否则的话,决策树的深度就只能是2了。从这里可以看出,一旦我们选择一个属性A,假设将元组分成了两个部分A1和A2,由于A1和A2还可以用其它属性接着再分,所以又引出一个新的问题:接下来...
基于titanic泰坦尼克数据集利用catboost算法实现二分类 设计思路 输出结果 Pclass Sex Age SibSp Parch Survived 0 3 male 22.0 1 0 0 1 1 female 38.0 1 0 1 2 3 female 26.0 0 0 1 3 1 female 35.0 1 0 1 4 3 male 35.0 0 0 0 Pclass int64 Sex object Age float64 SibSp int64 Parch int64...
算法的分类: 这块还在学习思考,期待未来我可以补上这一块,谈一谈我自己的看法和鄙见(希望不会咕咕咕太久) 十大基本算法介绍__陌默的博客-CSDN博客_算法 1、冒泡排序 2、选择排序 3、插入排序 4、希尔排序 5、归并排序 6、快速排序 7、堆排序 8、计数排序 ...