datingClassTest() 算法预测错误率大约是:6.6%,算是很不错的了。 使用算法:构建完整可用系统 上面我们已经在数据上对分类器进行了测试,现在终于可以使用这个分类器为海伦来对人们 分类。我们会给海伦一小段程序,通过该程序海伦会在约会网站上找到某个人并输入他的信息。 程序会给出她对对方喜欢程度的预测值。 def...
(3)分析数据:使用Matplotlib画二维扩散图; (4)训练算法:此步骤不适用于k-近邻算法; (5)测试算法:使用Helen提供的部分数据作为测试样本,测试样本和非测试样本的区别在于:测试样本是已经完成分类的数据,如果预测分类与实际类别不同,则标记为一个错误; (6)使用算法:产生简单的命令行程序,然后Helen可以输入一些特征数据...
1 1、问题背景 海伦一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但她并不喜欢每一个人。经过一番总结,她发现曾交往过三种类型的人: 类型一、 不喜欢的人 类型二、魅力一般的人 类型三、极具魅力的人 尽管发现了上述规律,但海伦依然无法将约会网站推荐的匹配对象归入恰当...
1#-*- coding: UTF-8 -*-2importnumpy as np34"""5函数说明:打开并解析文件,对数据进行分类:1代表不喜欢,2代表魅力一般,3代表极具魅力67Parameters:8filename - 文件名9Returns:10returnMat - 特征矩阵11classLabelVector - 分类Label向量12"""131415deffile2matrix(filename):16#打开文件17fr =open(file...
4 定义K近邻算法 importnumpy as npimportoperator"""函数说明:kNN算法,分类器 Parameters: inX - 用于分类的数据(测试集) dataSet - 用于训练的数据(训练集) labes - 分类标签 k - kNN算法参数,选择距离最小的k个点 Returns: sortedClassCount[0][0] - 分类结果"""defclassify0(inX, dataSet, labels, k...
测试算法 执行KNN.datingClassTest(),(执行分类器测试程序): 表示分类器处理约会数据集的错误率是5.0% 约会网站预测函数 执行约会预测函数,并按提示输入相应数据: 系统最终给出这个人的类型: in small doses(一般魅力的人)。 分类:机器学习 好文要顶关注我收藏该文微信分享 ...
Demo:使用kNN算法改进约会网站的配对效果 (1)准备数据:从文本文件中解析数据 文本文件下载地址 https://pan.baidu.com/s/1o8BSXWu deffile2matrix(filename): fr=open(filename) arrayOLines=fr.readlines()#得到文件行数numberOfLines =len(arrayOLines)#创建以0填充的矩阵returnMat = zeros((numberOfLines, 3...
1.数据准备:从文本文件中解析数据 文本文件datingTestSet2.txt网盘地址为: https://pan.baidu.com/s/19HNwo1TSWjWhbRwsyL-itg 提取码为:mz11 约会数据由1000行,主要包含一下三种特征: 每年获得的飞行常客里程数 玩视频游戏所耗时间