一个训练后的模型通常都会使用测试数据集测试该模型的准确性。对于简单线性归回模型当然可以使用 $\sum_{i=1}^{m}(y_{test}^{(i)} - \hat{y}_{test}^{(i)})^2$ 来衡量,但是它的取值和测试样本个数 m 存在联系,改进方法很简单,只需除以 m 即可,即均方误差(Mean Squared Error): $$ MSE:\frac...
(1):csv文件,本次作业使用丰原站的观测记录,分成 train set 跟 test set,train set 是丰原站每个月的前 20 天所有资料。test set 则是从丰原站剩下的资料中取样出来。(取每个月前20天的数据做训练 集,12月X20天=240天,每月后10天数据test set 用于测试,对学生不可见); (2):test.csv : 从剩下的资...
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets boston = datasets.load_boston() x = boston.data[:,5] # 只使用房间数量这个特征 y = boston.target x = x[y < 50.0] y = y[y < 50.0] from playML.model_selection import train_test_split x_train, x_test,...
第一步当然就是上一篇文章讲解的数据预处理啦,代码如下: # 导入需要的库 import pandas as pd import numpy as np import matplotlib.pyplot as plt # 读取数据 dataset = pd.read_csv('studentscores.csv') X = dataset.iloc[ : , : 1 ].values Y = dataset.iloc[ : , 1 ].values # 分割数据 fr...
平台会对你编写的代码进行测试,对比你输出的数值与实际正确的数值,只有所有数据全部计算正确才能进入下一关。 测试输入: 无测试输入 预期输出: 生成图片与预期图片一致 开始你的任务吧,祝你成功! import matplotlib matplotlib.use("Agg") import numpy as np ...
第1关 画图接口 任务描述 本关任务:掌握matplotlib的基本使用技巧,并能简单使用matplotlib进行可视化。 编程要求 在右侧编辑器Begin-End补充代码,对传入的x,y两个数组做折线图,x对应x轴,y对应y轴。并保存到Task1/image1/T2.png,具体要求如下: 折线图的figsize为(10, 10); ...