如果您不依赖特定版本的scikit-learn,可以尝试使用其他数据集代替’load_boston’。scikit-learn提供了许多其他用于机器学习的数据集,您可以选择适合您任务的数据集进行使用。例如,您可以使用’load_iris’或’load_digits’等数据集。这些数据集的导入方式与’load_boston’类似,具体如下:from sklearn.datasets import ...
cvxpy importcvxpyascpimportnumpyasnpfromsklearn.datasetsimportload_bostonfromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportStandardScaler# 加载数据boston=load_boston()X=boston.datay=boston.target# 数据标准化scaler=StandardScaler()X_scaled=scaler.fit_transform(X)# 划分训练集和测...
应该是scikit-learn版本的问题,导致boston这个东西不能在这里使用,就出现这个错误; 问题解决 我们先将***换成这些(已经在报错里面明确给出来了): data_url="http://lib.stat.cmu.edu/datasets/boston"raw_df= pd.read_csv(data_url, sep="\s+", skiprows=22, header=None)data= np.hstack([raw_df.va...
loaded_data = datasets.load_boston() data_X = loaded_data.data data_y = loaded_data.target复制 定义模型。 可以直接用默认值去建立 model,默认值也不错,也可以自己改变参数使模型更好。 然后用 training data 去训练模型。 model = LinearRegression() model.fit(data_X, data_y)复制 ...
from sklearn.datasets import load_boston boston = load_boston() 糖尿病数据集 (Diabetes Dataset) 描述:糖尿病数据集包含442个样本和10个特征,特征包括年龄、性别、体质指数、血压、六种血清测量值。这些特征用于预测一年后的疾病进展。 用途:回归任务,适用于线性回归模型的测试和验证。
>>> data, target = load_boston(return_X_y=True) 1. 2. 真实数据集 这里的真实数据集也是经典的数据集之一,只不过数据量较大,所以没有内置在模块中,采用了从网络上下载的方式,对于回归算法而言,有以下加载函数 1. fetch_california_housing()
boston = load_boston() # 这里使用boston数据集 regressor = DecisionTreeRegressor(random_state=0) res = cross_val_score(regressor, boston.data, boston.target, cv=10) # 默认是R平方分数 print(res) print(res.mean()) # 一般用这些模型score的平均值来作为总的k折交叉验证评价 ...
此数据集原本应该在 sklearn 中是自带数据集之一,但在 scikit-learn 1.2 版本由于某些特殊原因被移除,所以无法使用load_boston()获取 解决办法:既然自带的数据集没有 Boston Housing,那就想办法在网上找到开放式公共数据集,下载后加载到程序中。这也是网上常见的解决方案,大多借助 pandas, scipy, numpy 等方法下载...
>>>data,target=load_boston(return_X_y=True) 2. 真实数据集 这里的真实数据集也是经典的数据集之一,只不过数据量较大,所以没有内置在模块中,采用了从网络上下载的方式,对于回归算法而言,有以下加载函数 1. fetch_california_housing() 对于分类算法而言,有以下加载函数 ...
获取小数据集:load_boston from sklearn import datasets boston = datasets.load_boston() type(boston) print(boston['DESCR']) import pandas as pd ## Loading the data as Dataframe in pandas df = pd.DataFrame(data=boston['data'], columns = boston['feature_names']) #Checking our top 5 rows...