其中x是自变量,也是我们通常所说建模用到的特征或者标签,y是因变量,在这里就是我们要预测的房价。 打印出每个特征并查看其含义 我们把数据转成DataFrame数据框的形式,方便后续处理,显示前10行数据。 接着我们把因变量房价数据也放到数据框中来,定义其字段名为target方便后续分析并显示前5行数据 接下来我们看下数据...
我的做法进行预测后提交到kaggle后的分数是0.191多,看了下高分的做法,发现不仅可以使用原材料中给出的特征,还可以根据实际经验将特征进行组合或事丢弃,这方面深挖了也会涉及很多东西,以后有时间接着更新
然后导入数据集,因为这个数据集是sklearn包中自带的,所以直接导入即可。 其中x是自变量,也是我们通常所说建模用到的特征或者标签,y是因变量,在这里就是我们要预测的房价。 打印出每个特征并查看其含义 我们把数据转成DataFrame数据框的形式,方便后续处理,显示前10行数据。 接着我们把因变量房价数据也放到数据框中来...
data=train[["SalePrice","OverallQual"]]# 房屋整体质量和房价的关系# 绘制子图:1号位f,ax=plt.subplots(1,figsize=(12,6))fig=sns.boxplot(x="OverallQual",y="SalePrice",data=data)# y轴的刻度范围fig.axis(ymin=0,ymax=800000)plt.show() image 2、YearBuilt VS SalePrice 住在建造年份和销售...