现在我们重复第1部分的预处理步骤,并对新数据集运行线性回归程序。 # add ones columndata2.insert(0,'Ones',1)# set X (training data) and y (target variable)cols = data2.shape[1]X2 = data2.iloc[:,0:cols-1]y2 = data2.iloc[:,cols-1:cols]# convert to matrices and initialize thetaX...
path='ex1data1.txt'#机器学习的官方作业数据集data=pd.read_csv(path,header=None,names=['Population','Profit'])#pandas读取两列数据data.head()#看看数据集长什么样子 data.describe()# 顺便看看数据的一些基础属性 展示数据分布 data.plot(kind='scatter',x='Population',y='Profit',figsize=(12,8))#...