接下来,我们选择合适的机器学习模型来训练我们的数据。对于泰坦尼克号数据集,逻辑回归、随机森林和决策树都是常见的选择。以逻辑回归为例,代码如下: fromsklearn.linear_modelimportLogisticRegressionfromsklearn.metricsimportaccuracy_score,confusion_matrix# 创建模型model=LogisticRegression()# 模型训练model.fit(X_train...
这样就需要机器学习来解决了。 三、问题分析 显然,在泰坦尼克号这次灾难中,一个人要么是遇难,要么是幸存,所以实际上是一个逻辑回归,但由于这是刚刚起步的一个实验,我们暂且不使用逻辑回归,依然采用线性回归来进行数据的处理和分析,后面我们会再次做这个实验,届时,我们将使用逻辑回归。然而本次就是用线性回归了啦。
5、分别对决策树算法,随机森林算法模型进行调参 1.调整决策树算法的max_depth 参数,画出对应学习曲线 考虑模型的复杂度和模型效果,从图中可以看到,当max_depth=3时,模型的准确率最高。 2.调整随机森林算法的n_ estimators 参数,画出对应学习曲线 在确定好的范围内,进一步细化学习曲线 通过学习曲线调参方法,随机森...
将result和passengerId一起拼接成一个Dataframe就直接输出看结果吧,比之前没有融合直接用随机森林结果稍好一些,但我们只是用了几个简单的机器学习算法搞来搞去也没有认真调参,实际上还是有很多优化空间的,读者可以自行优化。