本项目数据来自华盛顿一家共享单车公司,数据显示了2011年至2012年共享单车的使用情况,数据记录了包括时间,天气,节假日等信息。 1.2 提出问题 本次项目需求是:结合历史骑行数据和天气等数据,预测美国华盛顿的共享单车租赁需。 二、数据理解 2.1 导入数据 数据来自kaggle Bike Sharing Demandwww.kaggle.com/c/bike-s...
这次项目类似于泰坦尼克号生存预测,也属于入门级项目。 目的在于练习数据可视化,模型构建等。 1 项目来源 Bike Sharing Demand | Kagglewww.kaggle.com/c/bike-sharing-demand 2 数据可视化及分析 明确目的:将共享单车租赁情况与季节、天气、湿度、风速、时间等数据结合起来,以预测共享单车在华盛顿的租赁需求。 2.1...
自行车共享系统明确记录了旅行时间,出发地点,到达地点和时间。因此,其可用于研究城市中的移动性。 在本项目中,要求将历史使用模式与天气数据结合起来,以预测华盛顿特区的自行车租赁租赁需求。 1.2数据来源 数据来自kaggle:kaggle共享单车数据 数据提供了跨越两年的每小时租赁数据,包含天气信息和日期信息, 训练集由每月前19...
windspeed_rfr.fit(X_train,y_train) #预测风速值 X_test = windspeed0_data[windspeed_columns].as_matrix() windspeed_pred = windspeed_rfr.predict(X_test) #将预测值填充到风速为0的数据中,并将两个df合并 windspeed0_data['windspeed_rfr'] = windspeed_pred test_data = pd.concat([windspeed0_data...
网站链接:https://www.kaggle.com/c/bike-sharing-demand 1.1 项目背景 本项目需要结合历史天气下共享单车使用模式,预测华盛顿共享单车租用需求。 1.2 数据说明 项目提供历史两年每小时共享单车租用数据,其中,每月前19天作为训练数据,每月20号之后的数据为测试数据,需要参赛者预测每小时租车总数量。
数据来自于Kaggle一个比赛: https://www.kaggle.com/c/bike-sharing-demand/overviewwww.kaggle.com/c/bike-sharing-demand/overview 使用美国首都华盛顿的共享单车数据, 不过, 只是基于日期时间和天气, 结论对我们也是有很大借鉴意义的. 数据是共享单车的租赁数据(小时数据). ...
预测结果:0.42256-485名;一共有3242个排名。 1.导入相关模块 importpandasaspdimportnumpyasnpimportseabornassnsimportmatplotlib.pyplotaspltfromsklearn.model_selectionimporttrain_test_splitfromsklearn.model_selectionimportcross_val_score,KFoldfromsklearnimportlinear_modelfromsklearn.ensembleimportRandomForestRegresso...
这里以kaggle共享单车租车预测 Bike Sharing Demand | Kagglewww.kaggle.com/c/bike-sharing-demand/ 为例,结合上篇《如何快速选择最合适的回归模型》进行实践,该实践在基本不调参的基础上最终成绩大概在TOP 5%左右(166/3242),这里只展示部分重要代码。
通过美国华盛顿市2011-2012年每月1-19日共享单车历史使用记录数据,可视化分析共享单车使用影响因素,并预测2011-2012年每月最后10天每小时的共享单车使用情况。 2.获取数据 2.1数据采集 数据来自 Bike Sharing Demand | Kagglewww.kaggle.com/c/bike-sharing-demand ...