CSV file I/O (e.g. pd.read_csv)importrandomasrd# generating random numbersimportdatetime# manipulating date formatsimportpandasaspdimportsqlalchemyfromsqlalchemyimportcreate_enginedefappend_csv():engine=create_engine('mysql+pymysql://root:Lzy814841@localhost:3306/kaggle')#数据...
test = pd.read_csv('../input/competitive-data-science-predict-future-sales/test.csv') sales = pd.read_csv('../input/competitive-data-science-predict-future-sales/sales_train.csv') shops = pd.read_csv('../input/competitive-data-science-predict-future-sales/shops.csv') items = pd.read_...
本文记录了Kaggle上Predict Future Sales问题的探索过程。 基础特征 数据主要有三个特征:shop_id, item_id, item_cnt_day。因为题目要求预测月份的销量情况,需要将训练数据中的按天销量改为按月销量,这里可以使用group_by或者pivot_table函数进行聚合。 train_data = pd.read_csv('./data/sales_train.csv') #删...
cols = ['date_block_num','shop_id','item_id']fori inrange(34): sales = train[train.date_block_num==i] matrix.append(np.array(list(product([i], sales.shop_id.unique(), sales.item_id.unique())), dtype='int16')) matrix = pd.DataFrame(np.vstack(matrix), columns=cols) matrix...
kaggle比赛链接:https://www.kaggle.com/c/competitive-data-science-predict-future-sales/data?select=item_categories.csv 该比赛将使用具有挑战性的时间序列数据集,由俄罗斯最大的软件公司之一 1C公司提供。数据中包括商店,商品,价格,日销量等连续34个月的数据,要求预测第35个月产品和商店的销量。评价指标为RMSE...
https://www.kaggle.com/c/competitive-data-science-predict-future-sales Kaggle上发布过各种类型的数据科学比赛中,以forecast类型的比赛占比最大、单场参赛人数最多,是kaggle的金牌大户,其内容包括像预测某公司/产品未来几月的收入/销量、预测商品的目标人群、根据大数据评估预测用户的还贷风险等。
1.注意预测的输入是(shop_id, item_id) , 我之前直接用item_id去预测, 走了弯路; 2.只预测一个月,实现相对简单; 参考的方法 xgboost 参考链接: https://www.kaggle.com/code/szhou42/predict-future-sales-top-11-solution 实测效果最佳; LSTM ...
predict-future-sales kaggle->predict-future-sales项目 关注 2 概览 仓库 1 Issues Pull Requests 动态 成员 2 申请加入组织 热门 main 主文件夹 Python 2 0 0 组织介绍 组织介绍 请描述组织的定位/愿景 请附上组织宣传图 他们正在使用 这些公司或软件正在使用我们的开源软件: 如何加入 请发送申请...
匿名 描述 数据列表 数据名称上传日期大小下载 文档 目录
Big data and the future of business Big data has the potential to transform almost every aspect of business – from research and development to sales and marketing and supply-chain management – and to provide new opportunities for growth. Nonetheless, the benefits will not be easily won. ...