README.md grocery-store-dataset.ipynb Breadcrumbs Grocery-Store-Dataset / grocery-store-dataset.ipynb Latest commit VishalDeoPrasad Kaggle Notebook | Grocery_Store_dataset | Version 9 3d34cd6· Mar 1, 2024 HistoryHistory File metadata and controls Preview Code Blame 1 ...
store_cluster = Lambda(lambda x: x[:, 4, None])(cat_features) store_type = Lambda(lambda x: x[:, 5, None])(cat_features) #为啥只embedding了其中4个 # store_in = Input(shape=(timesteps+16,), dtype='uint8') family_embed = Embedding(33, 8, input_length=1)(item_family) # cl...
从df_2017_store_classDataFrame 中选择了 'class' 和 'store_nbr' 列,形成了一个新的 DataFramedf_2017_store_class_index。这个 DataFrame 的索引是df_2017_store_class的索引,它包含了 'class' 和 'store_nbr' 两列数据。 df_2017_store_class = df_2017_store_class.groupby(['class', 'store_nbr'...
其中id代表唯一key值,实际无用;date代表日期,store_nbr代表商店id,item_nbr代表商品id,预测的粒度也就是某个商店中的某个商品在某一天的销量;onpromotion代表当天商店的该商品是否在促销;紫色的四个字段都是商店的特征,其中city代表市,state代表州,tpye代表商店层级,一共有A-E五个等级,cluster代表相似商店分组,一...
).set_index("store_nbr") 类别数据编码: le = LabelEncoder() items['family'] = le.fit_transform(items['family'].values) stores['city'] = le.fit_transform(stores['city'].values) stores['state'] = le.fit_transform(stores['state'].values) ...
kaggle链接:Corporación Favorita Grocery Sales Forecasting 第四名代码下载:https://github.com/sjvasquez/web-traffic-forecasting 1.整体结构 data —raw —processed data_frame.py prepare_data.py tf_utils.py tf_base_model.y cnn.py submit.py
create_dataset_part负责生产一个时间窗的数据 train_generator负责惰性生产多时间窗抽样数据,其中循环一次: 将会随机从样本中抽取batch_size个样本 pred_start 以first_pred_start为基准前移range(n_range)中某一随机数天 并yield一次create_dataset_part,直到n_range序列中经过一整轮随机遍历 ...
class交叉store销售和促销数据 prepare_dataset 多层索引的重索引 时间戳 1.背景 本文档用于记录学习销量预测第一名方案的代码,其中的特征工程堪称经典。1st Place LGB Model(public:0.506, private:0.511) 2.字段含义 整个数据集分为训练集、测试集、商品数据集、商店数据集、oil。
该比赛kaggle地址如下: https://www.kaggle.com/c/favorita-grocery-sales-forecasting/overview 整体来看该比赛就是预测商品的销量,官方提供了2013-2017年各商店商品的销量,参赛队伍需要根据已有数据预测未来一段时间商店商品的销量,下面是每年的训练样本量:
stores = pd.read_csv("stores.csv").set_index("store_nbr") return df_2017, promo_2017, items, stores 原数据为csv,通过load_data初步整理再save_unstack转为feather feather是一个用于存储数据框的快速的,轻量级的,易于使用的二进制文件格式