rh = full_data_cln.loc[(full_data_cln["hotel"] == "Resort Hotel") & (full_data_cln["is_canceled"] == 0)] ch = full_data_cln.loc[(full_data_cln["hotel"] == "City Hotel") & (full_data_cln["is_canceled"] == 0)] 1.3数据分析及可视化 1.3.1顾客来自于哪里?(饼图、地图) ...
hotel_data = pd.read_csv(r'C:\Users\LEE\Desktop\数据分析\数据分析数据\酒店预订\hotel_bookings.csv') #查看数据的基本信息 hotel_data.info() 结果: <class 'pandas.core.frame.DataFrame'> RangeIndex: 119390 entries, 0 to 119389 Data columns (total 32 columns): # Column Non-Null Count Dtype...
city_data=data_resort.groupby('arrival_date_month')['adr'].mean().reset_index()#city_data按arrival_date_month分组,求出人均价格的均值 final_hotel=resort_hotel.merge(city_hotel,on='arrival_date_month')#合并两数据final_hotel.columns=['month','price_for_resort','price_for_city_hotel'] 这...
1、Hotelbookingdemand酒店预订需求 https://www.kaggle.com/jessemostipak/hotel-booking-demand 该数据集包含城市酒店和度假酒店的预订信息,包括预订时间、停留时间,成人/儿童/婴儿人数以及可用停车位数量等信息。 适用场景:社会科学、旅行、酒店、用户行为,不具有明显的行业标识,可进行常规用户行为分析。 数据量:32列...
_distance=arr[6]user_id=arr[7]srch_destination_id=arr[16]hotel_country=arr[21]hotel_market=arr[22]is_booking=float(arr[18])hotel_cluster=arr[23]relative_ref_month=((book_year-2012)*12+(book_month-12))append_weight=relative_ref_month*relative_ref_month*(3+17.60*is_booking)ifuser_...
第一个项目是“酒店预订需求分析”(https://www.kaggle.com/jessemostipak/hotel-booking-demand)。这个数据集包含了城市酒店和度假酒店的预订信息,适合进行用户行为分析。通过分析数据,我们可以探讨如何提前预订、入住时长等因素对入住率的影响,以及预测最佳预订时间。
test.csv中的is_booking列的数值总是1,数据页可以证实这一点。 找出我们需要预测什么 我们将根据给定的一个用户的搜索数据预测哪个hotel_cluster会被预定。根据描述总共大概有100个集群。 计分方法:评价页面说计分方法将会采用Mean Average Precision@5,那就是说我们需要在每行做出五个预测集群,然后根据正确的预测是...
Hotel Booking Demand:https://www.kaggle.com/jessemostipak/hotel-booking-demand New York Airbnb listings:https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data Other sources to look for datasets: UCI Machine Learning Repository
总结:可以看到一年中,无论哪种类型的酒店都是11-12月份人是最少的,7-8月份人是最多的。只有在7-8月份时度假酒店的人均消费才大于了城市酒店,其余时间城市酒店的人均消费都大于度假酒店。所以综合来看,1月与11月份的人数会比较少,并且价格也是比较低的。所以我认为11月-2月在一年中是比较适合预定酒店的。
Hotel booking demandwww.kaggle.com/jessemostipak/hotel-booking-demand 以下,开始本次的数据分析! 项目背景 本次分析的数据集中含有近12万条酒店客房预订信息,包括酒店类型、到店日期、预订方式、每晚平均单价、房型、人数等。通过对订单信息的分析,可以了解酒店客房在不同月份的需求情况,对客房需求进行分析。