1、客户K-Means聚类 采用K-Means 聚类算法对客户数据进行分群, 将其 聚成五类(需要结合业务的理解与分析来确定客户的类别数量) 。 importpandasaspdfromsklearn.clusterimportKMeans#导入K均值聚类算法inputfile='zscoreddata.xls'#待聚类的数据文件k=5#需要进行的聚类类别数#读取数据并进行聚类分析data=pd.read_...
采用K-Means聚类算法对客户数据进行客户分群。 #找到最好的聚类簇 importmatplotlib.pyplot as plt importseaborn as sns %matplotlibinline plt.rcParams['font.family']= 'SimHei' plt.rcParams['axes.unicode_minus']=False#用来正常显示负号 #从sklearn导入聚类算法函数 fromsklearn.cluster import KMeans fromsk...
它是依据,各个属性的平均值进行划分,但是,细分的客户群太多,精准营销的成本太高。 综上,这次案例,采用聚类的办法进行识别客户价值,以LRFMC模型为基础 本案例,总体流程如下图 2.2挖掘步骤 从航空公司,选择性抽取与新增数据抽取,形成历史数据和增量数据 对步骤一的两个数据,进行数据探索性分析和预处理,主要有缺失值与...
客户价值分析模型构建由两部分构成:一是根据5个指标的数据,进行航空公司客户聚类分群,二是结合业务对客户群进行特征分析。 3.1 客户聚类 采用K-Means聚类算法对客户数据进行客户分群,聚为5类。代码如下。 #K-Means聚类算法 from sklearn.cluster import KMeans inputfile = './zscoreddata.xls' k = 5 data1 ...
构建航空客户价值分析模型:客户K-Means聚类、客户价值分析、模型应用。 1、客户K-Means聚类 采用K-Means聚类算法对客户数据进行分群,将其聚成五类(需要结合业务的理解与分析来确定客户的类别数量)。 importpandasaspdfromsklearn.clusterimportKMeans#导入K均值聚类算法inputfile='zscoreddata.xls'#待聚类的数据文件k...
3.2 K-Means模型构建 将上述数据进行K-Means聚类。找到各个聚集点的质心cluster_center。 fromsklearn.clusterimportKMeans#构建模型kmeans_model=KMeans(n_clusters=5,n_jobs=4,random_state=123)fit_kmeans=kmeans_model.fit(stand_data)kmeans_cc=kmeans_model.cluster_centers_#聚类中心kmeans_labels=kmeans...
采用聚类的方法对客户进行细分,并分析每个客户群的特征,识别其客户价值 总体流程: 加载数据 # 导包 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn import preprocessing import warnings ...
1.利用K-Means算法进行聚类分析,得到细分的客户群 2.对细分的客户数进行特征分析,得到客户价值分析模型 #找到最好的聚类簇import matplotlib.pyplot as pltimport seaborn as sns%matplotlib inlineplt.rcParams['font.family'] = 'SimHei'plt.rcParams['axes.unicode_minus']=False #用来正常显示负号# 从sklearn...
离群点会严重影响KMeans聚类效果,删除离群点数据 data_rfm = data_rfm[data_rfm['M']<500000] 2.4标准化处理 由于数据纲量(度量单位)不统一,需将数据做标准化处理 data_rfm.columns = [['L入会时长','C平均折扣率','R近期乘坐航班间隔','F乘坐次数','M乘坐里程']] ...
4.小结 本文结合航空公司客户价值案例的分析,重点介绍了数据挖掘算法中K-Means聚类算法的应用。 针对,传统RFM模型的不足,结合案例进行改造,设定了五个指标的LRFMC模型。最后通过聚类的结果,选出客户价值排行,并且制定相应策略