1、客户K-Means聚类 采用K-Means 聚类算法对客户数据进行分群, 将其 聚成五类(需要结合业务的理解与分析来确定客户的类别数量) 。 importpandasaspdfromsklearn.clusterimportKMeans#导入K均值聚类算法inputfile='zscoreddata.xls'#待聚类的数据文件k=5#需要进行的聚类类别数#读取数据并进行聚类分析data=pd.read_...
3.2 K-Means模型构建 将上述数据进行K-Means聚类。找到各个聚集点的质心cluster_center。 fromsklearn.clusterimportKMeans#构建模型kmeans_model=KMeans(n_clusters=5,n_jobs=4,random_state=123)fit_kmeans=kmeans_model.fit(stand_data)kmeans_cc=kmeans_model.cluster_centers_#聚类中心kmeans_labels=kmeans...
客户价值分析模型构建由两部分构成:一是根据5个指标的数据,进行航空公司客户聚类分群,二是结合业务对客户群进行特征分析。 3.1 客户聚类 采用K-Means聚类算法对客户数据进行客户分群,聚为5类。代码如下。 #K-Means聚类算法 from sklearn.cluster import KMeans inputfile = './zscoreddata.xls' k = 5 data1 ...
1、客户K-Means聚类 采用K-Means聚类算法对客户数据进行分群,将其聚成五类(需要结合业务的理解与分析来确定客户的类别数量)。 importpandasaspdfromsklearn.clusterimportKMeans#导入K均值聚类算法inputfile='zscoreddata.xls'#待聚类的数据文件k=5#需要进行的聚类类别数#读取数据并进行聚类分析data=pd.read_excel(...
综上,这次案例,采用聚类的办法进行识别客户价值,以LRFMC模型为基础 本案例,总体流程如下图 2.2挖掘步骤 从航空公司,选择性抽取与新增数据抽取,形成历史数据和增量数据 对步骤一的两个数据,进行数据探索性分析和预处理,主要有缺失值与异常值的分析处理,属性规约、清洗和变换 ...
采用聚类的方法对客户进行细分,并分析每个客户群的特征,识别其客户价值 总体流程: 加载数据 # 导包 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn import preprocessing import warnings ...
采用K-Means聚类算法对客户数据进行客户分群。 #找到最好的聚类簇 importmatplotlib.pyplot as plt importseaborn as sns %matplotlibinline plt.rcParams['font.family']= 'SimHei' plt.rcParams['axes.unicode_minus']=False#用来正常显示负号 #从sklearn导入聚类算法函数 ...
聚类个数 通过K_means聚类方法进行机器学习,绘图观察误差平方和SSE与中心点个数k的关系,比较每个k值的SSE,使用肘部法寻找误差平方和SSE突然变小时对应的k值,得到k=5,将客户群体聚类划分为5个客群。 建模 LRFMC模型是根据实际场景基于RFM模型优化调整后得到的,是衡量客户价值和客户创造利益能力的重要工具和手段。
通过K_means聚类方法进行机器学习,绘图观察误差平方和SSE与中心点个数k的关系,比较每个k值的SSE,使用肘部法寻找误差平方和SSE突然变小时对应的k值,得到k=5,将客户群体聚类划分为5个客群。 建模 LRFMC模型是根据实际场景基于RFM模型优化调整后得到的,是衡量客户价值和客户创造利益能力的重要工具和手段。
接下来,运用K-Means聚类算法对处理好的数据进行聚类分析,以此来划分不同的客户群体。首先,我们设置聚类类别数目等参数,调用K-Means算法进行模型训练,代码如下: k=5 # 调用k-means算法 # 输入聚类类别数目,n_jobs为并行数 #n_clusters就是K值,也是聚类值 ...