Python使用RMF聚类分析客户价值 投资机构或电商企业等积累的客户交易数据繁杂。需要根据用户的以往消费记录分析出不同用户群体的特征与价值,再针对不同群体提供不同的营销策略。 用户分析指标 根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标 R-最近一次...
#导入数据库和科学计算包importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltfromscipyimportstats#先使用arange生成一个随机数组,然后定义随机变量:抛一次硬币,成功为正面朝上,记为1,失败为反面朝上,记为0.X=np.arange(0,2,1)Xarray([0,1])#第二步:求对应分布的概率,概率质量函数(RMF),它返回一个列...
主观认为:学习进度和学习总时长会有相关性。 验证:这相关系数有点尴尬,不高不低,再三考虑以学习时间、付费金额、选购课程数作为RMF三要素。 各自的加权组合:0.4,0.5,0.1(学习时间、付费金额、选购课程数) ret5 = pd.merge(pd.DataFrame(user3.groupby('user_id')['learn_time'].sum()), pd.DataFrame(info...
Python使用RMF聚类分析客户价值 投资机构或电商企业等积累的客户交易数据繁杂。需要根据用户的以往消费记录分析出不同用户群体的特征与价值,再针对不同群体提供不同的营销策略。 用户分析指标 根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标 代码语言:jav...
data['rmf']=data['rm']-data['rf'] 1.分组计算:(Rit−Rft)(Rit−Rft)和(Rmt−Rft)(Rmt−Rft) 按照code和date形成双层分组,date即月数,code即股票代码。即按照同一期的size对code进行分组。分组标准是市值size和账面市值比BM。...
#第二步:求对应分布的概率,概率质量函数(RMF),它返回一个列表,列表中每个元素表示随机变量对应的概率值。 p=0.5 #正面朝上的概率为0.5 pList=stats.bernoulli.pmf(X,p) pList array([ 0.5, 0.5]) #第三步:绘图 AI检测代码解析 plt.plot(X,pList,marker='o',linestyle='None') ...
无论在什么环境中,总会有二八法则的存在。例如,20%的客户为公司提供了80%的利润。前面RMF模型分类出了8种不同性质的客户,下面根据客户对平台的贡献度做了排序。 一般挽留客户→一般发展客户→一般保持客户→一般价值客户→重要挽留客户→重要发展客户→重要保持客户→重要价值客户 ...
# RMF实战import pandas as pdimport seaborn as snssns.set_style('darkgrid')# 中文显示问题解决plt.rcParams['font.sans-serif'] = ["SimHei"]plt.rcParams["axes.unicode_minus"] = False## 数据读取data = pd.read_excel('rfm.xlsx')X = data.drop(columns = 'user_id')## KMeans模型构建k_...
# RMF实战 import pandas as pd import seaborn as sns sns.set_style('darkgrid') # 中文显示问题解决 plt.rcParams['font.sans-serif'] = ["SimHei"] plt.rcParams["axes.unicode_minus"] = False ## 数据读取 data = pd.read_excel('rfm.xlsx') ...
rmf['label']=clf.labels_ #查看标记后的数据 print(rmf.head()) #4.得出RFM模型8个类别中的用户数量 c=rmf['label'].value_counts() print(c) r1=pd.Series(clf.labels_).value_counts()#统计各个类别的数目 r2=pd.DataFrame(clf.cluster_centers_)#找出聚类中心 ...