#导入数据库和科学计算包importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltfromscipyimportstats#先使用arange生成一个随机数组,然后定义随机变量:抛一次硬币,成功为正面朝上,记为1,失败为反面朝上,记为0.X=np.arange(0,2,1)Xarray([0,1])#第二步:求对应分布的概率,概率质量函数(RMF),它返回一个列...
Python使用RMF聚类分析客户价值 投资机构或电商企业等积累的客户交易数据繁杂。需要根据用户的以往消费记录分析出不同用户群体的特征与价值,再针对不同群体提供不同的营销策略。 用户分析指标 根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标 R-最近一次...
array([0, 1]) #第二步:求对应分布的概率,概率质量函数(RMF),它返回一个列表,列表中每个元素表示随机变量对应的概率值。 p=0.5 #正面朝上的概率为0.5 pList=stats.bernoulli.pmf(X,p) pList array([ 0.5, 0.5]) #第三步:绘图 plt.plot(X,pList,marker='o',linestyle='None') plt.vlines(X,0,pL...
Python使用RMF聚类分析客户价值 投资机构或电商企业等积累的客户交易数据繁杂。需要根据用户的以往消费记录分析出不同用户群体的特征与价值,再针对不同群体提供不同的营销策略。 用户分析指标 根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标 代码语言:jav...
验证:这相关系数有点尴尬,不高不低,再三考虑以学习时间、付费金额、选购课程数作为RMF三要素。 各自的加权组合:0.4,0.5,0.1(学习时间、付费金额、选购课程数) ret5 = pd.merge(pd.DataFrame(user3.groupby('user_id')['learn_time'].sum()), pd.DataFrame(info.groupby('user_id')['learn_process', '...
data['rmf']=data['rm']-data['rf'] 1.分组计算:(Rit−Rft)(Rit−Rft)和(Rmt−Rft)(Rmt−Rft) 按照code和date形成双层分组,date即月数,code即股票代码。即按照同一期的size对code进行分组。分组标准是市值size和账面市值比BM。...
# RMF实战importpandasaspdimportseabornassnssns.set_style('darkgrid')# 中文显示问题解决plt.rcParams['font.sans-serif'] = ["SimHei"]plt.rcParams["axes.unicode_minus"] =False ## 数据读取data = pd.read_excel('rfm.xlsx')X = data.drop(columns ='user_id') ...
为了进行精细化运营,可以利用RMF模型对用户价值指数(衡量历史到当前用户贡献的收益)进行计算。 最近一次消费-R:客户最近一次交易时间的间隔。R值越大,表示客户交易发生的日期越久,反之则交易发生的日期越近。 消费频率-F:客户在最近一段时间内交易的次数。F值越大,表示客户交易越频繁,反之则表示客户交易不够活跃。
无论在什么环境中,总会有二八法则的存在。例如,20%的客户为公司提供了80%的利润。前面RMF模型分类出了8种不同性质的客户,下面根据客户对平台的贡献度做了排序。 一般挽留客户→一般发展客户→一般保持客户→一般价值客户→重要挽留客户→重要发展客户→重要保持客户→重要价值客户 ...
# RMF实战import pandas as pdimport seaborn as snssns.set_style('darkgrid')# 中文显示问题解决plt.rcParams['font.sans-serif'] = ["SimHei"]plt.rcParams["axes.unicode_minus"] = False## 数据读取data = pd.read_excel('rfm.xlsx')X = data.drop(columns = 'user_id')## KMeans模型构建k_...