3、 数据清洗 选择子集 首先为数据集创建副本,命名“**_数据清洗”,保护原始数据,开始数据清洗。根据上述业务问题,暂无需使用“property”一列,可隐藏。 列名重命名 详见第2关作业,表1购买信息重命名:表2婴儿信息重命名:删除重复值 表1存在重复值,但同一用户可以有多次购买,同一商品也可以被多次购买,因此无需...
2️⃣第二步:确定数据分析工具以及分析框架 🔸数据分析工具:FineBI 🔸分析框架:流失率 = 流失人数/总人数,在总人数不变的情况下,降低流失率需要降低流失人数。 3️⃣第三步:清洗源数据里的脏数据 🔸列重命名、删除空值、删除异常值、删除重复值。
【岗位亮点】负责数据的整理及数据质量把控;分析/梳理数据规则以及交易规则;丰富各类数据校对/分析的工具/规则,建立数据整理/分析体系;主要做数据清洗+整理; 【工作年限】3-5年工作经验即可,最好有些金融量化经验(兼职或者业务搞一些量化项目也可以算) 【目标群体】 ...