埋点数据 “快”:推荐算法主要依赖数据驱动,埋点数据需要及时上报并反馈,推荐等智能应用系统才能根据用户当前行为给出精准的策略决策。 埋点数据 “统一”:智能场景往往要通过多个业务线交叉数据作为输入特征或算法画像,每个业务线如没有统一标准规范,数据处理计算逻辑复杂且迭代维护成本很高。 埋点数据 “链路长”:埋...
埋点数据 “快”:推荐算法主要依赖数据驱动,埋点数据需要及时上报并反馈,推荐等智能应用系统才能根据用户当前行为给出精准的策略决策。 埋点数据 “统一”:智能场景往往要通过多个业务线交叉数据作为输入特征或算法画像,每个业务线如没有统一标准规范,数据处理计算逻辑复杂且迭代维护成本很高。 埋点数据 “链路长”:埋...
流量平台是字节跳动内部统一的埋点平台,覆盖埋点数据定义、采集、生产、应用、治理等埋点全生命周期。当前,流量平台已经覆盖了 2000 多个应用,管理埋点(事件)数 20 万,每天产生的埋点数据量超过万亿,每年能给公司节省的成本超亿元。 图注:字节跳动流量平台的产品概念图 字 节跳动流量平台 主要分为几块: 埋点内容...
为了降低无用埋点的上报,团队鼓励业务通过 ByteIO 平台筛选无用埋点,并且发起治理;最终确认下线的埋点将不再允许上报。 通过无用埋点下线这一机制,在去年节省了近亿元成本。 / 按重要性区分埋点等级/ 无用埋点治理下线之后,留下的埋点业务仍需使用,但它们的重要性不同。比如核心指标要用到的埋点数据和 RD ...
而数据流降级主要考虑的是埋点数据流容量不足以承载全部流量的场景,比如春晚活动、电商大促这类有较大突发流量的场景。为了保障链路的稳定性和可用性,需要服务具备主动或者被动的降级能力。 埋点数据流遇到挑战 挑战主要是流量大和业务多导致的。流量大服务规模就大,不仅会导致成本治理的问题,还会带来单机故障多、性能...
素材实验组维度的数据指标,支持赛马实验、AB实验、量化择优实验和算法择优实验。其中AB实验、量化策略、算法模型等埋点数据都是基于数据深度治理之后,以几乎零成本即可将埋点上报,并自动解析到百舸基础埋点数据底表里。 3.3.3 疲劳降权 疲劳降权:和频控不同的是触达曝光和点击的配置条件之后,资源仍然会继续下发,优...
流量平台是字节跳动内部统一的埋点平台,覆盖埋点数据定义、采集、生产、应用、治理等埋点全生命周期。当前,流量平台已经覆盖了 2000 多个应用,管理埋点(事件)数 20 万,每天产生的埋点数据量超过万亿,每年能给公司节省的成本超亿元。 上图是字节跳动流量平台的产品概念图,可以看到流量平台主要分为几块: ...
这一环,有两个细节需要数据产品&分析师格外注意。1. 埋点易用性 此外,埋点设计除了考虑到自身使用的易用性,也要尽量考虑到业务方的易用性,所以分析师除了要熟练使用代码语言查询数据,也要尽可能让埋点在数据工具(前司为例,使用神策)上更好用。这也要求数据分析师对数据工具有比业务方更深的了解,不要...
埋点数据“链路长”:埋点数据从生产到使用,涉及运营、产品、研发、测试、数据分析师或算法工程师多个环节(如下图),问题沟通排查链路长。 埋点数据“历史长”:页面埋点随需求迭代更新较快,历史埋点设计文档缺少统一管理,不利于长期维护。 二、埋点治理实践 ...
随着线上流量红利高峰逐渐达到瓶颈,在精细化运营、数智化运营的大背景下,越来越多的公司开始认识到数据的重要性,并将其打造成为公司的核心资产,以数据为中心驱动业务发展。而埋点数据作为企业内部最重要的两大来源(埋点数据、业务数据)之一,其重要性不言而喻。