随着企业数字化转型的深入发展,对用户深层理解的渴望日益迫切。在此背景下,本次分享精心剖析了用户画像标签的精髓及其在多变业务场景中的关键作用。
从基础属性标签到策略上的标签,不仅系统性地介绍了各类型标签的构建与应用,还着重强调了在快节奏的数字化时代中,如何通过高效的异常值处理、时间衰减考量及数据区分度提升等手段,确保标签的准确性和实用性。
并且深入讨论了如何长期评估和追踪用户画像的内聚性和稳定性,为数据产品经理提供了一把锐利的工具,助力其在激烈的市场竞争中准确把握用户需求,不断提升产品和策略的效能。
基础属性类画像标签是用户自身属性的标签,通常不与用户在APP上的行为挂钩,例如性别、年龄、操作系统、所在城市等。基础属性画像标签的应用场景主要包括:与业务目标(或者说KPI)强关联的标签,通常基于这样的标签找到业务的目标人群。
可以根据与KPI的关联分为两大类:针对特定策略建设人群标签,通常能够在AB实验中拿到较好的收益。例如:与权益干预相关的标签,可以帮助我们识别那些在接受红包或全域干预后会显示出显著提升的用户群体。通过AUUC图的分析,可以预测特定用户群体干预前后的增量以及预期的投资回报率(ROI)。这种预测性的分析可以为策略决策提供坚实的数据支持。
针对电商场景的复购属性用户,会通过分析用户购买某一类目的时间间隔分布,进行统计拟合,预计不同用户的购买间隔。当用户预计的购买间隔接近时,通过适当的引导和干预,可以有效提高用户的复购率。这种策略不仅增加了用户对平台的粘性,还有助于抢占市场份额。
预测类的标签基于用户的历史行为和其他战略特征,预测用户未来的行为模式,如流失或沉默的概率。利用这些信息,可以绘制热力图来表示不同预测分数区间内的用户流失概率和数量。这种方法使我们能够精确地识别出潜在的风险用户群,并对他们实施针对性的运营策略,从而最大化ROI和AB实验的增量效益。
策略向人群的建设方式包括:uplift模型、复购周期预测、二分类模型等。使用方式为:在特定策略(红包/push干预)下,进行干预的目标人群,实现ROI的最大化。
二、画像特征的处理与标签的评估这里主要介绍一些日常特征处理中容易被忽视的步骤。用户标签的生成同时参照RFM模型中提供的三个维度进行特征构建:处理的目标是让距今更近的行为对分数产生更大的影响。
Frequency类的指标中有一些代表过去一段时间的累计行为,如过去90天的总登录次数,定义按照假如两个用户在这个指标上的数值相同那代表他们的活跃频次是相同的。但需要考虑一个场景,如果用户A只在最近10天登录了10次,用户B只在80天前登录了10次,他们的F指标都是10,可是用户A的活跃度直观来看应该更高。
如果希望数值上体现这个差异的话,可以对每一天的数据乘以一个权重再进行求和,这个权重是一个随着距今时间增加而衰减的函数。为了在数值上体现这个差异,可以对每一天的数据乘以一个权重再进行求和,这个权重是一个随着距今时间增加而衰减的函数。
公式如下:
在互联网平台中,用户行为数据通常展现出显著的头部/长尾效应。即绝大多数用户表现出相似的指标特征,而在数据的尾部则存在着很多行为多样的用户群体(数量小但分布广)。
此现象导致数据在区分不同用户行为时的能力受限,特别是对于那些行为模式较为独特的用户群体。因此需要进行平滑处理,其目标是提升数据区分度,以增强模型对用户行为的识别能力。
具体的解决方案为,采用对数函数(log函数)对原始数据进行平滑处理。对数转换能够减少极端值的影响,使数据分布更加平缓,从而提高数据的区分度。通过对数平滑处理后,数据分布将更加均匀,能够更有效地识别和区分不同用户的行为模式。特别是对于长尾中的小众用户行为,能够更准确地进行识别和分析。
在实施平滑处理时,需注意选择合适的log函数以及处理方法,以确保数据转换后能