文章标题:终于有人把用户画像的流程、方法讲明白了
简介: 用户标签是个性化推荐、计算广告、金融征信等众多大数据业务应用的基础,它是原始的用户行为数据和大数据应用之间的桥梁。本文将详细介绍用户标签的构建方法,也就是用户画像技术。
现代交互设计之父Alan Cooper很早就提出了Persona的概念:Persona是真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型,用于产品需求挖掘与交互设计。
在大数据时代,用户画像尤其重要。我们通过一些手段,给用户的习惯、行为、属性贴上一系列标签,抽象出一个用户的全貌,为广告推荐、内容分发、活动营销等诸多互联网业务提供了可能性。它是计算广告、个性化推荐、智能营销等大数据技术的基础,毫不夸张地说,用户画像是大数据业务和技术的基石。
Cooper最初建立Persona的目的是让团队成员将产品设计的焦点放在目标用户的动机和行为上,从而避免产品设计人员草率地代表用户。在大数据领域,用户画像的作用远不止于此。建立完善的用户画像体系,能够为产品的方向与决策提供数据支持和事实依据,并在产品的运营和优化中,根据用户画像设计出更适合用户的产品,提升用户体验。
用户画像的构建一般可以分为目标分析、标签体系构建、画像构建三步:
1. 目标分析
2. 标签体系构建
3. 画像构建
目前主流的标签体系都是层次化的,首先标签分为几个大类,每个大类再进行逐层细分。用于广告投放和精准营销的一般是底层标签,每个标签只能表示一种含义,且必须有一定的语义。
常见的标签大类包括:
人口标签
兴趣特征
社会特征
消费特征
我们把标签分为人口属性、兴趣属性和地理属性三类,它们在构建时所用技术也有差异。
人口属性包括年龄、性别、学历等,这些标签基本是稳定的,构建一次可以很长一段时间不用更新。对于无社交属性的产品,可以采用标签扩散模型,以有标签用户的行为数据预测无标签用户的人口属性。
兴趣画像是互联网领域中使用最广泛的,需要先对用户行为的内容进行建模。我们构建了层次化的兴趣标签体系,包括分类、主题和关键词三层,既有准确性又有较好的泛化性。此外,还需要考虑用户兴趣的衰减问题。
地理位置画像分为常驻地画像和GPS画像两部分。常驻地标签通过对用户IP地址解析得到,GPS标签需要实时更新,可以用于路况分析等。
人口属性画像的效果评估相对简单,而兴趣画像的标签较为模糊,常用的是设计A/B测试进行验证。
用户画像的评估指标主要包括准确率、覆盖率、时效性等。构建好用户画像后,可以在可视化平台上对标签进行查看和分析,并应用于智能营销、计算广告、个性化推荐等领域。