用户画像 (User Profile) 是对一个用户的信息抽象, 是大数据的一个典型应用, 也是个性化、精准投放的基石.
什么是用户画像
10001, 男, 31岁, 已婚, 年薪50万以上, 吃货, 喜欢红酒, 喜欢香烟……
为什么需要用户画像
用户画像的核心工作是为用户打标签, 而打标签的重要目的之一是为了让人能够理解并方便计算机处理.
如何构建用户画像
目标
用户画像的目标是为每个用户打上标签, 以及该标签的权重.
- 标签: 表征了内容, 用户对该内容有兴趣、偏好、需求等等.
- 权重: 表征了指数, 用户的兴趣、偏好指数, 也可能是用户的需求度, 可以简单理解为可信度、概率等.
构建标签体系
标签是人为规定的高度精炼的特征标识, 它具有以下特征:
- 语义化. 人能很方便的理解每个标签的含义.
- 封闭性. 所有子分类将构成类目空间的全部集合.
- 树形分类. 全面考虑各个维度, 完美抽象用户信息.
下面构建一个用户画像的标签体系.
- 用户标签
- 静态信息
- 用户标识
- 姓名
- 照片
- 人口属性
- 性别: 男, 女
- 年龄: 0~100
- 地域: 上海、北京、广州……
- 居住地
- 工作地点
- 公司
- 职业: 程序员、公务员……
- 婚姻状况: 单身、恋爱中、已婚
- 小孩数量: 0, 1, 2, …
- 爱好
- 性格
- 商业属性
- 消费等级
- 消费周期
- 用户标识
- 动态信息
- 行为类型
- 浏览
- 搜索
- 评论
- 加入购物车
- 购买
- 点赞
- 收藏
- 行为类型
- 静态信息
数据建模
- 什么用户
- 注册 ID
- 第三方 ID
- 手机号
- 身份证
- 什么时间
- 时间戳 (精确到秒) => 衰减因子
- 时间长度 (标识用户在某一页面的停留时间) => 权重
- 什么地点 用户接触点 (Toch Point)
- 网址 => 权重
- 内容 => 标签
- 做了什么事 用户行为类型 => 权重
注意事项
- 在用户画像的过程中有一个很重要的概念叫做颗粒度
内容画像
内容和用户是互联网企业核心的两个东西, 而用户行为则将内容和用户连接了起来.