A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

【郑州校区】电商大数据应用之如何构建电商用户画像

5.1 构建电商用户画像技术和流程
构建一个用户画像,包括数据源端数据收集、数据预处理、行为建模、构建用户画像
有些标签是可以直接获取到的,有些标签需要通过数据挖掘分析到!
5.2 源数据分析
用户数据分为2类:动态信息数据、静态信息数据
静态信息数据来源:
Ø 用户填写的个人资料,或者由此通过一定的算法,计算出来的数据
Ø 如果有不确定的,可以建立模型来判断,比如用户的性别注册没有填写,可以建立模型,根据用户的行为来判断用户性别是什么,或者它的概率
动态信息数据来源:
Ø 用户行为产生的数据:注册、游览、点击、购买、签收、评价、收藏等等。
Ø 用户比较重要的行为数据:游览商品,收藏商品、加入购物车、关注商品
根据这些行为特性可以计算出:用户注册时间、首单时间、潮妈族、纠结商品、最大消费、订单数量、退货数量、败家指数、品牌偏好等等。
5.3 目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。
如,红酒 0.8、李宁 0.6。
标签:表现了内容,用户对该内容有兴趣、偏好、需求等等。
权重:表现了指数,用户的兴趣、偏好指数,也可能表现用户的需求度,可以简单的理解为可信度,概率。
5.4 用户画像建模5.4.1 用户基本属性表
根据用户所填写的属性标签和推算出来的标签。用于了解用户的人口属性的基本情况和按不同属性维度统计。
作用:按人口属性营销、比如营销80后,对金牛座的优惠,生日营销。
主要数据来源:用户表、用户调查表、孕妇模型表、马甲模型表。
用户表:记录用户最基本的属性特性。
用户调查表:补充用户的其他基本信息。
用户所填写的基本信息:用户ID、用户名、密码、性别、手机号、邮箱、年龄、户籍省份、身份证编号、注册时间、收货地址等
用户所填信息计算得到的指标:
生日、星座、城市等级、手机前几位、手机运营商、邮件运营商
用户调查表得到:学历、收入、职业、婚姻、是否有小孩、是否有车有房、使用手机品牌。
根据算法得到:
身高、体重、性别模型、孩子性别概率、潜在汽车用户概率、是否孕妇、孩子年龄概率、手机品牌、更换手机频率、是否有小孩,是否有车,使用手机档次,疑似马甲标准、疑似马甲账号数、用户忠诚度、用户购物类型。
模型算法---性别模型
Ø 用户自己也填写了性别,但仍然要用算法算一次性别
用户性别
1男 0女 -1未识别
1、商品性别得分
2、用户购买上述商品计算用户性别等得分
3、最优化算法训练阀值,根据阀值判断
孩子性别
0 仅有男孩
1仅有女孩
2男女都有
3无法识别
1、选择男孩女孩商品
2、确定用户购买商品的男女性别比例
3、训练阀值,判断孩子性别,同用户性别类似
Ø 性别验证方法
随机抽样几千条数据让客户打电话确认。
与用户自己填的性别做对比,确认百分比。
模型算法---用户汽车模型
用户是否有车
1有 0 没有
-1 未识别
根据用户购买车相关产品
判断用户是否有车
潜在汽车用户
1有
-1 未识别
用户游览或者搜索汽车
用户数据判断
模型算法---用户忠诚度模型
Ø 忠诚度越高的用户越多,对网站的发展越有利
用户忠诚度
1忠诚型用户
2偶尔型用户
3投资型用户
4游览型用户
-1未识别
总体规则是判断+聚类算法
1、游览用户型:只游览不购买的
2、购买天数大于一定天数的为忠诚用户
3、购买天数小于一定天数,大部分是有优惠才购买的
4、其他类型根据购买天数,购买最后一次距今时间,购买金额进行聚类
模型算法---用户身高尺码模型
男性用户身高尺码
xxx-xxx身高段,-1未识别
用户购买服装鞋帽等用户判断
男性身材
1偏瘦、2标准、3偏胖4肥胖、-1未识别
用户购买服装鞋帽等用户判断
女性用户身高尺码
xxx-xxx身高段,-1未识别
用户购买服装鞋帽等用户判断
女性身材
1偏瘦、2标准、3偏胖4肥胖、-1未识别
用户购买服装鞋帽等用户判断
模型算法---用户马甲标志模型
Ø 马甲是指一个用户注册多个账号
Ø 多次访问地址相同的用户账号是同一个人所有
Ø 同一台手机登陆多次的用户是同一个人所有
Ø 收货手机号相同的账号同一个人所有
模型算法---手机相关标签模型
Ø 对于手机营销参考意义比较大
Ø 使用手机品牌: 最常用手机直接得到
Ø 使用手机品牌档次:根据档次维表
Ø 使用多少种不同的手机:手机登陆情况
Ø 更换手机频率(月份):按时间段看手机登陆情况
5.4.2 客户消费订单表
根据客户消费的情况提取的客户标签,用于了解用户的消费总体情况,
最终的目的根据用户消费习惯与消费能力做营销。
主要数据来源:订单表、退货表、用户表、购物车表
订单表可以得到相关标签:
第一次消费时间、
最近一次消费时间、
首单距今时间、
尾单距今时间------分析用户什么时候来购买商品以及多久没有购买了。
最小消费金额、
最大消费金额、
累计消费次数(不含退拒)、
累计消费金额(不含退拒)、
累计使用代金券金额、
累计使用代金券次数。-----分析用户总体消费情况。
     客单价(含退拒)、
     近60天客单价(含退拒)-----分析用户消费水平。
     常用收货地址、
     常用支付方式----分析用户常用的消费属性,方便做定向营销。
退货表可以得到相关标签:
近30天购买次数(不含退拒)、
近30天购买金额(不含退拒)
近30天购买次数(含退拒)、
近30天购买金额(含退拒)----分析用户最近的消费能力。
退货商品数量、
退货商品金额、
拒收商品数量、
拒收商品金额、
最近一次退货时间-----分析用户拒收和退货习惯。
购物车表可以得到相关标签:
最近30天购物车次数、
最近30天购物车商品件数、
最近30天购物车提交商品件数、
最近30天购物车放弃件数、
最近30天购物车成功率------分析用户购物车使用习惯
订单表和用户表可以得到相关标签:
学校下单总数、
单位下单总数、
家里下单总数、
上午下单总数、
下午下单总数、
晚上下单总数----分析用户购物时间与地点习惯。
5.4.3 客户购买类目表
根据客户购买类目的情况提取客户标签,用于了解类目的购买人群情况和针对某一类目的营销等。
主要数据来源:订单表、购物车表、类目维表
类目维表可以得到相关标签:
一级分类ID、
一级分类名称、
二级分类ID、
二级分类名称、
三级分类ID、
三级分类名称-----分析用户都购买了哪些类目。
电商的三级类目:
京东商城:
淘宝:
订单表和类目维表可以得到相关标签:
近30天购买类目次数、
近30天购买类目金额、
近90天购买类目次数、
近90天购买类目金额、
近180天购买类目次数、
近180天购买类目金额、
累计购买类目次数、
累计购买类目金额----分析用户最近都购买了哪些类目。
最近一次购买类目时间、
最后一次购买类目距今天数----分析用户多久没有购买这个类目。
购物车表和类目维表可以得到相关标签:
近30天购物车类目次数、
近30天购物车类目金额、
近90天购物车类目次数、
近90天购物车类目金额----分析用户最近都挑中哪些类目。
5.4.4 用户访问信息表
根据客户访问的情况提取相关客户标签。
用于了解用户的访问总体情况,方便根据客户游览习惯做营销
主要数据来源:点击流日志行为表(PC/APP端)
点击流日志行为表可以得到相关标签:
最近一次APP/PC端访问日期、
最近一次APP/PC端访问使用操作系统、
最近一次APP/PC端访问使用游览器、
最近一次访问IP地址、
最近一次访问城市、
最近一次访问的省份-----分析用户最近一次访问情况。
第一次APP/PC端访问日期、
第一次APP/PC端访问使用操作系统、
第一次APP/PC端访问使用游览器、
第一次访问IP地址、
第一次访问城市、
第一次访问的省份-----分析用户第一次访问情况。
近7天APP/PC端访问次数、
近30天APP/PC访问次数、
近60天APP/PC端访问次数、
近90天APP/PC端访问次数、
近180天APP/PC端访问次数、
近365天APP/PC端访问次数----分析用户APP/PC端访问次数。
近30天PC/APP端访问天数、
近30天PC/APP端访问并购买次数、
近30天PC/APP端访问PV、
近30天PC/APP端访问平均PV、
近30天PC/APP端最常用的游览器、
近30天PC/APP端不同IP数、
近30天PC/APP端最常用IP-----分析用户访问详情。
近30天0-5点访问的次数、
近30天6-7点访问的次数、
近30天8-9点访问的次数、
近30天10-12点访问的次数、
近30天13-14点访问的次数、
近30天15-17点访问的次数、
近30天18-19点访问的次数、
近30天20-21点访问的次数、
近30天22-23点访问的次数----分析用户喜欢在哪个时间上网访问。
传智播客·黑马程序员郑州校区地址
河南省郑州市 高新区长椿路11号大学科技园(西区)东门8号楼三层
联系电话 0371-56061160/61/62
来校路线  地铁一号线梧桐街站A口出


0 个回复

您需要登录后才可以回帖 登录 | 加入黑马