A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始




看了上一章之后,对本书的期待降低,看有没有能超出我认知的一些东西


数据分析前的准备工作1.数据来源类型
  • 日志采集

    • 点击流数据:解释what,用户在网站做了什么,如访问数,页面浏览数,停留时长
    • 业务运营数据:一般来自于crm和erp系统,这类数据解释了how much的问题,如销售额,订单量,购买用户数量
  • 专题获取

    • 实验测试数据:解决的是which的问题,a/b测试,哪个方案更优的问题,如用户体验数据,如鼠标的轨迹图,甚至用户眼动测试
    • 用户调研数据
  • 外部环境

    • 竞争对手数据
    • 行业发展数据
2.数据的清洗与整理
  • 完整性
  • 一致性
  • 准确性
  • 及时性

这个小节对于数据的what、how、much、which有点意思,没有对于why的数据,可能是说,数据科学,本来就是解析性的科学,

这里的话就说下5w2h的方法,什么原因(why)导致什么事情(what)需要哪些人(who)在什么时间内(when)什么地点(where)用什么方法(how)完成?预算是多少(how much)?

对应到网站分析里面,我们知道what(一个事实,销量下滑了),能看到客户消费或者完成特定动作的数据(who),在什么时间内(when),客户的ip反应了地点,或者在页面的停留时间(where),客户的支付方式,评论这些属于是(how)

另外对于数据清洗的过程解释的很一般。


趋势分析1.同比、环比、定基比
  • 同比:本周期的数据与上一周期中相同时间的数据比较

    • 2019年9月和2018年9月
  • 环比:本期数据和上一期数据的比较

    • 2019年9月和2019年8月
  • 定基比:与公司基准线比较

2.对趋势预测
  • 趋势线拟合
  • 移动均值

    • 简单移动平均(SMA)
    • 加权移动平均(WMA)
3.数据监控自动化
  • 移动均值数据监控
  • 同比环比监控

对比分析1.简单合并
  • 百分比评分均值比较:所有指标都除以整体的最大值
  • 标准化指标合并:先归一化数据到【-1,1】的区间

2.比较试验
  • 基于时间序列组内比较
  • 基于对照试验组间比较

3.严谨的比较结果
  • 卡方检验:验证两个总体间某个比率指标是否存在差异性差异
  • T检验:验证总体均值间(非比率指标)是否存在显著性差异

细分分析1.指标和维度
  • 访问者属性维度

    • 新访问用户
    • 回访用户
  • 时间维度
  • 流量来源维度

    • 搜索引擎
    • 推介网站
  • 地理维度

    • 国家
    • 地区
    • 语言
  • 内容维度

    • 有我们内容
    • 页面属性
  • 系统维度

    • 浏览器类型
    • 操作系统类型
    • 接入方式
    • 屏幕分辨率
2.细分的好处
  • 避免产生采样陷阱
  • 避免平均数陷阱
  • 增加细分目标
  • 深度洞察数据

3.什么是细分

细分就是指标和维度的组合


  • 深度细分案例:我想知道2019年9月18日广州地区使用chrome浏览器在Google搜索‘数据分析’关键词并点击了自然排名结果访问网站的次数

    • 时间维度:2019.9.18
    • 地理维度:广州地区
    • 浏览器维度:chrome
    • 流量来源维度:Google
    • 流量属性维度:自然排名结果
    • 关键词维度:数据分析
    • 指标:访问次数

4.细分的常用方法

标记用户群细分


    • 通过用户访问特定页面进行分类
    • 通过用户点击特定链接进行分类
    • 通过用户自主选择对其进行分类

5.数据的消费者
  • 决策层:关心公司整体的发展情况
  • 产品:关心用户的趋势
  • 运营: 关心网站的运营,同事最好有一些预测数据

卡方检验和T检验还是在哪都看得到。

这章从整体来看,还是告诉我可以分析些什么,但还是没有一个流程性的东西,一个需求来了(为什么有这样一个需求),我该怎么去做,难点在哪里,后面继续看看










0 个回复

您需要登录后才可以回帖 登录 | 加入黑马