A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始





本章主要讲Google Analytics的使用,例如为网站定制追踪访问者行为、按需求创建个性化报告、控制报告数据、快速数据导出和数据分析的高级应用等。但我目前对工具的使用不太敢兴趣,记录一下其他的点吧


数据分析高级应用
  • 数据统计:描述数据形态和特征
  • 数据分析:从数据中发现问题、寻找规律,数据特征描述和数据分布,假设检验、方差分析、相关分析、回归分析等
  • 数据挖掘:预测层面,关联规则、监督学习、无监督学习等
网站内容关联推荐
  • 营销上分为两类

    • 向上营销(UpMarketing):根据客户过去消费喜好,提供更高价值或其他用以加强其原有功能及用途的产品或服务(nano与itouch)。同类产品线升级或优化的产品。
    • 交叉营销(CrossMarketing):从客户购买行为中发现客户多种需求,向其推销相关的产品或服务(ipod和iPhone、ipad)。相似但不同类产品。
关联规则
  • 关联规则(Association Rules)算法:基于用户历史行为,从用户会同时购买的商品中寻找规律,更有利于发现用户的潜在需求,帮助用户更好地选择他们需要的产品

    • 举例:购买所有商品任意一种的用户全集U,购买A的集合A和购买AB两种商品的集合G。支持度和置信度是衡量AB关联性的两个指标
    • 支持度(Support)= 集合G人数/集合U人数
    • 置信度(Confidence)= 集合G人数/集合A人数
    • 设置最小支持度和最小置信度
    • 提升度(Lift)=购买A之后购买B的人数比例/所有用户中购买B的人数比例:提升度>1才认为A会带动B的销售,否则B本身就是购买率很高的商品
  • 关联规则需要处理大量的用户行为数据,而且用户行为的不断变化需要我们不断更新关联规则,有巨大维护成本
  • 优劣势

    • 优势:1)一用户行为数据为基础,考虑了用户实际需求,更贴合用户需要和习惯;2)随着用户行为变化更新结果,推荐具备时效性
    • 劣势:1)需要以用户行为数据为基础,无法对新发布内容做有效推荐,“冷启动”问题;2)需要更新,消耗较大计算成本和较长的时间
KNN相关内容推荐
  • 基于内容的固有属性
  • KNN(K-Nearest Neighbor Algorithm):K最近邻算法,通过计算个体间的距离或者相似度寻找每个个体最相近的K个个体,算法的时间复杂度与样本个数相关,需要完成一次两两比较过程。
  • 常被用于分类算法,是一种分类学习算法
  • 优劣势

    • 优势:1)基于内容固有属性,不存在“冷启动”问题;2)内容固有属性一般不会变动,只要增量计算新加入的内容与所有内容的关联性即可
    • 劣势:1)仅考虑了内容的固有关系,很难做到跨越很大类别的推荐;2)无法考虑到内容的重叠和替代关系,导致重复推荐,或者已过时内容的推荐



通过这本书知道了网站分析的一些指标,但这本书时间太长,适用性不知道强不强,差的还是具体的实战案例业务,所以下一本《数据挖掘与数据化运营实战》





0 个回复

您需要登录后才可以回帖 登录 | 加入黑马