A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 不二晨 金牌黑马   /  2018-12-24 11:23  /  1031 人查看  /  1 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

本帖最后由 不二晨 于 2018-12-24 14:43 编辑

1、简单统计量分析
常用的是最大值和最小值,用来判断这个变量的取值是否超出合理的范围。
2、3σ原则
正态分布中:σ代表方差,μ为平均值,x=μ即为图像的对称轴
标准正态分布概率:
数值分布在(μ—σ,μ+σ)中的概率为0.6526
数值分布在(μ—2σ,μ+2σ)中的概率为0.9544
数值分布在(μ—3σ,μ+3σ)中的概率为0.9974
正态分布又叫高斯分布,
如果数据服从正态分布,在3σ原则下,异常值被定义为一组测定值中与平均值的偏差不超过3倍标准差的值。
在正态分布的假设下,距离平均值3σ之外的值出现的概率为p(|x-λ|>3σ)≤0.003 属于个别的小概率事件
如果数据不服从正态分布,也可以用远离平均值的多少倍来描述异常值.
3、箱型图分析
箱型图提供异常值标准:
小于下四分位数-1.5*四分位数间距  或者大于 上四分位数+1.5*四分位数间距
其中四分位数间距等于 上四分位数-下四分位数

---------------------
【转载】仅作分享,侵删

原文:https://blog.csdn.net/qq_24726509/article/details/85221642


1 个回复

正序浏览
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马