3 方差
3.1 英文名称
variance
3.2 所属学科
概率论和统计
3.3 实际用途
概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。标准差、方差越大,离散程度越大。反之,离散程度越小。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。
3.4 历史
“方差”(variance)这一词语率先由罗纳德·费雪(Ronald Fisher)在其论文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance》中提出。
3.5 定义
是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。
3.6 公式
设 X 是一个随机变量,若
存在,则称 为 X 的方差,记为 D(X),Var(X)或 DX,其中 E(X)指的是对 X 的预期值,而 X 是实际值。即
称为方差。这里E{}只能理解为一个记号,真正的公式在这里:
右边的求和公式可以转换成更容易计算的形式:
说明
可以提取出来
用newlisp计算,实现代码如下:
; variance of a data vector X
(define (var X)
(div (sum-d2 X) (sub (length X) 1)))
; sum of sqared differenses of X to mean of X
(define (sum-d2 X)
(sub (sum-sq X) (div (mul (sum X) (sum X)) (length X))))
调用代码如下:
> (module "stat.lsp")
(lambda (stat:lst) (append (join (map string stat:lst) "\r\n") "\r\n"))
> (setf a '(1 2 3 1 4 5 7))
(1 2 3 1 4 5 7)
> (stat:var a)
4.904761904761905
4 标准差
(均方差)
4.1 英文名称
Standard Deviation
4.2 实际用途
由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。
4.3 公式
4.4 计算
newlisp 调用如下:
> (stat:sdev a)
2.214669705568283
5 协方差
5.1 英文名称
covariance
5.2 简介
从直观上来看,协方差表示的是两个变量总体误差的期望。方差是两个变量为同一个变量时的特殊的协方差。两个不同参数之间的方差就是协方差,若两个随机变量X和Y相互独立,则E[(X-E(X))(Y-E(Y))]=0,因而若上述数学期望不为零,则X和Y必不是相互独立的,亦即它们之间存在着一定的关系。
5.3 公式
[]内部的乘法式子变换一下
将E[…]内部的都提取出来
E[..E(Y)] 这种计算方法是把E(Y)看成一个常数,可以提取到E外面,变成E[Y]E[…], 同理,E[E(X)E(Y))] => E(X)E(Y)
所有E()都统一写成E[]
5.4 计算性质
协方差的性质:
Cov(X,Y)=Cov(Y,X)
Cov(aX,bY)=abCov(X,Y), (a,b是常数)
Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
6 均值的标准误差
6.1 公式
---------------------
作者:csfreebird
来源:CSDN
原文:https://blog.csdn.net/csfreebird/article/details/53969530
版权声明:本文为博主原创文章,转载请附上博文链接!
|
|