黑马程序员技术交流社区

标题: 【上海校区】首先介绍一下scipy——分布拟合的卡方检验法 [打印本页]

作者: 小影姐姐    时间: 2018-7-20 13:48
标题: 【上海校区】首先介绍一下scipy——分布拟合的卡方检验法
首先介绍一下scipy

scipy是Python中使用最为广泛的科学计算工具包,再加上numpy和matplotlib,基本上可以处理大部分的计算和作图任务。

scipy的子模块

模块名
功能

scipy.cluster向量量化
scipy.constants数学常量
scipy.fftpack快速傅里叶变换
scipy.integrate积分
scipy.interpolate插值
scipy.io数据输入输出
scipy.linalg线性代数
scipy.ndimageN维图像
scipy.odr正交距离回归
scipy.optimize优化算法
scipy.signal信号处理
scipy.sparse稀疏矩阵
scipy.spatial空间数据结构和算法
scipy.special特殊数学函数
scipy.stats统计函数

下面的例子主要运用stats,stats中缩写含义如下

缩写全拼中文名解释
CDFCumulative Distribution Function累计分布函数 连续型和离散型随机变量都有,一般用F(X)F(X)表示
PDFProbability Density Function概率密度分布函数连续型随机变量在各点的取值规律,用f(x)f(x)或fX(x)fX(x)表示
PMFProbability Mass Function概率质量分布函数离散随机变量在各特定取值上的概率
RVSRandom Variate Sample随机变量的样本从一个给定分布取样
PPFPercentile Point Function百分位数点函数CDF的反函数
IQRInter Quartile Range四分位数间距25%分位数与75%分位数之差
SDStandard Error标准差用于描述随机变量取值的集中程度
SEMStandard Error of the Mean

样本均值的估计标准误差,

简称平均值标准误差

CIConfidence Interval置信区间

stats中有很多函数就不一一介绍了。

回顾一下数理统计的知识

卡方分布(希腊字母符号太难打了,用汉字代替一下)与Γ分布和T分布是抽样分布的三大应用,通过样本来估计总体的分布。

若n个相互独立的随机变量ξ1,ξ2,⋯,ξn均服从标准正态分布,则这n个随机变量的平方和构成一新的随机变量X,其分布规律称为卡方分布。

卡方检验是统计学中常用来计数数据分析的方法,对于总体的分布不作任何假设,因此它属于非参数检验法中的一种。

公式(不好打,截个图)

检验步骤:

1.接受原假设

2.计算统计量

3.查卡方分布临界值表,确定接受域和拒绝域

例题:来自http://blog.sina.com.cn/s/blog_4d69c7430101ndub.html

Ho:色觉与性别相互不独立;H1:色觉与性别相互独立

结果拒绝原假设。则色觉与性别相互独立

g     --- 卡方值,也就是统计量p     --- P值(统计学名词),与置信度对比,也可进行假设检验,P值小于置信度,即可拒绝原假设dof   --- 自由度re    --- 判读变量,1表示拒绝原假设,0表示接受原假设expctd--- 原数据数组同维度的对应理论值

ps:使用from import导入的模板之后,不需要加上前缀名即可使用。编写代码时注意缩进。



作者: 不二晨    时间: 2018-7-20 17:45
优秀,奈斯
作者: wuqiong    时间: 2018-7-23 11:34

作者: 摩西摩西OvO    时间: 2018-7-23 13:44

作者: 不二晨    时间: 2018-7-23 13:52
奈斯,优秀
作者: 摩西摩西OvO    时间: 2018-7-26 09:40

作者: 吴琼老师    时间: 2018-7-26 16:05





欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2