第五章 - 假设检验
假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
原假设与对立假设
在假设检验中,常把一个检验的假设叫做原假设,而其对立面就叫做对立假设。
原假设,也叫零假设,用H0表示。原假设一般是统计者想要拒绝的假设。原假设的设置一般为:等于=、大于等于>=、小于等于<=。
备择假设,用H1表示。备则假设是统计者想要接受的假设。备择假设的设置一般为:不等于、大于>、小于<。
检验统计量,接受域,拒绝域,临界域和临界值
检验统计量 :在检验一个假设时所用的统计量称为检验统计量。
拒绝域:拒绝域是由显著性水平围成的区域
两类错误:弃真错误、取伪错误
弃真错误也叫第I类错误或α错误:它是指 原假设实际上是真的,但通过样本估计总体后,拒绝了原假设。明显这是错误的,我们拒绝了真实的原假设,所以叫弃真错误,这个错误的概率我们记为α。这个值也是显著性水平,在假设检验之前我们会规定这个概率的大小。
取伪错误也叫第II类错误或β错误:它是指 原假设实际上假的,但通过样本估计总体后,接受了原假设。明显者是错误的,我们接受的原假设实际上是假的,所以叫取伪错误,这个错误的概率我们记为β。
显著性水平
显著性水平是指当原假设实际上正确时,检验统计量落在拒绝域的概率,简单理解就是犯弃真错误的概率。这个值是我们做假设检验之前统计者根据业务情况定好的。
检验方式
检验方式分为两种:双侧检验和单侧检验。单侧检验又分为两种:左侧检验和右侧检验。
双侧检验:备择假设没有特定的方向性,形式为“≠”这种检验假设称为双侧检验
单侧检验:备择假设带有特定的方向性 形式为">""<"的假设检验,称为单侧检验 "<"称为左侧检验 ">"称为右侧检验
假设检验步骤
Step1:陈述假设,确定虚无假设(H0)和备择假设(H1)
(1)零假设(无效假设):记为H0,即样本均数所代表的总体均数μ与已知的总体均数μ0相等。两者差异为抽样误差引起,无统计学意义。
(2)备择假设:记为H1,即样本均数所代表的总体均数μ与已知的总体均数μ0不相等,样本均数与μ0的差异是本质性差异,有统计学意义。
Step2:假设检验分为双侧检验和单侧检验:
若目的是推断两总体均数是否不等,应选用双侧检验。
H0:μ=μ0,H1:μ≠μ0
若从专业知识已知不会出现μ<μ0(或μ>μ0)的情况,则选用单侧检验。
H0:μ=μ0,H1:μ>μ0
Step3:为统计判定设定标准,即显著水平α。α为犯第一类错误(H0为真时却被拒绝,即实验没有效果却被判定为有效果)的概率,通常α设为0.05,0.01或0.001。
Step4:选择检验方法,收集数据并计算样本统计量.
根据研究目的、资料类型和分布、设计方案、统计方法的应用条件、样本含量大小等,选择合适的检验方法:U检验、T检验、卡方检验、F检验等
step5:作出判定,确定p值、做出推论
假设检验中的P值是指在由无效假设所规定的总体做随机抽样,获得大于及等于(或等于及小于)现有统计量的概率,即各样本统计量的差异来自抽样误差的概率,它是判断H0成立与否的依据。
推论:
若P>α,就没有理由怀疑H0的真实性,结论为不拒绝H0,不否定此样本是来自于该总体的结论,也即差别无显著意义。
若P≤α,则拒绝H0,接受H1,也就是这些统计量来自不同的总体,其差别不能仅由抽样误差来解释,结论为差别有显著性意义。
P 样本统计量的差异: 可能是抽样差异,本质差异。
P > α 抽样差异引起
P < α 本质差异引起
参考
假设检验——这一篇文章就够了
https://zhuanlan.zhihu.com/p/86178674https://zhuanlan.zhihu.com/p/86178674
推论统计之——假设检验https://zhuanlan.zhihu.com/p/93182578
https://zhuanlan.zhihu.com/p/27355290




