暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

为啥方差的计算公式分母为n-1

百面机器学习 2020-05-06
1196
点击上方蓝色字关注我们!



问题引入

大家可能从小学就知道方差的计算公式了,方差的计算公式的分母为,为什么不是呢?

问题解答

其实这个问题知乎上有大佬回答和解释的比较详细(见参考链接),当然,为了更加形象的说明这个问题,这里主要从自由度的这个角度出发来说一下(参考知乎)。

首先我们解释下自由度的定义,自由度在英文中是这么解释的,In statistics, the number of degrees of freedom is the number of values in the final calculation of a statistic that are free to vary.通俗的来说就是,个样本,如果在某种条件下,样本均值是先定的固定的,那么只剩个样本的值是可以变化的,那么自由度就是

假设现在有3个样本,分别是。因为样本具有随机性,所以它们取值不定。但是假设出于某种原因,我们需要让样本均值固定,比如说是, 此时"有随机性"的样本只有2个。一旦均值固定了,只要知道其中的两个,剩下的一个肯定可以自动求出来。剩下的那个被求出来的就可以理解为被剥夺了一个自由度。所以就这个例子而言,3个样本最终"自由"的只有其中的 2 个。

实上,计算样本方差时,样本均值就需要给定。计算样本均值也就是维基百科里提到的 'intermediate step'。如果你去观察计算样本方差的一系列表达式,比如往往最常会被介绍的方差的无偏估计 (样本方差).其实发现样本均值这一项都包含在内。考虑到方差是衡量数据偏差程度的统计量,计算一下样本均值作为中间步骤的中间量,也不失其合理性。于是,为计算样本方差,样本里原有的n个自由度,有一个自由度被分配给计算样本均值,剩下自由度即为n-1。

参考

[1] https://www.zhihu.com/question/20983193

[2] https://www.zhihu.com/question/20099757/answer/26586088

[3] https://blog.csdn.net/weixin_41776824/article/details/80548039

喜欢就关注一下啦~~~



文章转载自百面机器学习,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论