暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

python基于正态分布划分数据等级

常微分 2021-07-02
1136

正态分布是概率论与数理统计中最重要的一个分布,高斯在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布。


 

 概率论与数理统计(第二版 茆诗松 程依明 濮晓龙 编著)110页 例 2.5.3.

如果数组x近似的服从正态分布X~N(μ,σ2),则通常认为这组数值为正常分布。我们将超过μ+σ的评为A等,分布在μ到μ+σ之间的评为B等,μ-σ到μ的评为C等,μ-σ到μ-2σ的评为D等,μ-2σ之下的评为F等。

由于:  若随机变量X~N(μ,σ2) 则 U=(X-μ)/σ~N(0,1)

由此计算(加上查表)

这种方法划分等级,A等16%,B等34%,C等34%,D等14%,F等2%.

用python计算无外乎计算方差和标准差这两项。

import numpy as np

s_arr=np.random.normal(65, 15, 50) #均值20,标准差10 样本50个

#求均值

s_arr_mean = np.mean(s_arr)

#求方差

s_arr_var = np.var(s_arr)

#求标准差

s_arr_std = np.std(s_arr,ddof=1)

print("平均值为:%f" % s_arr_mean)

print("方差为:%f" % s_arr_var)

print("标准差为:%f" % s_arr_std)


这种方法划分等级,A等16% >80分,B等34% 65-80,C等34% 50-65,D等14% 35-50 ,F等2% <35. 计算时可对极大极小值进行剔除处理,获得更稳定数列。

文章转载自常微分,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论