暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

t-检验、方差分析、秩和检验评估去重与不去重差异

罗大黑学生信 2021-07-20
1249


t-检验

目的:评估“不去重”和“去重”两种方法分析得到的各NGS相关指标间差异?

指标:[Total] Fraction of Mapped Reads

数据:

样本

不去重

Mapped Reads(%)

去重

Mapped Reads(%)

样本1

97.64

98.5

样本2



样本3



...

...
...

T-检验应用

应用:总体均值与某个常数进行比较;两个总体均值之间的比较;

统计量的要求:统计量服从正态分布,适用于小样本数据(例如n<30)。


应用场景:

单样本均值检验,用于比较一组数据与一个特定数值之间的差异情况,即检验这组数据的均值与已知的总体均值是否相等

配对样本均值检验,用于检验有一定对应关系的两组样本的均值差是否等于某一个值,两组样本数量需要相等。

独立样本均值检验,独立样本与配对样本的不同之处在于独立样本T检验两组数据的样本数量可以不等。


R实现

### 执行步骤
1, 正态分布验证
result<-shapiro.test(data1)
if(result$p.value<0.05){
print("在置信度95%的情况下拒接原假设,数据不符合正态分布")
}
result<-shapiro.test(data2)
if(result$p.value<0.05){
print("在置信度95%的情况下拒接原假设,数据不符合正态分布")
}
2. 方差的齐次性
result <- bartlett.test(xa,xb,alternative = "two.sided")
if(result$p.value<0.05){
print("在置信度95%的情况下拒接原假设,数据不符合方差的齐次性")
}


t.test(data1,data2,alternative="two.sided",paired=T,var.equal=F,conf.level=0.95)




方差分析

目的:评估FFPE、穿刺、血浆和手术4种样本类型间NGS指标的差异关系(“去重”与”不去重“)

指标:[Total] Fraction of Mapped Reads

数据:"不去重" mapped reads

水平

观察值

Sample type

Mapped reads(%)

FFPE

96.34




...

穿刺





...

血浆





...

手术





...

F-检验应用

应用:两个以上总体均值之间的比较;

统计量的要求:统计量服从正态分布,方差齐性,每组之间的值是相互独立的。

应用场景:单因素方差分析、多因素方差分析、协方差分析、多元方差分析、重复测量方差分析、方差成分分析等。


统计意义

    如果单个因素的不同水平对于数据总体没有影响,那么组间方差与组内方差没有显著性差异;如果单个因素的不同水平对于数据总体有影响,组间方差和组内方差就会有显著性的差异。当p值大于假设检验的显著性水平时,说明组间方差和组内方差没有显著性差异,也就是说因素的不同水平对于数据总体没有影响;反之,当p值小于假设检验的显著性水平,说明因素的不同水平对于数据总体有影响。


R实现


aov(formula, data = NULL, projections =FALSE, qr = TRUE,contrasts = NULL, ...)
其中的参数formula表示方差分析的公式,在单因素方差分析中即为x~A ; data表示做方差分析的数据框:projections为逻辑值,表示是否返回预测结果:qr同样是逻辑值,表示是否返回QR分解结果,默认为TRUE; contrasts是公式中的一些因子的对比列表。通过函数summary()可列出方差分析表的详细结果。
### 执行步骤
1, 正态分布验证
result<-shapiro.test(data1)
if(result$p.value<0.05){
print("在置信度95%的情况下拒接原假设,数据不符合正态分布")
}
result<-shapiro.test(data2)
if(result$p.value<0.05){
print("在置信度95%的情况下拒接原假设,数据不符合正态分布")
}
result<-shapiro.test(data3)
if(result$p.value<0.05){
print("在置信度95%的情况下拒接原假设,数据不符合正态分布")
}


2. 方差的齐次性
result <- bartlett.test(xa,xb,alternative = "two.sided")
if(result$p.value<0.05){
print("在置信度95%的情况下拒接原假设,数据不符合方差的齐次性")
}


> account=data.frame(FFPE=data1, Biopsy=data2, Plasma=data3, Tumor_tissue=data4)


> a.aov=aov(x~A,data=account)
> summary(a.aov)



秩和检验分析

    秩和检验(rank sum test)又称顺序和检验,它是一种非参数检验(nonparametric test)。它不依赖于总体分布的具体形式,应用时可以不考虑被研究对象为何种分布以及分布是否已知,因而实用性较强。简单的说,该检验是与独立样本t检验相对应的方法,当正态分布、方差齐性等不能达到t检验的要求时,可以使用该检验。其假设基础是:若两个样本有差异,则他们的中心位置将不同。


统计量要求:

1.  总体分布类型未知或者非正态分布的数据

2. 有序或半定量资料;

3. 数据两端无确定的数值。


应用场景:

1. 配对设计资料的符号秩和检验;

2. 两独立样本比较的和秩检验;

3. 多个对立样本比较的秩和检验;

Usage:


wilcox.test(x, ...)


## Default S3 method:
wilcox.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, exact = NULL, correct = TRUE,
conf.int = FALSE, conf.level = 0.95, ...)






参考:

“去重”在肺癌NGS数据分析中的重要作用

https://wenku.baidu.com/view/a39c2201afaad1f34693daef5ef7ba0d4b736d6f.html

如何理解和使用方差分析?:https://zhuanlan.zhihu.com/p/49479042

机器学习算法与Python实战https://www.cnblogs.com/jpld/p/4594003.html

秩和分析 https://blog.csdn.net/lucky_kai/article/details/106119966

r语言中如何进行两组独立样本秩和检验 https://zhuanlan.zhihu.com/p/142372127


文章转载自罗大黑学生信,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论