两个基因表达样本之间的重叠是否显着?

机器算法验证 统计学意义 微阵列
2022-03-26 02:20:23

我进行了一项实验来研究酵母(包含 5000 个基因)对热休克引起的压力的反应。我有一个 48 个基因在 37ºC 时过表达的列表和另一个 145 个基因在 42ºC 时过表达的列表。两者都有 38 个基因过表达。

碰巧我预计它们中只有一个基因过表达,我如何计算我获得的重叠是否显着?我怎样才能获得p价值?我对生物统计学或数学软件一无所知。非常感谢你!!!非常欢迎任何帮助:)

2个回答

桌子看起来像这样

                37 deg C
42 deg C     yes      no
yes          38       97
no           10      4855

是和否是指是否过度表达的情况我在SAS中运行了Fisher的精确测试输出粘贴在下面:

Laura Gene expression data 


The FREQ Procedure


Statistics for Table of Group by expressed

Fisher's Exact Test 
Cell (1,1) Frequency (F) 4855 
Left-sided Pr <= F 1.0000 
Right-sided Pr >= F 4.776E-53 

Table Probability (P) 8.132E-51 
Two-sided Pr <= P 4.776E-53 
Sample Size = 5000

您在此处看到,Fisher 精确检验的 p 值非常小,远小于 0.0001。

这准确地显示了您所说的观察到的 38 在两种温度下过度表达的情况远远大于您在独立时所期望的值,正如您所说的那样,它将是 1.296。

迈克尔提到的确切测试可能是我推荐用来解决问题的方法(最少的假设)。作为参考,相应的常见统计检验将是χ2独立性的考验