因此,我正在处理 GWAS SNP 数据,并希望对基因型和表型之间的关联进行几次测试。有两种表型(病例和对照)和两种或三种基因型。其中大多数是具有不同列联表的卡方检验,或者,其中之一是 Cochran-Armitage 趋势检验 (CATT)
一旦我构建了列联表,我可以很容易地得到一个-value 使用Apache commons 数学库进行卡方检验。没问题。
但是,维基百科上对CATT的解释不足以让我实现它(我的统计知识有限,我还在学习中)。
就像在示例中一样,我怀疑是线性趋势,所以我的权重是,这使得公式为至:
和一个方差
我检查了PLINK程序是如何做到的,因为它已经在那里实现了,但它与上述公式略有不同。那里的 C++ 源代码将对应于此:
和
然后它会像这样计算一个卡方值
并计算-值与任何其他卡方值一样
我不需要完全理解理论,只要我的程序计算正确,但理解它会给我额外的信心。
这是正确的还是合法的?这是我如何得到-价值?