具有多个 SNP 的 R 元分析

机器算法验证 r 荟萃分析 遗传学
2022-03-30 12:39:54

我正在对两个全基因组关联研究 (GWAS) 进行荟萃分析,每个研究由 150 个 SNP 组成,为此我计算了关联的汇总统计数据。我正在使用 R 包meta和 function metagen在我看来,这个功能能够结合研究,但单一测量效果(我有 150 个),每个研究一个。

例如,我在每项研究中可能有 3 个 SNP

STUDY    SNP    OR    SE
GWAS_A  rs694739    0.6691  0.07588
GWAS_A  rs9858968   0.1091  0.01588
GWAS_A  rs1529267   0.9291  0.02588
GWAS_B  rs694739    0.6128  0.37344
GWAS_B  rs9858968   0.0332  0.27344
GWAS_B  rs1529267   0.3481  0.81284

所以我想要一个表格格式的输出(例如,在PLINK中),有 3 行和相应的池统计信息。我知道我可以通过循环或与摘要输出上for的函数分组来管理它,但我想知道是否还有另一个 R 包/函数可以轻松完成此任务。bymetagen

2个回答

更快的选择是使用 PLINK 的内置元分析选项:

它非常简单,不需要额外的编码。然后,您可以使用 R 中的元包来制作具有重要结果的森林图。我对 meta 包的经验是,在进行多个元分析时,它不是很实用。

GenABEL的MetABEL 部分就是这样做的。对于 150 个 SNP,您可能会发现自己编写循环比确保它完全按照您的要求进行编码要快。(都不应该花很长时间)