为什么要在遗传关联研究中使用年龄和年龄平方作为协变量?如果年龄被确定为重要的协变量,我可以理解它的使用,但我对年龄平方的使用感到茫然。
为什么要在遗传关联研究中使用年龄平方作为协变量?
机器算法验证
多重回归
多项式
预测器
生物信息学
遗传学
2022-03-20 20:33:20
3个回答
泰勒级数逼近告诉我们,几乎任何平滑函数都可以用多项式逼近,因此包括以下项或者(其中 x 是您的示例的年龄)让我们估计已知或未知非线性函数的近似系数,或年龄在你的情况下。测试这些系数也是测试关系是否合理线性或非线性项是否会提供更好拟合的简单方法。
根据分析的最终目标,可以保留非线性项进行预测,或者可以使用预测图来建议实际的函数关系。还有其他工具,例如三次样条,可以用来代替多项式项来实现类似的目标,但添加平方项是一种快速简便的方法。
保持简单:添加变量的平方可以让您更准确地模拟年龄的影响,这可能与自变量具有非线性关系。例如,在 50 岁之前,年龄的影响可能是积极的,然后是消极的。
将年龄平方与年龄相加,可让您对不同年龄的效应进行建模,而不是假设所有年龄的效应都是线性的。
有关简单的分步指南以及如何解释年龄和年龄平方变量,请参阅我的博客文章。
http://www.excel-with-data.co.uk/blog-1/how-to-regression-analysis-in-excel/
为了满足模型假设,可能进行了转换。这也可能是因为存在某种二次关系。
其它你可能感兴趣的问题