我真的不知道任何机器学习,但有一个问题似乎是我应该使用一些 ML 算法的问题。
我正在分析一项与年龄相关的疾病、年龄、治疗、性别和两种特定肠道细菌丰度的医学研究。该领域的许多研究人员也喜欢观察这两种细菌的比例。
通过使用一个、两个或三个解释变量进行一些回归,我发现了一些具有非常好的 p 值的意想不到的组合。例如,控制年龄,无论治疗如何,细菌-A 似乎都与病情密切相关。无论年龄大小,其他细菌似乎都与治疗密切相关。我无法预料会是这样。
我觉得寻找更多意想不到的关联可能是有价值的。我可以列出所有一个、两个和三个组合解释变量,并对这些组合执行我的六个变量的回归,并且基本上按 p 值排序。但是,1)这种 p 值挖掘通常是不受欢迎的,2)有无数种可能的回归。
似乎可能存在某种 ML 算法,可以以客观和系统的方式寻找意外的关联。
那会是什么?