给定一个具有二进制 (0/1) 因变量和大量连续和分类自变量的数据集,是否有一个过程,理想情况下是一个 R 包,可以找到与高度相关的 IV 的组合/子集/段DV?
简单示例:DV:大学教育(0/1),IV:年龄(20 到 120)、收入(0 到 100 万)、种族(白人、黑人、西班牙裔等)、性别(0/1)、州、等等。
然后找到结合 IV 和 IV 子集的相关性(例如,30 到 50 岁之间的女性,收入超过 10 万与 DV 高度正相关),然后能够比较这些组合(例如,找出 30 到 40 岁之间的女性,与收入超过 10 万的相关性高于 40 至 50 岁的女性(收入超过 10 万)