我有一个伯努利响应变量,我将拟合逻辑回归。我的自变量之一是连续随机变量,我想在拟合逻辑回归之前对其进行分类。虽然这会丢失一些信息,但它使我的预测更容易,同时我可以很容易地看到这个连续随机变量的影响。我试图对其进行分类,以便每个类别在估计概率上的表现方面都是不同的。理想情况下,我希望看到这个分类变量的逻辑回归系数具有统计显着性。根据经验,我知道分类的数量也应该少于 8 个。大多数时候它是大约 4 或 5 个类别。但类别的确切数量实际上是未知的。在这里找到好的断点是具有挑战性的。我之前尝试过递归分区和回归树。但要使用这种方法,我首先需要自己对自变量进行分类,然后它为我提供断点。
我想知道是否有任何其他替代方法来分类这个连续的自变量。
- 请注意,这个问题并不是问是否要分类,因为我知道这样做的缺点和优点。我希望那些想要回答或评论的人在试图说服我不要对其进行分类之前考虑这一点。谢谢你。