在对另一个问题的评论中,有人询问正在讨论的主题是“计数比例”还是“连续比例”,并且后续表明差异是关键信息(对于逻辑/二项式与贝塔回归的主题)。
两者之间的区别是什么,区别在哪里很重要?使用“计数比例”与使用“连续比例”时要记住哪些重要事项?
在对另一个问题的评论中,有人询问正在讨论的主题是“计数比例”还是“连续比例”,并且后续表明差异是关键信息(对于逻辑/二项式与贝塔回归的主题)。
两者之间的区别是什么,区别在哪里很重要?使用“计数比例”与使用“连续比例”时要记住哪些重要事项?
也许一个例子会有所帮助。假设你观察了一些人并计算其中有多少是女性。得到的比例就是所谓的计数比例,取值介于 0 和 1 之间,但只有个,其中是您观察到的总数。假设您从当地超市购买了一根香肠,并在标签上观察到它是 80% 的猪肉,这是一个连续比例的例子,可以取 0 到 100 之间的任何值。
建模的区别在于,在第一种情况下,预测随机人成为女性的概率是有意义的(逻辑回归),但在第二种情况下,这不是一个明智的问题,而其他的东西(通常是 beta 回归)将是首选.