我正在尝试使用逻辑回归构建模型,如果打开邮件,我的因变量为 y=1,如果未打开,则为 y=0。
对于每个收到电子邮件并想要计算每个用户打开电子邮件的概率的收件人,我有大约 10 条记录(10 行)的数据。但是,不知道如何根据此要求编辑数据集。
因为结果(概率)现在对于每一行(每封邮件)都是一样的,我希望它适用于每个收件人。
ID是收件人的ID(见截图)如果我计算开口的数量,我会失去二元运算符,这是逻辑回归所必需的。
有什么想法吗?