如何在嵌套多项逻辑回归中对备选方案进行子集化?

机器算法验证 回归 物流 分类 多层次分析 选择建模
2022-03-30 02:38:42

我试图预测特定底层鱼类渔业的船长是否选择在任何一天捕鱼,以及哪些变量可能会影响该决定。最初我计划使用香草逻辑回归,每个船长决定在特定渔业季节的任何一天捕鱼或不捕鱼。然而,这不是一个现实的模型,因为许多船只参与多种渔业。因此,我想运行一个嵌套的多国逻辑回归模型,其结构位于底部。

请注意,第 1 组和第 2 组的存在是为了避免违反 IIA 假设。

因为每个物种都有不同的季节,并且每个物种内的船长拥有不同数量的捕鱼配额磅(当配额用完时,即使季节开放,您也不能再捕鱼),并非所有节点都同时可用。我想为单个节点是否是一个选项包括一个虚拟变量,但我不确定这是否有意义,或者即使这种方法(多项逻辑)是否仍然可行。

我可以尝试这样的半数值变量编码,即 whuber 的响应,但我在这些子集中有更多的子集和嵌套。

编辑*我已经研究过,但目前还没有实现,一个不同的选择 logit 模型。该模型的描述可以在http://web.mit.edu/teppei/www/research/dchoice.pdf找到。

我正在使用 R 并计划使用 lmer4,但我不确定我是否能够。

在此处输入图像描述

1个回答

您想要的模型类型的总称是选择模型假设您对问题的描述是正确的,那么您尝试建模的选择不是FishDon't fish,而是一周中的几天。

我认为,就选择而言,您的层次结构的第二层并不是真正的层次结构。相反,它是钓鱼船长所处环境的一个特征,因此可以通过交互、替代特定效果或通过为每种鱼类型估计单独的模型来处理。(您的问题面临的一个挑战是,您必须跨越整个研究领域才能对其进行建模;有关于这个主题的专业书籍,Hensher 等人可能是最容易入门的)。

虚拟变量不处理某些节点不能同时使用的问题。相反,它是通过在选择集中有不同的选择来处理的例如,在交通研究中,如果对交通选项的选择进行建模,则只有有车的人才能选择乘车出行。

我看不出你如何在lmer. R中有很多专业的选择建模包。估计很多用于解决现实世界问题的选择模型(与学术出版物相反)的人倾向于在潜在类logit和混合logit(又名随机参数logit)之间进行选择)。嵌套 logit 是 30 年前出现的一种技术。而且,为了增加您的挑战,这是 R 不是很好的领域之一,您会发现某些模型将运行很长时间。大多数从业者将使用比 R 快得多的专用软件来处理此类数据,例如 Stata、SAS,或更专业的软件包,例如 LIMDEP 和 Latent Gold。