我想比较几种变量选择的方法。我想用模拟来做。我知道它不会成为问题“哪种方法是最好的?”的最终答案,但我只是在寻找一些提示。为了进行这样的模拟,我需要一种方法来绘制“随机线性模型”。是否有任何公认的绘制“随机线性模型”的算法?被广泛接受是指例如在一些科学论文中使用的方法。
我在考虑以下简单的方法:
1)选择和,它表示观察数和变量数。
2) 生成随机矩阵通过使用均匀分布绘制每个元素.
3)使用均匀分布生成参数.
4) 使用正态分布生成残差对于一些固定和任意选择
5) 计算
我想比较几种变量选择的方法。我想用模拟来做。我知道它不会成为问题“哪种方法是最好的?”的最终答案,但我只是在寻找一些提示。为了进行这样的模拟,我需要一种方法来绘制“随机线性模型”。是否有任何公认的绘制“随机线性模型”的算法?被广泛接受是指例如在一些科学论文中使用的方法。
我在考虑以下简单的方法:
1)选择和,它表示观察数和变量数。
2) 生成随机矩阵通过使用均匀分布绘制每个元素.
3)使用均匀分布生成参数.
4) 使用正态分布生成残差对于一些固定和任意选择
5) 计算
您概述的方法的一个问题是回归变量将(平均)是不相关的,变量选择方法有困难的一种情况是高度相关的回归量。
我不确定“随机”线性模型的概念在这里是否非常有用,因为您必须决定模型空间上的概率分布,这似乎是任意的。我宁愿把它当作一个实验,并应用好的实验设计的原则。
后记:这是一份参考资料,但我相信还有其他参考资料:
Andrea Burton、Douglas G. Altman、Patrick Royston 和 Roger L. Holder。医学统计学中模拟研究的设计。医学统计学 25 (24):4279-4292, 2006. DOI:10.1002/sim.2673
另见这封相关信函:
Hakan Demirtas。医学统计学 26 (20):3818-3821, 2007. DOI:10.1002/sim.2876
刚刚找到一个关于类似主题的评论:
G. Maldonado 和 S. Greenland。批判性地解释模拟研究的重要性。流行病学 8 (4):453-456, 1997. http://www.jstor.org/stable/3702591
要解决 @onestop 对非相关回归量的反对意见,您可以执行以下操作: