我正在研究著名的《统计学习要素》一书。当描述多元线性回归时,它使用简单的单变量回归作为构建块,这对我来说很有意义。据我了解,它使用输入向量的正交性属性来将多元回归拆分为简单的独立回归,并且当输入不正交时,这些输入会以剩余正交的方式进行转换。通过正交向量,我了解 2 个点积等于零的向量。
现在在书中指出
正交输入最常出现在平衡的设计实验中(强制正交性),但几乎从不出现观察数据。
怎么能强制执行呢?我能想象的唯一情况是,每个可能的标称值都使用二进制 0/1 值。更清楚地说:可以有一个带有标签的名义列性别:男和女。他可以创建两个输入列,一个称为sex.male ,当性别为男性时其值为1,否则为0。如果性别为女性,则相应的列sex.female将具有1 ,否则为0。这 2 个数字列将是正交的。是否可以强制执行连续变量?