在工作中,我们正在讨论这个问题,因为我的老板从未听说过正常化。在线性代数中,归一化似乎是指向量除以其长度。在统计学中,标准化似乎是指减去平均值然后除以其 SD。但它们似乎也可以与其他可能性互换。
当创建某种通用分数时,它构成了不同的指标,它们有不同的手段和不同的 SD,你会标准化、标准化还是其他什么?一个人告诉我,这只是将每个指标分别除以它们的 SD 的问题。然后将两者相加。这将产生一个通用分数,可用于判断这两个指标。
例如,假设您有乘地铁上班的人数(在纽约市)和开车上班的人数(在纽约市)。
如果你想创建一个通用分数来快速报告交通波动,你不能只添加和因为会有更多的人乘坐火车。纽约市有 800 万人,外加游客。每天有数百万人乘坐火车,数十万人乘坐汽车。因此,它们需要转换为相似的比例才能进行比较。
如果
和
你会把 &归一化然后求和吗?你会标准化 &然后求和吗?或者您会将每个除以各自的 SD 然后相加吗?为了得到一个在波动时代表总流量波动的数字。
任何文章或书籍章节供参考将不胜感激。谢谢!
这也是我正在尝试做的另一个例子。
想象一下,你是一名大学院长,你正在讨论入学要求。您可能希望学生至少具有一定的 GPA 和一定的考试成绩。如果他们都在相同的规模上会很好,因为这样你就可以把两者加在一起,然后说,“任何至少 7.0 的人都可以被录取。” 这样,如果一个潜在学生的 GPA 为 4.0,他们可能会得到低至 3.0 的考试成绩并仍然被录取。相反,如果某人的 GPA 为 3.0,他们仍然可以以 4.0 的考试成绩被录取。
但事实并非如此。ACT 是 36 分,大多数 GPA 都是 4.0(有些是 4.3,是的,很烦人)。由于我不能只添加 ACT 和 GPA 来获得某种通用分数,我该如何转换它们以便添加它们,从而创建通用录取分数。然后作为院长,我可以自动接受任何分数超过某个阈值的人。甚至自动接受所有分数在前 95% 以内的人……诸如此类。
那会是正常化吗?标准化?或者只是将每个除以他们的 SD 然后求和?