我的数据包含多个 NHL 赛季,每个球员的总进球数都被记录下来。
我打算比较每个赛季的进球分布情况。
我的想法是,我需要标准化进球数,然后才能正确比较分布,因为并非每个赛季的比赛次数都相同。
实际上是否有必要对数据进行归一化以便公平地比较分布?
我的数据包含多个 NHL 赛季,每个球员的总进球数都被记录下来。
我打算比较每个赛季的进球分布情况。
我的想法是,我需要标准化进球数,然后才能正确比较分布,因为并非每个赛季的比赛次数都相同。
实际上是否有必要对数据进行归一化以便公平地比较分布?
首先,让我们看一下规范化这个术语。
在统计和统计应用中,归一化可以有多种含义。在最简单的情况下,评级的标准化意味着将在不同尺度上测量的值调整到一个名义上的共同尺度,通常在平均之前。在更复杂的情况下,归一化可能指的是更复杂的调整,其目的是使调整值的整个概率分布对齐。
您的 NHL 目标示例可能不需要“将在不同尺度上测量的值调整为名义上的通用尺度”。
想想那些赛季初得分很高的球员,然后受伤并缺席了大部分比赛。你想让他的进球与联盟其他球员成正比吗?