在基于百分比分析数据集时,我有时会使用“完整”值(即“50”)或“减少”值(即“.50”)的数据。
但是,我突然想到这可能会对标准偏差和方差产生严重影响。
如果我的标准差和方差都大于 1,则标准差将小于方差。但如果它们低于 1,则标准差将大于方差。
这是否意味着永远不会有导致方差低于 1 的数据集是一种好习惯?或者有没有办法解决这个问题?
在基于百分比分析数据集时,我有时会使用“完整”值(即“50”)或“减少”值(即“.50”)的数据。
但是,我突然想到这可能会对标准偏差和方差产生严重影响。
如果我的标准差和方差都大于 1,则标准差将小于方差。但如果它们低于 1,则标准差将大于方差。
这是否意味着永远不会有导致方差低于 1 的数据集是一种好习惯?或者有没有办法解决这个问题?
如果我的标准差和方差都大于 1,则标准差将小于方差。但如果它们低于 1,则标准差将大于方差。
实际上,情况并非如此,因为您忽略了单位。百分比的标准偏差以百分比衡量,而方差不是。
这就像有一个 20 cm 的标准偏差(方差 400 cm),然后担心如果以米为单位测量它,方差(0.04 m)小于标准偏差(0.2 m)。虽然 0.04 小于 0.2,但您是在比较苹果和橙子——它们的单位不同!
所以你不能说方差大于或小于标准差。它们根本没有可比性。
没有任何问题:您可以愉快地使用高于 1 或低于 1 的值;一切都保持一致。没有什么可解释的。
问题的唯一来源是,如果您的某些值是整数百分比 (50),而有些值是分数 (0.50),而没有跟踪相应的单位。你会担心的。
方差(从 ST 派生)测量与平均值的差异。鉴于与平均 d1 和 d2 的差异,无论 D > 0 还是 D < 0,这始终适用:d1 <=> d2 === d1^2 <=> d2^2
.
例子:
d1 = 2
d2 = 3
2 < 3 and 4 < 9
d1 = 0.1
d2 = 0.5
0.1 < 0.5 and 0.01 < 0.25
d1 = 0.5
d2 = 2
0.5 < 2 and 0.25 < 4
我不确切知道标准偏差在实践中是如何工作的,但确实较大的差异会给出较大的值,而较小的差异会给出较小的值,即使平方从增加变为减少向下传递也是如此。
我认为这是有效的,因为一旦你达到 1,从那里到 0 的唯一方法就是向下。在绘图仪上,它应该产生一条连续的曲线。
标准偏差将与标准偏差和方差与方差进行比较。只要您坚持使用标准差(平方根)或方差(平均平方差),它们将保持成比例的可比性。
我相信 SD 将有效地将其从几何(平方曲线)转换为线性曲线。
<=>
指比较(-1 小于,0 相同,1 大于)并且===
意味着完全相等。变量中的数字是变量名的一部分,乘法只发生在显式的*
.