对于单峰分布,如果均值 = 中值,那么说分布是对称的就足够了吗?
维基百科在平均值和中位数之间的关系中说:
“如果分布是对称的,则均值等于中值,并且分布的偏度为零。此外,如果分布是单峰的,则均值 = 中值 = 众数。抛硬币或系列 1,2,3,4,... 但是请注意,通常情况下相反,即零偏度并不意味着平均值等于中位数。”
然而,收集我需要的信息并不是很直接(对我来说)。请提供任何帮助。
对于单峰分布,如果均值 = 中值,那么说分布是对称的就足够了吗?
维基百科在平均值和中位数之间的关系中说:
“如果分布是对称的,则均值等于中值,并且分布的偏度为零。此外,如果分布是单峰的,则均值 = 中值 = 众数。抛硬币或系列 1,2,3,4,... 但是请注意,通常情况下相反,即零偏度并不意味着平均值等于中位数。”
然而,收集我需要的信息并不是很直接(对我来说)。请提供任何帮助。
这是一个不对称的小反例:-3、-2、0、0、1、4 是单峰的,众数 = 中值 = 均值 = 0。
编辑:一个更小的例子是-2、-1、0、0、3。
如果您想想象一个随机变量而不是样本,则将支持设为 {-2, -1, 0, 3},除 0 为 0.4 外,所有这些均具有概率质量函数 0.2。
这开始是一条评论,但变得太长了;我决定把它变成更多的答案。
亚历克西斯的好答案涉及直接的问题(简而言之:i. 逻辑上并不意味着;并且 ii. 相反的陈述实际上通常是错误的),Silverfish 给出了反例。
我想处理一些额外的问题,并在此处指出一些在某种程度上相关的广泛答案。
您引用的维基百科页面上的声明也不完全正确。例如,考虑 Cauchy 分布,它肯定关于其中值对称,但没有均值。该语句需要一个限定词,例如“假设均值和偏度是有限的”。即使我们将其简化为第一句前半部分的较弱陈述,它仍然需要“如果均值是有限的”。
您的问题部分地将对称性与零偏度混为一谈(我假设您打算使用三阶偏度,但可以为其他偏度度量编写类似的讨论)。0 偏度并不意味着对称。您引用的后半部分和 Alexis 引用的 Wikipedia 部分提到了这一点,尽管第二个引用中给出的解释可能需要一些调整。
这个答案表明三次矩偏度与均值和中位数之间关系的方向之间的关系较弱(三次矩偏度和二阶皮尔逊偏度不必对应)。
关于这个答案的第 1 项给出了一个离散的反例,与 Silverfish 给出的相似但不同。
编辑:我终于找到了我之前真正在寻找的单峰示例。
在这个答案中,我提到了以下家庭:
取两个特定成员(例如,在该链接答案的特定示例中的蓝色和绿色密度,它们分别具有和),然后翻转一个关于 x-轴并取两者的 50-50 混合,我们将得到一个单峰不对称密度,所有奇数矩为零:
(灰线显示围绕 x 轴翻转的蓝色密度以使不对称性变得清晰)
Whiber在这里给出了另一个例子,零偏度是连续的、单峰的和不对称的。我复制了他的图表:
它显示了示例,并且同样翻转了平均值(以清楚地显示不对称性),但您应该阅读原文,其中包含很多有用的信息。
[Whuber 的答案在这里给出了另一个具有相同矩的非对称连续分布族。执行相同的“选择两个,翻转一个并采用 50-50 混合”技巧具有相同的不对称结果,所有奇数时刻为零,但我认为它不会在这里给出单峰结果(尽管可能有一些例子)。 ]
这里的答案讨论了均值、中位数和众数之间的关系。
这个答案讨论了对称性的假设检验。
不。
此外,如果分布是单峰分布,则均值 = 中值 = 众数。
同样,“如果小动物是鸡,那么它的起源是鸡蛋”并不意味着“如果起源是鸡蛋,那么小动物是鸡”。
来自同一篇维基百科文章:
在一条尾巴长而另一条尾巴肥大的情况下,偏度不遵循简单的规则。例如,零值表示平均值两侧的尾部平衡,对称分布和不对称分布均是如此,例如一条尾巴长而细,而其他的很短但很胖。
有趣且易于理解的示例来自二项分布。
以下是成功概率为 0.2 时 5 次试验中 0(1)5 次成功的二项式概率。立即得出平均值为 0.2 5 1,对概率的检查也证实了中位数和(单一)模式,但分布显然不是对称的。自然有许多其他的斜二项式的例子,均值为正整数。
1 2
+-------------------+
1 | 0 .32768 |
2 | 1 .4096 |
3 | 2 .2048 |
4 | 3 .0512 |
5 | 4 .0064 |
6 | 5 .00032 |
+-------------------+
该显示的 Stata 代码mata : (0..5)' , binomialp(5, (0..5), 0.2)'
在任何值得一提的统计软件中都非常简单或更简单。
作为心理学而不是逻辑的问题,这个例子不能令人信服地被认为是病态的(就像在其他问题中,人们可能会忽略某些时刻甚至不存在的分布)或为此目的而设计的一个奇怪或微不足道的例子(如例如@Silverfish 或 0, 0, 1, 1, 1, 3) 描述的发明数据。