我在 Wikipedia 或 Wolfram Mathworld 上找不到 tantile 或 medial 的定义,但在 Bílková, D. 和 Mala, I. (2012) 中给出了以下解释,“在对收入分配进行建模时应用 L 矩方法在捷克共和国”,奥地利统计杂志,41 (2), 125–132。
中间是一个值(sample) tantile 就像样本中位数等于 a 的值一样样本分位数。样本分位数以及样本分位数基于有序样本。首先,评估有序样本中的累积观测和。然后,对于给定的百分比,, 一种tantile 定义为分析变量的值,它将有序样本中的所有观测值分成两部分:较小或相等观测值的总和是观察值总和与观察值总和中较大的表示残差这笔款项。
何时使用这些作为位置度量而不是更传统的中位数或其他分位数有意义?该论文给出了一种可能的情况,即家庭收入:
从这个定义可以得出,中间值可以作为收入水平的合理特征,因为收入低于或等于中间值的家庭获得样本中总收入的一半,收入较高的家庭比内侧接另一半。
在这种情况下,家庭收入中位数为117,497捷克克朗(即一半的家庭收入高于此数字,一半家庭收入高于此数字),而家庭收入中位数为 133,930 捷克克朗(收入高于此数字的家庭的一半收入为总收入)。请注意,这种比较不一定反映家庭收入的偏度,甚至不一定反映家庭收入的不均匀性:即使家庭收入分布均匀,中位数仍高于中位数。据我理解的定义,如果所有家庭的收入相同,则中位数只会等于中位数。
那么在这种情况下是否有任何特别的理由更喜欢内侧,或者至少将其用作补充措施?中位数和中位数之间的比较究竟告诉我们什么?由于我刚才提到的原因,中间值似乎不能直接与其他集中趋势度量相比较。是否还有其他情况可以广泛使用内侧/tantiles 或被视为特别有用的信息?非常欢迎使用它们的实际示例以及样本研究论文,并且对它们可能被证明有用的更广泛背景的直观想法会更好。
它必须要求总计和小计有意义——这似乎与金钱有关,以及“馅饼”的分配方式——但即使是加法的行为也只对某些数量有意义。对于密集而不是广泛的属性,例如密度或温度,任何形式的求和在物理上都没有意义。在我看来,一个广泛的财产是必要的,但不足以让 tantiles 有所帮助,因为我可以想象一个航运分析师对运输的货物重量感兴趣,所以 50% 的货物(按重量)是携带该重量或以上重量的负载,但我无法想象生态学家会对蝾螈的长度感兴趣,以至于所有蝾螈总长度的 50% 是由该长度或以上长度的蝾螈贡献的。