比率的标准偏差(百分比变化)

机器算法验证 数理统计 标准差 标准错误
2022-04-14 19:52:49

我有 2 个数据集。第一个数据集,我们称它为的平均值为 ( ),标准差为 ( ),第二个数据集的平均值为 ( ),标准差为 ( ) . 我想找出数据集 2 与数据集 1 相比百分比变化的标准误差或标准偏差。所以我有现在我的问题是,你如何考虑这个百分比值的标准偏差?XX¯STDXY¯STDY((Y¯X¯)/X¯)100

2个回答

如果您不知道分布,通常的方法是通过泰勒展开。

例如,请参见此处此处第 6 页的顶部

或者

http://en.wikipedia.org/wiki/Taylor_expansions_for_the_moments_of_functions_of_random_variables

(您必须认识到这两个样本均值本身就是随机变量才能应用它。)

---

编辑:

该公式与您的情况直接相关,因为Var(100(yz)/z)=1002Var(yz1)=1002Var(y/z)

我不知道有什么具体的参考书,感觉有点像寻求如何进行长除法的参考。

这是一种绝对标准的逼近均值和方差的技术,非常直接(并且以相当明显的方式)基于泰勒级数,泰勒级数已经存在了 300 年。它肯定在书中提到过,但我从来没有从一本书中学到它,尽管我多次遇到它——它总是“在泰勒级数中扩展这种转换”(通常,但并不总是关于平均值)和“接受期望' 或 '采取差异' (或任何必要的)。

一旦你学会了如何做泰勒级数(标准的早期本科数学)并知道一些期望和方差的属性(标准的早期数学统计),你就完成了;这是本科生作为练习的东西。

我看看能不能找到参考资料;在标准的旧参考文献中肯定会有一些东西,比如 Cox 和 Hinkley 或 Kendall 和 Stuart 或 Feller 或其他东西(我目前都不需要提供)。

泰勒级数方法产生一个方差估计量,然后可用于根据您的比率的粗略正态假设来估计对称置信区间。

Donner 和 Zhou 的 MOVER-R 是一种更通用的方法,可以直接为两个随机变量的比率生成(可能是不对称的)置信区间:

Donner, Zhou:正态均值和标准差函数的封闭式置信区间。 医学研究中的统计方法,21(4),347–359(2012)