我有 2 个数据集。第一个数据集,我们称它为的平均值为 ( ),标准差为 ( ),第二个数据集的平均值为 ( ),标准差为 ( ) . 我想找出数据集 2 与数据集 1 相比百分比变化的标准误差或标准偏差。所以我有。现在我的问题是,你如何考虑这个百分比值的标准偏差?
比率的标准偏差(百分比变化)
机器算法验证
数理统计
标准差
标准错误
2022-04-14 19:52:49
2个回答
如果您不知道分布,通常的方法是通过泰勒展开。
例如,请参见此处或此处第 6 页的顶部
或者
http://en.wikipedia.org/wiki/Taylor_expansions_for_the_moments_of_functions_of_random_variables
(您必须认识到这两个样本均值本身就是随机变量才能应用它。)
---
编辑:
该公式与您的情况直接相关,因为。
我不知道有什么具体的参考书,感觉有点像寻求如何进行长除法的参考。
这是一种绝对标准的逼近均值和方差的技术,非常直接(并且以相当明显的方式)基于泰勒级数,泰勒级数已经存在了 300 年。它肯定在书中提到过,但我从来没有从一本书中学到它,尽管我多次遇到它——它总是“在泰勒级数中扩展这种转换”(通常,但并不总是关于平均值)和“接受期望' 或 '采取差异' (或任何必要的)。
一旦你学会了如何做泰勒级数(标准的早期本科数学)并知道一些期望和方差的属性(标准的早期数学统计),你就完成了;这是本科生作为练习的东西。
我看看能不能找到参考资料;在标准的旧参考文献中肯定会有一些东西,比如 Cox 和 Hinkley 或 Kendall 和 Stuart 或 Feller 或其他东西(我目前都不需要提供)。
泰勒级数方法产生一个方差估计量,然后可用于根据您的比率的粗略正态假设来估计对称置信区间。
Donner 和 Zhou 的 MOVER-R 是一种更通用的方法,可以直接为两个随机变量的比率生成(可能是不对称的)置信区间:
Donner, Zhou:正态均值和标准差函数的封闭式置信区间。 医学研究中的统计方法,21(4),347–359(2012)
其它你可能感兴趣的问题