是否在蒙特卡罗模拟的 n 次试验后取平均值?哪个在统计上更好?

机器算法验证 方差 模拟 蒙特卡洛 随机生成 意思是
2022-03-23 07:14:59

与我的工作相关,我想编写一个逼真的蒙特卡罗模拟,用于可用性、可靠性和相关的敏感性分析。场景会很复杂,会有很多参数。

然而,我想问的是我认为统计学家的基本知识。

我的问题是

假设这两个程序使用相同的计算资源,下面的程序在统计学方面更好,为什么?我所说的更好的意思是与真实值的差异更小。

程序 1)

  1. 10K蒙特卡罗模拟
  2. 使用上面的 10K 结果找到期望值
  3. 重复步骤 1 和步骤 2 10次。(现在我们有 10 个期望值)
  4. 通过平均步骤 3 的结果找到期望值。

程序 2)

  1. 100K蒙特卡罗模拟
  2. 通过使用上面的 100K 结果找到期望值

阅读教程后我的问题是: http ://weibull.com/hotwire/issue3/hottopics3.htm

此致

2个回答

从概率的角度来看,这两个过程实际上导致了相同的答案,即蒙特卡洛估计量的分布相同,因为

110Ni=110Nf(xi)110j=1101Nk=1Nf(xjk)
(意味着两个随机变量具有相同的分布)当
xi,xjki.i.d.g
尤其是,
var(110Ni=110Nf(xi))=var(110j=1101Nk=1Nf(xjk))

我更喜欢在这里而不是在~评论~里说话,因为这似乎是一篇很长的文章。我不是纪律方面的统计学家 :) 但这里有一些用于设置 MC 分析的建议方面......

实验次数

当然,您尝试的实验越多越好,因此,到目前为止,更可取的程序将是第一个。理想的情况是尽可能多地分发实验,因为每个实验驱动整个系统的不同操作点。注意点数是在得到实验次数后分布的……

这个决定的主要因素是:

  1. 您想要获得的期望值的可变性,
  2. 过程的可变性,
  3. 激发子系统的数量。

当然,您可以将此策略升级到传感器、机器、流程、设施等……其想法是,MC 的大小理论上是上述的可变性。

可变性 在这里,可变性是:非线性、动态、时变。

显然,如果一切都是线性的——这并不意味着系统是线性的,但它们的频繁操作域被减少到少量的点——程序 1 和程序 2 之间没有区别。

  1. 非线性系统(即压力控制系统)或机器将需要比线性系统(即温度控制系统)更多的 MC 点,
  2. 动态系统(即几乎任何过程)将需要比静态系统(即系统输出、恒定 KPI、监视器)更多的 MC 点,
  3. 时变系统——即事件发生、周期性或非周期性趋势——将需要特定的 MC 点来覆盖这些情况。

这些因素中的每一个都带有特定的、明确定义的可变性度量,作为预期的变化率——流量、能源消耗、活动——单位资源消耗率——时间、燃料、工时——。

清楚了所有这些之后,您就可以自由地进入整体系统分析的各个阶段,这些阶段或多或少地以这种方式进行:

步骤 1. 探索。你对你的系统一无所知,随意放置你的 MC 100k 操作点,你就完成了,

步骤 2. 检测。您需要确定如何分配这 100k,以便将您的模拟能力集中到最需要的区域,

步骤 3. 诊断。您获得可靠的估算器并计算估算器的第一个方差,

步骤 4. 隔离。您优化模拟并改善估计器的方差。

当然,每个系统都会有自己的议程,但正如您所见,越复杂,分析就越顺利……

好吧,如果有任何意见,请写在下面,我们会扩展讨论。

干杯...