使用计算机模拟更好地理解研究生阶段的统计概念

机器算法验证 r 假设检验 sas 模拟 计算统计
2022-03-13 00:55:47

嗨,我正在攻读统计学的研究生课程,我们一直在学习测试统计和其他概念。

然而,我经常能够应用这些公式,并对事物的工作原理产生一种直觉,但我经常有一种感觉,如果我用模拟实验来支持我的研究,我会对手头的问题产生更好的直觉.

所以,我一直在考虑编写简单的模拟,以更好地理解我们在课堂上讨论的一些概念。现在我可以使用说 Java 来:

  1. 生成具有正态平均值和标准差的随机总体。
  2. 然后取一个小样本,尝试凭经验计算 Type-I 和 Type-II 误差。

现在我的问题是:

  1. 这是发展直觉的合理方法吗?
  2. 有没有软件可以做到这一点(SAS?,R?)
  3. 这是处理此类编程的统计学学科吗:实验统计学?计算统计学?模拟?
3个回答
  1. 是的。毕竟这与你的直觉有关。
  2. R会很适合你。如果您已经了解 Java(或任何其他“标准编程语言”),那么编码对您来说将非常容易。
  3. 计算统计处理用于实现统计方法的算法设计,这可能与您在此处描述的最接近。

尽情享受您的课程吧!

我喜欢你的问题,但对 2 和 3 没有具体的答案?我想像 SAS(广义地说是 SAS 产品,而不仅仅是 SAS/STAT)这样的软件包可能具有促进模拟的工具,但我不能肯定地说。我认为这类事情不适合作为数学或统计学的一个分支。

现在问题1是我想关注的。模拟可以帮助学习各个级别的统计数据,并且可以帮助进行一般的统计研究。确实有一些期刊专注于模拟和计算。甚至 FDA 也认识到模拟在设计临床试验和帮助预测结果方面的重要性。

在 1960 年代,朱利安·西蒙 (Julian Simon) 教授使用模拟作为激励因素的介绍性统计学。尽管有争议,但他后来声称他在 Efron 之前进行了重新采样(置换和引导)。他在 1969 年用这些想法出版了一本书。它当然缺乏理论,只是一种教具,而不是一种新的统计估计方法。他没有发展出埃夫隆及其之后的任何数学特性。

我认为对于介绍性统计,进行模拟以演示采样分布是有用的,显示中心极限定理是如何产生的,并且通过梅花形进行的物理模拟演示了中心极限定理的 DeMoivre - Laplace 版本。

有时它会增强直觉。我认为即使对像保罗·厄多斯这样的数学家来说,蒙蒂·霍尔问题也令人费解并且似乎自相矛盾。但模拟游戏往往很有说服力。概率中有许多违反直觉的问题,我认为模拟可以帮助。

1978 年,当我攻读极值理论博士学位时,我对一个我试图证明的极限定理有了一个直观的想法。我在数学上挣扎。然后我决定模拟随机过程,模拟“证实”了我的结果。这让我有信心去证明它。

因此,即使在研究生阶段和更高级别,模拟也可以通过两种方式发挥作用。

  1. 按照您在问题 1 中的建议帮助培养直觉,但也

  2. 像我在论文中所做的那样确认直觉

R 的 TeachingDemos 包与您的思维过程相似,试图以不同的方式可视化和理解概念。包中的一些函数使用模拟来帮助理解一些关键概念。开发版本(R-forge,但尚未在 CRAN 上)包含一个函数“simfun”,可用于创建模拟函数以进一步帮助模拟。