在教授入门级课程时,我认识的老师往往会编造一些数字和故事,以举例说明他们所教授的方法。
我更喜欢用真实的数字讲一个真实的故事。然而,这些故事需要与一个非常小的数据集相关,这使得手动计算成为可能。
对此类数据集的任何建议都将受到欢迎。
小型数据集的一些示例主题:
- 相关/回归(基本)
- 方差分析(1/2 方式)
- z/t 测试 - 一个/两个非/配对样本
- 比例比较 - 两路/多路表
在教授入门级课程时,我认识的老师往往会编造一些数字和故事,以举例说明他们所教授的方法。
我更喜欢用真实的数字讲一个真实的故事。然而,这些故事需要与一个非常小的数据集相关,这使得手动计算成为可能。
对此类数据集的任何建议都将受到欢迎。
小型数据集的一些示例主题:
数据和故事库是“说明基本统计方法使用的数据文件和故事的在线库” 。
这个站点似乎有你需要的东西,你可以在它上面搜索特定的数据集。
DJ Hand、F. Daly、AD Lunn、KJ McConway 和 E. Ostrowski 有一本名为“A Handbook of Small Datasets”的书。NCSU 的统计部门已在此处以电子方式发布了本书中的数据集。
上述网站仅提供数据;您需要阅读这本书才能了解数字背后的故事,也就是说,您可以从数据集的标题中收集到的任何故事。但是,它们很小,而且它们是真实的。
对于双向表,我喜欢泰坦尼克号乘客的性别和生存数据:
| Alive Dead | Total
-------+-------------+------
Female | 308 154 | 462
Male | 142 709 | 851
-------+-------------+------
Total | 450 863 | 1313
有了这些数据,人们就可以讨论诸如独立性的卡方检验和关联性度量之类的事情,例如相对率和优势比。例如,女性乘客的生存几率是男性乘客的约 4 倍。与此同时,男性乘客的死亡几率是女性乘客的 2.5 倍。但是,生存/死亡的几率总是 10。
统计教育杂志有一个教育数据集档案。