我是一名从事数据挖掘工作的计算机科学家。众所周知,计算机科学家在进行系统的实验设计和评估方面相当差 - 使用 p 值和置信度估计被认为是先进的 :)。
我想知道是否有好的课程/材料可以教计算机科学家关于好的实验设计。为了更具体,我将添加以下信息:
- 该课程应针对可以假定对概率有合理理解但统计学背景有限的研究生。
- 该课程应侧重于“不受控制的非自然环境”中的实验设计:换句话说,既没有潜在的物理基础事实,也没有控制数据收集过程的方法(与人类受试者一样)。当然,一门好的课程将侧重于基础知识,但它应该以一种重要的方式处理这种情况。
- 计算元素将是一个奖励,但不是强制性的。我们处理大量数据,但如果需要,我们可以自己找出计算问题。