统计学和信息学有什么区别?

机器算法验证 生物信息学
2022-03-04 11:34:16

我们总是说统计只是处理数据。但我们也知道,信息学也在从数据分析中获取知识。例如,生物信息学的人完全可以不用生物统计学。我想知道统计学和信息学之间的本质区别是什么。

3个回答

好问题!!

我多次听说生物信息学家可以不用生物统计学,甚至不用统计学。这是完全正确的,直到它变成错误的。在我看来,统计知识的普遍缺乏在该领域造成了灾难性的影响,正如Keith Baggerly所表明的那样。我还可以观察到,缺乏统计学(和线性代数)的基础知识是导致生物信息学家长期停滞不前的原因:如果没有深入了解理论,他们往往会重新发明轮子并诉诸临时解决方案来解决无非是他们自己的问题。

但是现在,为了回答您的问题,我同意总体而言,当时的统计数据离不开计算机。然而,统计的主要方面之一是推理,它与计算机无关。统计推断实际上使统计成为一门科学,因为它告诉您您的结论在其他情况下是否成立。

简而言之,您可以从数据中分析出地狱,您仍然需要统计数据来了解您将根据分析做出的预测或决策的有效性。

我的观点是,虽然这些领域之间存在大量重叠,但也存在关键差异。一般来说,统计学专业的学生(学位较高)将比信息学专业的学生学习更多的理论课(数学和数学统计),但信息学专业的学生将学习更多的计算(尤其是数据库部分)方面的知识。

开发一个新的统计测试将更多地落在统计学家而不是信息学家身上,但是为用户设计一个输入数据和生成表格和图表的界面将更多地落在信息学家而不是统计学家身上。

对统计学家来说,计算机是帮助统计的工具。对于信息学家来说,统计是帮助收集和分发信息的工具(通常通过计算机)。

在下面编辑 -----

扩展,这里是一个例子。我曾与信息学家(我是统计学家)合作过项目,其中一名医生希望有一个系统,在该系统中,患者的信息用于预测他们患某种疾病的风险(例如形成血栓),并希望获得某种形式的提醒他们了解风险。我在项目中的角色(统计学家角色)是开发一个模型,在给定预测变量的情况下预测风险(逻辑回归模型就是这样一个模型)。该项目中的信息学家角色是开发收集预测变量的工具,在它们上使用我的模型,然后将结果发送给医生。数据可以从电子病历中收集,或通过护士填写的数据输入屏幕或其他方式收集。

现在我(和许多其他统计学家)对编程有足够的了解,我可以查询数据库以获取预测变量并创建某种类型的警报,但我很高兴将其留给信息学家(无论如何他们更擅长)。有些信息学家知道足够的统计数据来拟合逻辑回归模型。所以这个项目的一个简单版本只能由统计学家或信息学家来完成,但最好是两者一起工作。如果您查看这个项目并认为建模部分是有趣的部分,而数据收集、警报和其他界面只是将信息移入和移出模型的工具,那么您更像是一名统计学家。如果您看到设计界面、优化数据检索、测试不同类型的警报等。

统计从数据中推断;信息学对数据进行操作当然它们是重叠的,但是谁的范围更大的问题没有答案。