在哪里可以找到有关公共卫生领域数据科学的资源和论文

数据挖掘 可视化 画面 研究
2021-10-09 01:28:05

我对数据科学很陌生,但我想做一个项目来了解更多信息。我的主题是公共卫生中的数据理解。所以我想对公共卫生做一些介绍性研究。我想使用 Tableau 之类的工具来可视化一些数据。

你会走哪条路来加深对数据科学的理解?我想参加一些在线课程,例如。关于数据科学的 Udacity 课程,但您会推荐哪些课程?我在哪里可以获得真实数据(辅助虚拟数据)来使用?在数据科学领域以公共卫生为主题的研究论文中是否有任何好的资源?

欢迎任何建议和意见。

4个回答

我认为通过使用 Tableau 之类的软件工具,您不会学到很多关于数据科学的知识(意思是,获得理解和技能)。此类工具主要针对高级用户(而非数据科学家),例如分析师和其他主题专家,他们使用图形用户界面 (GUI)分析和(主要)可视化数据。话虽如此,像 Tableau 这样的软件工具可能足以执行数据科学工作流程的初始阶段:探索性数据分析 (EDA)

在数据科学自学方面,有几种流行的在线课程 (MOOC) 可供您选择(大多数都有免费和付费版本)。除了你提到的关于 Udacity 的课程(https://www.udacity.com/course/ud359),Coursera上还有两门数据科学课程:华盛顿大学的数据科学导论https:// www.coursera.org/course/datasci )和约翰霍普金斯大学数据科学专业的一组课程( https://www.coursera.org/specialization/jhudatascience/1)。请注意,您可以在方便时免费参加专业化的个别课程。还有其他几个虽然不太受欢迎的数据科学 MOOC。

数据源方面,我不确定您所说的“虚拟数据”是什么意思,但是有大量的开放数据集,其中包括许多公共卫生领域的数据集。您可以查看 KDnuggets ( http://www.kdnuggets.com/datasets/index.html )上列出的相应资源并选择您感兴趣的资源。对于国家级分析,获取数据的最快方法是查找和访问相应的开放数据政府网站。例如,对于美国的公共卫生数据,我会访问http://www.healthdata.govhttp://www.data.gov(后者 - 对于您可能想要包含的相应非医疗数据)你的分析)。

关于公共卫生领域的研究论文,我有两条评论:1)该(或任何其他)领域的大多数实证研究恕我直言,可以被视为数据科学研究/项目;2)您需要对该领域或您感兴趣的主题进行文献综述,因此从这个意义上说,您是靠自己的。

最后,关于软件工具的说明。如果您对数据科学很认真,我建议您花一些时间学习 R 或 Python(如果您还不了解它们),因为它们是当今数据科学家中最流行的两种开源工具。两者都有各种功能丰富的开发环境,以及遍布世界各地的软件包/库和用户/开发人员的大型生态系统。

您可能还会在 Data Science StackExchange 网站上找到我的其他一些相关答案。例如,我建议你阅读这个答案这个答案这个答案祝你好运!

对于我对医学数​​据的研究,我对 RapidMiner 提供的功能非常满意。快速矿工

去pubmed。 http://www.ncbi.nlm.nih.gov/pubmed/

键入您感兴趣的关键词,您将能够从所有期刊中按时间顺序提取所有带有关键词的公共卫生研究论文。

数据科学是一个新的有点模糊的术语。您将通过使用以下关键字找到更多信息,例如:流行病学、人口健康、公共卫生监测、公共卫生、统计学、循证医学、生物统计学、统计流行病学、临床决策、干预措施等。

发布的问题过于宽泛。另一方面,您很幸运,因为有大量关于此主题的信息。约翰霍普金斯大学在 Coursera 上的许多 R/数据科学课程都带有公共卫生的味道。此外,之前的 R 和 S-PLUS 主要用于健康环境。