我的背景
我是土木工程专业的研究生。对于道路交通数据(作为时间序列的车辆轨迹)的分析,我主要使用大约一百万个数据点或更多的大数据集。
当 MS Excel 无法打开大数据文件时,我开始使用 R 语言。使用基本的统计知识和 R 代码,我开发了一些算法来识别数据中的某些模式,这些模式适用于许多应用程序。但我仍然缺乏 R 语言的编程技能。
现在,我熟悉基本的推理统计和 R 包(plyr、dplyr、ggplot2 等)。最近我了解到机器学习算法还有助于通过监督/非监督学习来定义数据中的模式,并且它们的应用可能会提高使用交通数据预测驾驶员某些“行为”的准确性。
问题
拥有统计学和 R 的基本知识,我想作为初学者学习数据科学/机器学习。我知道统计中的一些概念。和 ML 重叠,这可能会弥补我学习 ML 的差距。牢记我的背景,您会推荐我哪些资源(书籍/在线课程)开始学习数据科学并将其应用于我的领域?