我正在准备使用 R 编程语言教授数据科学入门课程。我的听众是商科专业的本科生。一个典型的商科本科生没有任何计算机编程经验,但上过一些使用 Excel 的课程。
就个人而言,我对 R(或其他编程语言)非常熟悉,因为我主修计算机科学。然而,我有一种感觉,我的许多学生会对学习编程语言感到谨慎,因为这对他们来说似乎很困难。
我确实对 Excel 有一定的了解,我相信虽然 Excel 对简单的数据科学很有用,但学生有必要学习一门严肃的数据科学编程语言(例如 R 或 Python)。我如何让自己和学生相信 Excel 对于一个认真学习数据科学的商科学生来说是不够的,他们有必要学习一些编程?
根据评论编辑
以下是我将讨论的一些主题:
- 数据处理和数据清洗
- 如何操作数据表,例如,选择行子集(过滤器)、添加新变量(变异)、按列对行进行排序
- 使用dplyr包进行 SQL 连接
- 如何使用ggplot2包绘制图(散点图、条形图、直方图等)
- 如何估计和解释统计模型,例如线性回归、逻辑回归、分类树和 k 最近邻
因为我对 Excel 不是很了解,所以不知道这些任务是否都可以在 Excel 中轻松完成。