@Ondrej 和 @Michelle 在这里提供了一些很好的信息。我想知道我是否可以通过解决其他地方未提及的一些问题来做出贡献。我不会因为无法从表格形式的数据中收集到太多信息而自责,表格通常不是呈现信息的好方法(参见Gelman et al., Turning Tables into Graphs)。另一方面,要求一种能够自动生成所有正确图表以帮助您探索新数据集的工具几乎就像要求一种能够为您思考的工具一样。(不要采取错误的方式,我知道您的问题清楚地表明您并没有走那么远;我的意思是永远不会有这样的工具。)可以找到与此相关的很好的讨论在这里。
说了这么多,我想谈谈您可能想用来探索数据的绘图类型。问题中列出的图将是一个好的开始,但我们也许可以对其进行一些优化。首先,制作关联变量对的“大量图”可能并不理想。散点图仅显示两个变量之间的边际关系。重要的关系通常可以隐藏在多个变量的某种组合中。所以加强这种方法的第一种方法是制作散点图矩阵同时显示所有成对散点图。散点图矩阵可以通过多种方式增强:例如,它们可以与每个变量分布的单变量核密度图相结合,可以使用不同的标记/颜色来绘制不同的组,并且可以通过叠加黄土拟合来评估可能的非线性关系。R 中的 car 包中的scatterplot.matrix函数可以很好地完成所有这些事情(可以在上面链接的页面中间看到一个示例)。
然而,虽然散点图矩阵是一个好的开始,但它们仍然只显示边缘投影。有几种方法可以尝试超越这一点。一种是使用 R 中的rgl包探索 3 维图。另一种方法是使用条件图;coplots可以同时帮助处理 3 或 4 个变量之间的关系。一种特别有用的方法是交互地使用散点图矩阵(尽管这将需要更多的努力来学习),例如通过“刷”。刷亮允许您突出显示矩阵的一帧中的一个或多个点,这些点将同时在所有其他帧中突出显示。通过移动画笔,您可以看到所有变量如何一起变化。更新:我忘记提及的另一种可能性是使用平行坐标图。这在不使您的响应变量不同方面有一个缺点,但可能很有用,例如,在检查 X 变量之间的相互关系时。
我还想赞扬您检查按收集日期排序的数据。尽管数据总是随着时间的推移而收集,但人们并不总是这样做。绘制折线图很好,但我建议您用自相关图和偏自相关图来补充它。在 R 中,这些函数分别是acf和pacf。
我认识到,从为您提供一个可以自动为您绘制所有图的工具的意义上,所有这些并不能完全回答您的问题,但一个含义是,您实际上不必像担心的那样绘制尽可能多的图,例如,散点图矩阵只是一行代码。此外,在 R 中,应该可以为自己编写一个函数/一些可重用的代码,这些代码将部分自动化其中的一些(例如,我可以想象一个函数,它接收一个变量列表和一个日期排序,对它们进行排序, 为每个带有线、acf 和 pacf 图的新窗口弹出一个新窗口)。