良好的在线资源,其中包含在各种条件下绘制两个数值变量之间关联的技巧

机器算法验证 数据可视化 相关性 教学 经验法则 散点图
2022-01-18 23:29:57

语境:

在此期间,我获得了一组关于如何有效绘制两个数值变量之间关联的启发式方法。我想大多数使用数据的人都会有一套类似的规则。

此类规则的示例可能是:

  • 如果其中一个变量呈正偏态,请考虑在对数刻度上绘制该轴。
  • 如果有很多数据点(例如,n > 1000),则采用不同的策略,例如使用某种形式的部分透明,或对数据进行抽样;
  • 如果其中一个变量具有有限数量的离散类别,请考虑使用抖动或向日葵图;
  • 如果有三个或更多变量,请考虑使用散点图矩阵;
  • 拟合某种形式的趋势线通常很有用;
  • 将绘图字符的大小调整为样本大小(对于较大的n,使用较小的绘图字符);
  • 等等。

问题:

我希望能够将学生推荐到一个网页或网站,这些网页或网站解释了这些技巧和其他技巧,可以有效地绘制两个数值变量之间的关联,也许还有例子。

  • 互联网上是否有任何页面或网站可以很好地做到这一点?
2个回答

我想不出有什么好的在线资源,但是Brendan O'Connor 和 Lukas Biewald 的书籍章节讲述了如何以一种深思熟虑的方式直观地探索大型多维数据集。 Beautiful Data的章节(警告:链接直接指向 PDF)这一章作为教学资源特别有用,因为它将 R 代码融入了叙述中。

此外,经过进一步思考,我认为 John Tukey 的经典作品“Some Graphic and Semigraphic Displays”(方便地发布在 Edward Tufte 的网站上)是对可视化的非常精彩的介绍,尽管有些特殊。

不知为何,我似乎在想书的章节……

近期参考:

较旧但相关的资源