我对以对数刻度显示在这些散点图中的一些垂直线感到困惑。人口在 y 轴上,具有面板标签中提到的属性的邻域的比例在 x 轴上。这只是转型的产物吗?(我想这可能是由于数字偏好或类似的原因,但我想不出在人口普查数据的这个数据集中这怎么可能。)

我对以对数刻度显示在这些散点图中的一些垂直线感到困惑。人口在 y 轴上,具有面板标签中提到的属性的邻域的比例在 x 轴上。这只是转型的产物吗?(我想这可能是由于数字偏好或类似的原因,但我想不出在人口普查数据的这个数据集中这怎么可能。)

我看到这些线总是在 ,例如在左下角的面板中, 的比例对应于 的人口。我认为在计算价值时使用了人口。
比如,可能人口普查没有记录“小区华人比例是多少”,而是“小区有多少华人”。答案是 $1, 2, 3,\ldots$ 等。自动地,给定 $N$ 的人口规模,相应的值将是 $\frac{1}{N}$, $\frac{2}{N} ,\ldots$ 等。这些将对应于第一条左下角线,第二条左下角线,依此类推。 etc. And automatically, given population size of , the corresponding values will be , etc. These will correspond to the first lower-left diagonal line, second lower left diagonal line and so forth.
这是由于类成员数量较少的整数效应。
考虑左下角的“非菲律宾人”图表。请注意左下方的线如何通过点 (-3,3)。该点对应于在附近 10 ^ 3 美元的人中对非菲律宾人的 1 次观察。另请注意,对于中文图,线穿过相同的 (-3,3),对于禁用图也是如此。这些线还通过 (-4,4) 点——$10^4$ 人中的一个观察值。如果您考虑 3,500 人中的一个观察值的位置(在 (-3.54,3.54)),您可以看到这条线是如何生成的。 people in the neighborhood. Note also that for the Chinese graph, the line goes through the same (-3,3), and likewise for the Disabled graph. The lines also go through the (-4,4) point - one observation out of people. If you consider where one observation out of 3,500 people would lie (at (-3.54,3.54)), you can see how the line gets generated.
右边的下一行穿过看起来比第一行大 0.3 x 单位的点;这是对应于 Not Filipinos、Chinese 或 Disabled (log10(2) = 0.3) 的两个观察值的行。由于您无法在 1 和 2 Not Filipinos 之间观察,因此两条线之间存在间隙。
这些事情发生了,我自己也看到过类似的情况。