如何解读这个“Zipf”(生存、战争伤亡)情节?

数据挖掘 可视化
2022-02-13 11:15:00

请帮我解释一下这张图表?

X 和 Y 轴在这里是什么意思?(我直接问了作者,但由于某种原因他们没有回应。)

关于“生存功能”在这里可能意味着什么的任何想法?


从 1800 年至今的战争伤亡人数,n 个数据点 从 1800 年至今的战争伤亡人数,n 个数据点

2个回答

这里,生存函数 Y显示当存在时个体的生存概率X战争伤亡。如果X接近于零,生存概率将接近于一。

当变量Y(生存函数)取决于X(战争伤亡)基于齐夫定律,这意味着

Y=CXα
这是幂律关系如果我们取关系的对数,我们有
logY=αlogX+logC
通过设置X=logX,Y=logY, 和C=logC, 它成为了
Y=αX+C
这意味着如果我们绘制变量的对数(log-log plot),我们应该看到一条斜率为负的线。当然,在现实世界的场景中,变量会近似地遵循这种关系。例如,在图中,斜率变得更接近于零,当X更小。

请注意,在图中,值仍显示原始变量Y(介于 0 和 1 之间)和X(以百万计)。

当您查看图表时,您可以看到纵轴代表某种生存函数,横轴定义战争伤亡。如您所见,伤亡人数越高,生存率/功能越低,反之亦然。存活率越高,伤亡人数越少。每个点代表每个记录。最有可能的是,您需要研究如何定义生存函数才能真正获得一个很好的理解。