p值作为距离?

机器算法验证 多元分析 p 值 降维
2022-03-30 20:45:23

是否可以将多个成对测试之间的 p 值视为相似度/距离度量,并在 p 值的成对矩阵上应用多维缩放以降低维度?这是一个软问题,但这里最大的问题是什么,如何最好地克服?(例如:三角不等式?)

4个回答

一个特定的案例,其中 p 值是从测试生成的,被用作相似性,并且在本文中应用了多维缩放:http: //www.biomedcentral.com/content/pdf/1748-7188 -1-10.pdfχ2

如果所有“真实距离”都是 0,那么 p 值将遵循均匀分布,并且只是随机的、不正确的距离。
如果真实距离不为 0,那么您仍然存在缩放问题,其中测试统计数据可能更有意义。0.9 和 0.6 的 p 值在解释上差别不大,而 0.06 和 0.01 的 p 值在解释上差别很大,但 mds 算法会使前者之间的距离大于后者。您还应该考虑功效,您可能有 2 个组之间的距离非常小,但样本量很大,因此您得到的 p 值很小;然后是另一对,它们之间的差异很大,但由于样本量小(低功效),你会得到更大的 p 值。

我相信答案是肯定的。

可以考虑通过(例如)相关性来衡量两个变量之间的“相似性”。并且对于 p 值而言,相关性的显着性不同于 0。在这种情况下,小的 p 值(接近零)是反映变量之间较大距离(“差异”)的值。

您可以将 p 值转换为 z 分数(它们的“距离”必须与“通常”方向一致),并查看您提到的方法是否有意义......

我不确定您所说的“多个成对测试之间的 p 值”是什么意思。p 值是衡量特定测试的可能性/不太可能,如果零假设为真,则将某个值视为极端或比实际观察到的更极端。在进行成对测试时,一个 p 值和另一个 p 值之间没有特别的联系。我看不出如何将任何 p 值视为成对测试之间的相似性度量。