查找 MNIST 数字之间的相关性

数据挖掘 熊猫 相关性 极简主义
2021-09-23 06:01:36

什么方法可以正确计算来自 MNIST 的数字“1”和数字“7”图像之间的相关性?取所有数字“1”像素和数字“7”像素的平均值来计算它们之间的相关性是否正确?

2个回答

你不能。相关性是衡量一个变量随着另一个变量变化而变化的度量。一个上升一定量,另一个通常也会上升:正相关。等等。

您可以计算的是,与 7 的图像相比,1 的图像有多相似或有多不同。您可以平均每个图像的所有图像,方法是对图像求和以获得具有非常高像素值的图像,然后将所有像素值除以求和的图像数量。

然后,您可以将平均值 1 和平均值 7 表示为 784 像素的长向量,并计算这两者之间的距离作为它们相似度的度量。

比较 MNIST 数字的一种方法是计算距离。每个图像都可以转换为长度为 784(28x28 像素)的向量。然后可以计算任意两位数之间的欧几里得距离。