标准的统计工具是相关系数(参见 Michael Chernick 的回答),它是 [-1,1] 之间的值,并且与单位无关。与相关系数相关的是协方差。协方差受单位影响,但可能更容易解释。但是,在一般情况下,我不喜欢这些选项中的任何一个。我不喜欢它们,因为它们不是独立的保形转换。考虑到直线水平或垂直线被这两种措施都认为是非线性的。
更好的无单位选项是使用奇异值分解 (SVD)。SVD 将数据分解为按其对整体的贡献大小排列的组成部分。因此,最大奇异数与第二大奇异数的比率是线性度的度量。请注意,要使用此方法,您必须首先集中数据(使平均 X、Y、Z 等坐标为零)。
示例:积分:1126640.141 233575.2013;1126630.008 233572.8567;1126625.829 233572.7434;
1126625.416 233577.3781;
集中积分:9.792639127 0.656480018;-0.340591673 -1.68817349;-4.519928343 -1.801499913;-4.932119113 2.833193384;
SVD,D矩阵:11.86500017 0;0 3.813448344
奇异值之比 3.111357
上面的比率可以粗略地解释为数据在最佳拟合线方向上的长度是交叉线性方向的三倍。
对于具有单位且不需要 SVD 的单位的解决方案。做一些以线的中心作为参数之一的线拟合。使用上面的集中数据很简单:线 pt = 0 0(集中数据总是如此)线方向 = -0.999956849 -0.009289783
从线的中心到每个点的向量是这些点的中心坐标。求这些向量在直线上投影的长度(向量点直线方向的绝对值)和垂直向量分量的长度(向量交叉直线方向的长度)。长度平行,长度垂直9.798315123,0.565480194;0.356259742、1.684936621;4.536468847、1.759433021;4.905586534、2.878889448;
平行投影的最大值是沿线的数据延伸。垂直投影的最大长度是非线性的量度。两者的比率是上述奇异值比率的近似值。
注释 1. 线性的仿射不变性是不可能的。考虑一下,在仿射变换中,我们可以将除一个坐标轴之外的所有坐标轴缩放到接近零(使任何一组点成为线性)。所以共形不变性是我们能做到的最好的。2. 这些方法对异常数据不可靠。3. 示例是二维的,但可以推广到 N 维。