我一直在尝试为“关联度量”提出一个正式的定义。一个直观的定义可能类似于“一个函数,它告诉你一组随机变量之间的依赖关系的存在或强度”。
我用这种直观的关联概念构建了以下定义。请注意,我使用了暗示,而不是双条件。这是为了允许一个函数告诉我们特定类型的关联,而不是一般的依赖。
给定具有实值随机变量的合适概率空间,阶数 n 关联的度量是函数使得。
但是,它有点短。这个定义并不真正涉及量化关联强度的任何概念。我一直在思考这样一个想法,即如果有足够的平滑度,也许可以用导数的方式进行一些表达。在下面的评论中,@whuber很好地总结了我对这个定义的不满:
将您的定义描述为关联指标会更准确。作为一个“量度”,它应该随着“关联”的某种性质而单调变化。这个问题围绕着什么可能构成一种属性,人们将其描述为量化“关联”的某些方面。主要困难在于“变量之间的依赖关系”是一个丰富而复杂的东西,任何单一的标量值函数都不能充分表征。AFAIK,这些事情没有公理化。
如何修改这个定义以包含量化关联强度的功能?