扩散核“指南”

计算科学 线性代数 机器学习
2021-12-13 19:18:25

扩散核是有关图的信息“投射”到Rn以便可以执行某些机器学习技术。

我通读了这篇论文,对这些内核背后的理论感到相当满意,但我正在寻找有关如何最好地应用它们的指导。

我面临的一个示例问题是它涉及计算etA对于大矩阵A,这不是一项简单的任务。我知道有时会发现etAx是一个更简单的问题 - 这是其中一种情况吗?得到的距离是我得到最好的使用,还是有进一步的“微调”方法?

如果它是相关的:我的问题本质上是“最近的邻居”。每个示例都是一组属性的“包”S, 在哪里S被结构化为一个本体(图)。因此,我想根据从图表中获得的信息,找到一些可以应用于示例的距离度量。


编辑:假设我有两点Rnxy. 我可以通过多种方法找到这些点之间的距离;最明显的是使用欧几里得||xy||.

现在假设我的观点不在Rn,而是在任意图中。我如何找到它们之间的距离?(说它们之间的“距离”是什么意思?)这是扩散核解决的问题。

我在很大程度上理解这个解决方案是什么,但实际上计算它更难。所以我正在寻求帮助来弄清楚如何计算这个。我认为看到有人逐步完成示例是理想的,但任何有关计算的指导都会有所帮助。


编辑2:我们有一个本体,如:

         Computer Science
         /               \
        AI             Theory of CS
      /   \               /        \
    NLP    Vision     Decidability   Computational Complexity

“可判定性”和“计算复杂性”有多相似?扩散内核所做的是它提供了一个内核来将这些数据投影到更容易测量的空间中。

1个回答

您的样本是S, 它是根据一个图构造的G. 你的问题的维度是基数S. 如果H是图拉普拉斯算子G, 然后xy:=xy|H|xy是一个度量。

然后,您的内核可能是并且您像其他人一样进行聚类分析。etd2