纵向数据的 SVM 回归

机器算法验证 回归 支持向量机 面板数据
2022-03-05 23:40:35

每位患者大约有 500 个变量,每个变量都有一个连续值,并在三个不同的时间点(2 个月后和 1 年后)进行测量。通过回归,我想预测新患者的治疗结果。

是否可以对此类纵向数据使用 SVM 回归?

2个回答

这是一个有趣的问题,我做了一个快速的研究。

OP询问了连续数据的回归。但是@Vikram 引用的论文仅适用于分类

Lu, Z., Kaye, J., & Leen, TK (2009)。纵向数据的分层 Fisher 内核。神经信息处理系统的进展

我发现的回归相关论文如下技术细节可在第 2.3 节中找到。

Seok, KH, Shim, J., Cho, D., Noh, GJ, & Hwang, C. (2011)。用于分析药代动力学和药效学数据的半参数混合效应最小二乘支持向量机。神经计算,74(17),3412-3419

没有找到公共软件,但作者在论文末尾声称易于使用。

所提出的 LS-SVM 的主要优点......是回归估计量可以很容易地通过软件求解一个简单的线性方程组来计算。这使得在实践中更容易将所提出的方法应用于重复测量数据的分析。

更详细地说,有两种使用SVM(支持向量机)进行回归分析的方法:

  • 支持向量回归 (SVR) [Drucker, Harris; 伯吉斯,克里斯托弗 JC;考夫曼,琳达;斯莫拉,亚历山大 J.;和 Vapnik, Vladimir N. (1997);“支持向量回归机”,神经信息处理系统进展9,NIPS 1996,155–161]
  • 最小二乘支持向量机 (LS-SVM) [Suykens, Johan AK; 范德瓦勒,乔斯 PL;最小二乘支持向量机分类器,神经处理快报,卷。9,没有。3,1999 年 6 月,第 293-300 页。]

前面提到的 Seol 等人。(2011) 采用了LS-VSM方法。

是的,这是可能的。除了在纵向数据中使用 Fisher Kernel 比 RBF 或线性数据更好。这篇 NIPS 论文中给出了与您类似的设置:http ://research.microsoft.com/pubs/147234/NIPS08.pdf