假设我有一组个矩阵。
的每一列都是分类向量。
我想找到映射 其中是一个矩阵,使得
被最小化。
选择 MSE 是因为代表一些连续事件的发生。
到目前为止,已经直接使用的元素。 s的交叉表的 bin 参数化。卡方给出了不好的结果。我选择了对称不确定性(信息论)。形成很容易表明,假设二元高斯分布,通过 Z 评分可以极大地减少误差,但是结果并不那么引人注目。(这个感觉不对,还是有很多错误。)
我正在为整个过程寻找一个经过充分研究的监督机器学习/拟合模型,考虑图形结构和交叉制表数据。到目前为止,我已经听取了计算机科学人员关于信念网络、循环神经网络、结构化 SVM 和多重对应分析的建议。多重对应分析是唯一的方法,虽然期望名义数据,但它不适合任何东西,也不能模拟联合 PMF。理想情况下,我希望模型是可解释的,而不是黑盒(如 SVM)。我在线性代数和编程方面比在统计方面要好得多。我考虑过构建一个嵌套模型并用随机梯度下降之类的方法来解决它。我愿意对任何建议进行实验。我有大量的 CPU 周期和训练数据,但没有好的模型。