半监督学习中标签正确性的概率

数据挖掘 监督学习 无监督学习 标签 半监督学习
2022-02-16 18:12:02

我知道存在半监督学习方法,例如梯形网络,其中只有一部分数据被标记。是否有任何方法或论文考虑该训练数据子集标签的正确概率?也就是说,一些标签可能以 100% 的概率正确,而其他标签可能只有 70% 或 45% 的正确概率。高度赞赏任何指向该方向的论文或工作的链接。

1个回答

我不知道任何论文,如果有人能链接一些,我将不胜感激。

就我而言,我总是通过使用“传统” 67% - 33%(训练 - 测试)拆分并检查标签在各种指标(准确度、对数损失等)中的表现如何取消标记我已知的标记数据来进行测试.

此外,还有各种类别的半监督学习。例如,如果您使用主动学习(基于池的方法,每次包括增量样本),您可以查看性能范围。

最后,您也可以在相同意义上使用交叉验证来调整半监督学习算法的超参数。总而言之,在我看来,半监督学习还有很多东西可以提供,而且您的问题可能更多的是领域、数据特定和可视化数据和聚类可能会给您新的见解。