在机器学习的背景下,我看到了“地面实况”一词的使用频率很高。我进行了很多搜索,并在Wikipedia中找到了以下定义:
在机器学习中,术语“ground truth”是指训练集分类的监督学习技术的准确性。这在统计模型中用于证明或反驳研究假设。术语“ground truthing”是指为该测试收集适当的客观(可证明)数据的过程。与黄金标准进行比较。
贝叶斯垃圾邮件过滤是监督学习的一个常见例子。在这个系统中,算法被手动教导垃圾邮件和非垃圾邮件之间的区别。这取决于用于训练算法的消息的基本事实 - 基本事实中的不准确将与生成的垃圾邮件/非垃圾邮件判决中的不准确相关。
关键是我真的无法理解这意味着什么。是用于每个数据对象的标签还是为每个数据对象提供标签的目标函数,或者其他什么?