什么是机器学习中的“代理数据集”?

人工智能 机器学习 数据集 术语
2021-11-14 16:43:20

与年龄相关的黄斑变性的高分辨率合成视网膜图像生成的深度生成模型评估论文以这种方式使用术语“代理数据集”

开发用于合成高分辨率真实眼底图像的深度学习技术,作为视网膜专家和深度学习机器使用的代理数据集

我用谷歌搜索了这个术语,但没有找到“代理数据集”的定义。什么是机器学习中的“代理数据集”?

论文Analysis of Manufacturing Process Sequences, Using Machine Learning on Intermediate Product States (as Process Proxy Data)提到了一个类似的术语

基于产品状态的视图的优点是关注产品本身来构建整个过程中涉及的信息和数据。为此目的使用中间产品状态作为代理数据

“代理数据”与“代理数据集”的含义相同吗?

1个回答

在计算机科学中,如果你说“A 是 B 的代理”,那么这意味着“A 替换 B”(暂时或不替换),或者“A 被用作 B 的中介”。

术语“代理”通常是指服务器,即所谓的代理服务器,它们直观地做同样的事情(即它们用作中介)。下面这张图值1000多字。

在此处输入图像描述

让我们回到你的上下文。在以下段落中

开发用于合成高分辨率真实眼底图像的深度学习技术,作为视网膜专家和深度学习机器使用的代理数据集。

深度学习技术将用于生成数据,这些数据将用作视网膜专家使用的真实数据的替代品。

在你的第二段

基于产品状态的视图的优点是关注产品本身来构建整个过程中涉及的信息和数据。为此目的使用中间产品状态作为代理数据

甚至使用了“中间”这个词,因此应该不需要进一步解释,虽然我承认我不知道在这种情况下“产品状态”是什么,但它们将被用作“代理数据”其他数据。

“代理数据”是否与“代理数据集”的含义相同,如果是,我将阅读那篇论文。

我猜是这样,但请记住,“数据”比“数据集”更通用。

我发现“代理数据”这个表达方式的其他稍有不同的用法,不是在计算机科学的背景下,而是在古气候学的背景下。例如,看看这篇网络文章什么是代理数据?.

为了完整起见,这里有一些 proxy 的字典定义

赋予某人为他人行事的权力,例如在选举中投票给他们

一个你选择为你正式做某事的人

与另一种情况等进行比较的情况、过程或活动