我正在寻找使用 ML 模型为任务提取数据的研究和经验,例如文本分析,并创建一个复制(或换句话说加密)输入数据的系统,然后在未来复制它而无需原始数据。
我感兴趣的是如何以这种方式使用 ML 模型来混淆信息,而不会使模型丢失太多信息,例如故意过度拟合以创建输入信息的新表示。
我正在寻找使用 ML 模型为任务提取数据的研究和经验,例如文本分析,并创建一个复制(或换句话说加密)输入数据的系统,然后在未来复制它而无需原始数据。
我感兴趣的是如何以这种方式使用 ML 模型来混淆信息,而不会使模型丢失太多信息,例如故意过度拟合以创建输入信息的新表示。
听起来您正在尝试压缩数据,然后稍后恢复相同的数据。
此任务最常用的工具是自动编码器。该模型接受数据作为输入,然后学习对其进行压缩和解压缩,以生成尽可能接近原始数据的内容。通过使自动编码器的中间层更窄,您可以使压缩更有损。通过使其更宽,您可以减少它的损耗。