机器学习能否应用于破译失传的古代语言(即多年前使用但目前未在人类社会中使用并已被遗忘的语言,例如阿维斯坦语)的文字?
如果是,是否已经有任何成功的实验来使用机器学习破译未知古代语言的文字?
机器学习能否应用于破译失传的古代语言(即多年前使用但目前未在人类社会中使用并已被遗忘的语言,例如阿维斯坦语)的文字?
如果是,是否已经有任何成功的实验来使用机器学习破译未知古代语言的文字?
我猜不会,因为如果语言是未知的(没有可用的数据),那么我们将没有机器学习算法可以从中学习的训练数据。
如果它与某种已知语言有关,那么一些统计分析可能会导致对解密的猜测(假设两种语言之间存在某些相似性)。
如果对一般语言解密感兴趣,请参阅以下内容,他们使用有关感兴趣语言的可用信息来解密脚本:http ://www.aclweb.org/anthology/W99-0906 。他们利用期望最大化算法。
我确信更多的谷歌搜索可以导致其他使用机器学习算法的示例,但它们很可能有一些已知信息或大量假设,以使我们的问题范围更容易。
我说是的,绝对可以。但我同意 Skim 你需要一些信息作为起点。埃及象形文字只是(最近)在发现罗塞塔石碑后才被理解(https://en.m.wikipedia.org/wiki/Rosetta_Stone)。使用已知和未知语言的相同消息,程序可以找到/a 相关性。如果没有这些信息,您将不得不猜测消息的潜在内容。结果会偏向于确认:你怎么知道它工作正常?假设程序设法“翻译”,输出一个关于香蕉的连贯短语,太棒了。即使它在多个样本和 99% 的置信度中非常一致,但如果没有任何“控制集数据”,它也可能很容易成为鱼,甚至是对超级碗冠军的预言。仍然是一个有趣的项目。
这里有一篇学术论文研究了一种解读古代语言的神经方法:-
(https://arxiv.org/pdf/1906.06718.pdf)
“在本文中,我们提出了一种新的神经方法来自动破译丢失的语言。为了弥补缺乏强大的监督信号,我们的模型设计是根据历史语言学中记录的语言变化模式来设计的。该模型利用了一个表达序列-to-sequence 模型来捕获同源词之间的字符级对应关系。为了以无监督的方式有效地训练模型,我们通过将其形式化为最小成本流问题来创新训练过程。当应用于 Ugaritic 的解密时, “我们实现了 5.5% 的绝对改进,超过了最先进的结果。我们还报告了破译线性 B 的第一个自动结果,这是一种与古希腊相关的音节语言,我们的模型正确翻译了 67.3% 的同源词。” ——罗家明、曹元、和里贾纳·巴齐莱。“通过最小成本流进行神经解密:从 Ugaritic 到线性 B。”arXiv 预印本 arXiv:1906.06718 (2019)。
外行的进一步阅读和文章:-
我会说这取决于该语言是否想要被破译。
密码学的起源可以追溯到公元 700-800 年左右。我们可能不知道掩盖这些文本的方法。一个这样的例子是五角星的小放逐仪式,它只是偶然发现的,它形成了西方全新的深奥复兴的基础,词典包括构成今天这些命令使用的词典的基础。
这个仪式以 INRI 字母为中心,传统上说该字母写在耶稣基督的十字架上,是犹太人之王拿撒勒人耶稣的缩写。然而,关于玫瑰十字会魔法传统中的这四个字母,还有许多其他级别的神秘含义。其中之一是拉丁短语“Igne Natura Renovatur Integra”所暗示的密封秘密,意思是“通过火,自然得到完美更新”。这四个字母还装饰了 Ordo Rosae Rubaee 和 Aureae Crucis 的行家所佩戴的 Rose Cross Lamen 角的光线。
更深层次的解释隐藏在希伯来字母和魔法力量对卡巴拉生命之树路径的归属背后。归于希伯来字母 y 的路径也归于处女座,n 归于天蝎座,r 归于太阳。在处女座与埃及女神伊希斯、天蝎座与阿波菲斯以及太阳与奥西里斯之间还存在着更多神奇的联系。当从这些神的名字中取出第一个字母时,就形成了“IAO”这个名字。此外,由于与伊希斯、阿波菲斯和奥西里斯相关的星座,它们形成了字母“LVX”。
因此,在字母 IRNI 中隐藏着字母 IAO 和 LVX,这也可以在 RR 和 AC 的专家佩戴的玫瑰十字拉曼的角度光线上找到 IAO 这个名字被诺斯替教认为是至高无上的名字上帝的。它的信件进一步暗示了炼金术中的盐、硫和水星,以及以伊希斯、阿波菲斯和奥西里斯之间的关系为象征的更深奥的秘密。
所以我想说,机器学习要能够破译真实的语言,它几乎必须是直观的,能够绘制平行线并将各种参考点连接在一起。它必须确定事物的含义,很多时候,这几乎是不可能的。
你的变量是无限的。你没有真正的方法来找出它们是什么。再加上这个背景、词汇、故意混淆、文化和时间的流逝,我认为期望机器学习提供很多帮助是不现实的。