正如您所指出的,潜在的问题是组合问题,但我不明白您如何为文字赋予价值。
除了视觉之外,决定换行符的关键因素是节奏。(正如 Bob Salita 所说,还有其他因素,但你必须从某个地方开始。)
在我看来,您需要教计算机如何扫描与节奏有关的诗意短语。这显然是一项非常艰巨的任务,但音节和重音的数量是诗歌的基本数字数据。
为了验证人类的口味,您必须使用验证码众包方法,将节奏压力作为输入,并获得人类对不同换行配置的反应。然后你会加强积极的反应,人工智能会为观众量身定制换行过程。
然而,与其利用人类的品味和审美感受,不如让 AI 决定什么是首选,这可能由某种被认为对算法而言是最佳的对称性组成。
按照这个逻辑,您甚至不需要让 AI 学习重音,而只需关注原始音节或基于任何因素的数字表示。(使用这种方法,目的不是为人类重新格式化诗歌,而是为机器重新格式化:)
这更多是关于美学,但 Cameron Browne在游戏设计中的优雅似乎表明存在针对问题根源的美学问题类型的工程解决方案。
我可以先教它计算诗的音节,然后让它看除数。如果它大约是 10,它可能是抑扬格五音步。AI 不在乎标签,但它喜欢 10。
20 个音节可能代表该米中的对联:
时间不合时宜,哦,被诅咒的怨恨
我生来就是为了把它做好
我肯定会从给它喂老诗开始,尤其是那些保持严格节拍的诗人。我已经有一段时间没有读过斯宾塞之类的作品了,但我认为他那个时代的诗人会很有用。苏斯博士,也许是押韵对联的最伟大的掌握者,肯定会非常有用。
评估方法必须是模糊的,因为诗歌越现代,变异程度就会越来越大,最终导致自由结构,除了说唱等形式,它强烈利用规则化的节奏。机器学习都是关于估计和强化的,并且被证明在处理模糊性方面非常有用。
不能吐的龋齿死山口
是现代诗行的一个很好的例子:13 音节/2 的地板构成了 6 拍线。在与周围经文的上下文中理解这一点要困难得多,并说明问题的本质。即使正确地扫描这首诗来确定这一点也非常困难。
但是,同一作者的另一首诗非常有用:
十一月下旬在做什么/伴随着春天的扰动/和夏日炎热的生物,/和脚下扭动的雪花莲/和瞄准太高的蜀葵/红色变成灰色并跌倒/迟来的玫瑰充满了初雪?/ 滚滚的星星滚滚雷电 / 模拟凯旋的汽车 / 部署在星座战争中 / 蝎子与太阳作战 / 直到太阳和月亮沉没 / 彗星哭泣和狮子座流星雨 / 狩猎天空和平原 / 在一个漩涡中旋转将/世界带入那毁灭性的火焰/在冰盖统治之前燃烧
大约8个音节的所有行,由于大写,容易辨认。但真正的问题是:~136 13 行大约 10 个音节,还是 17 行大约 8 个?它会希望基于单词块进行计算(跨越音节阈值的单词,至少告诉你不能在哪里休息,并且应该可以统计地预测模式,至少对于正则化的诗句。)
受伤的外科医生在施展钢铁/质疑发情的部分;/ 在我们感到流血的双手之下 / 治疗师艺术的敏锐同情 / 解开发烧图表的谜团。
这节经文突出了这个问题。5 行,每行 4 拍,但音节:8、8、8、10、12。
最有可能的:
- 46/5 = 9.2
- 46/4 = 11.5
- 46/6 = 7.66
不太可能:
- 46/3 = 15.3
- 46/2 = 23
- 46/7 = 6.57
2 行具有不太完美的对称性,但 5 行更有可能,基于音节的总数和可能的选择,方差最小。
最终它会寻找底层结构,或者缺乏结构,并尝试将完整的文本重新组织成接近原始结构的东西。虽然并不总是需要精确性,因为该过程最终是主观的,并且目前难以处理,但某些错误的选择会产生灾难性的结果。
在前面的示例中,它可能能够辨别 5 行模式的可能性,但它必须弄清楚在哪些行上放置额外的音节。区分小品词和其他词类提供了一个线索,因为诗人的语言非常紧凑:有 19 个名词、动词或介词。
更有可能: - 19/5 = 3.8 - 19/4 = 4.75
不太可能: - 19/3 = 6.33 - 19/6 = 3.16 - 19/7 = 2.71
进一步分析可能会缩小范围。但极其规范的诗句仍然是最好的起点。大约10个音节的7行是“诗意的”:
'那个藏着他的金子的
老人被抽筋、痛风和痛苦的痉挛所困扰;
他的宝藏几乎无人看管,
但他像枯萎的坦塔罗斯一样坐着,
将他智慧的收获放在无用的谷仓里;
对他的收获没有其他的快乐,
只是因为它无法治愈他的痛苦而感到痛苦。
它关心 X 和 Y 值。
最初,您希望将其保留为一种语言,因为音节可能会受到不同的处理。也就是说,让 AI 寻找像Dactylic hexameter这样的东西会非常有用,因为你可以喂它 Homer。你也可以用许多不同形式的英语米,以及几乎所有其他生活语言给它喂荷马。根据定义,AI 会重视此类作品,因为 max number_of_translations 提供了最强大的数据集。当它开始重视意义时,这一点尤其重要。
理解处理音节的不同方法(长/短与重读/非重读)也将是必不可少的,因为它过渡到更现代的诗歌。
这是基本英语仪表的一个很好的链接。 Iambic 和 Trochaic 仪表将很容易,而使用 Anapests、Dactyls 和 Spondees 的仪表将更具挑战性。
然而,在某些情况下,这些在数学上是可以互换的。
我去了爱的花园,/看到了我从未见过的:/中间建了一座小教堂,/我曾经在果岭上打球的地方。
上面的行是抑扬格/抑扬格还是dactylic/anapestic无关紧要,它仍然是大约8个音节的4行。因此,“我去了爱的花园”与“受伤的外科医生打架”是一样的,尽管台词的节拍分别是 3 和 4。
它还应该有一个节标记,(可能是 00?)。因为它在模式中寻找模式,所以节很有价值。并非所有诗歌都有节结构,但可以说可以。确定小节是否合适,部分原因在于获取音节除数,将诗歌分解为 number_of_lines,然后查看该数字的除数。
它需要一个附加功能才能识别含义模式。例如,专有名词的重复是戏剧的标志。(从意义的角度来看,imo,plays 是理想的起点,因为标记很容易学习,并且名称都属于一个集合,并且暗示着交流。它在功能上与任何其他标识符没有什么不同,而且都是一个概念计算机“理解”。)
最终,它会想要寻找语音模式、押韵和近押韵,这也将是换行的潜在好地方的指标。
它可以查看一个非常大的数据集,谁知道它可以识别什么?