我如何设计一个知道何时与它交谈的人工智能?

人工智能 神经网络 机器学习 深度学习 人工智能设计 智能代理
2021-11-12 09:55:38

我正在尝试制作一个类似于钢铁侠中贾维斯的智能代理,但要简单得多。但是,我希望我的 AI 能够确定我是否在与它交谈。因此,我计划让它始终听我的声音并将其转换为文本。但是,我不确定如何训练 AI 识别是否有人在说话?

2个回答

短语检测而不是文本转语音

值得注意的是,检测特定短语或命令被认为是一个独特的问题,不同于文本到语音/文本转录。

虽然您可以简单地将它听到的所有内容转换为文本,然后在其中查找关键字,但可以使用专门的检测器直接尝试将传入的音频与一小部分命令进行匹配,从而获得更高的准确性和更少的处理能力。出于这个原因,这通常是商业产品中的首选方法。

但是,对于家庭自动化的初学者实验,您可能应该从选择现有的语音分析 API 开始,其中所有音频和自然语言部分都由其他人适当地实现。从零开始构建一个好的语音命令分析系统本身就是一项艰巨的任务,开发“人工智能代理”将是您的一臂之力;通常,您不想要一个项目,您必须解决两个主要的开放式问题,选择其中一个,然后您将有机会在那里实现一些有趣的事情。

Cheep 数字助理“AI”有一个呼叫词Hey, <AI's NAME> ,我想你想要的不止于此。

你可以训练它找出在某些情况下哪些词决定了你是否参与其中。如果您对网络的唯一问题是您是否正在与它互动或与其他人交谈,那么这就是您所需要的。

索引字典或让它通过收集单词来构建一个字典(从头开始构建字典是一个更好的解决方案,它在短期内节省空间,从长远来看更容易扩展)并根据在引人入胜的语音和非引人入胜的演讲或您希望它做什么。

以多字串索引为基础。

希望到最后,当您与 AI 互动时,您将有一个上下文表,而您肯定不是,并且有一些灰色区域。

训练过程漫长而乏味,但如果你记录了你在与 AI 交谈而不是在与 AI 交谈的情况,并且你将这些知识提供给它,并且你培育了网络,那么你应该让它能够确定上下文。

如果您在它长大的过程中必须坐下并握住它的手 2-72 小时,它可能会很痛苦,尽管您最终可能会得到更好的结果。