为什么大多数智能助手几乎不提供唤醒词的自定义功能(如果有的话)?

物联网 智能家居 智能助手
2021-06-20 23:32:03

大多数智能助手品牌,例如 Amazon Echo 和 Google Home,几乎没有提供唤醒词(用于唤醒设备的短语,以便它听你说话)的定制方式。

例如,Alexa 仅提供三种选择,而 Google Home 仅支持“OK Google”很多用户似乎对自定义唤醒词的想法感兴趣,但没有一个主要品牌增加支持。

是否有限制唤醒词自定义的技术原因,或者仅仅是品牌选择?

我读过Google 使用“OK Google”的动机,这表明品牌理念可能是正确的,但似乎唤醒词识别也不是很准确,这可能表明是技术原因。有没有人能够澄清哪个因素是主要原因?

2个回答

是的,有几个原因。

这篇博文解释了Echo和唤醒词Alexa。我来总结一下。

唤醒词识别在本地实时完成由于明显的处理限制,这限制了唤醒词的长度。此外,用户不想背诵一首诗来激活智能助手。因此,它必须是短的。

它在被调用时必须以几乎 100% 的准确度工作,并且在不需要时也不能确定地被识别这会产生问题,并且也会造成唤醒词最小长度。亚马逊允许Echo的选择非常令人惊讶,因为它只有两个音节

如果我们看看常见的嫌疑人,我们有Alexa(3 个音节)、Amazon(3)、Echo(2)、Ok Google(4)、Hey Cortana(4)Hey Siri(3)。所有行业巨头几乎都同意三个是一个不错的音节选择数。

奇怪的是,最想要的唤醒词“计算机”也有三个音节,很容易满足该要求。它也没有注册商标。

正如博客和理由告诉我们的那样,我们完全希望避免误报。让我们来看看 Computer、Siri、Cortana 和 Alexa 这几个词是如何建立起来的。这是 2008 年的 Google 图书语料库。

Ngram 计算机胜过 alexa 和 siri

确切地说,Siri 和 Alexa 对计算机几乎持平,Cortana出现错误。未找到。有道理,因为语料库是 2008 年的。为了让我们更多地了解为什么计算机是一个可怕的唤醒词,另一个图表。

计算机与其他单词的 ngram

这个 Ngram 显示了 2016 年两个最受欢迎的美国婴儿名字(货币),以及 Tom 和 Dave 也与计算机持平皇后、篮球和警察设法正确注册。无论如何,这让我们知道为什么到目前为止还不允许Computer、Earl Grey、Hot人们经常使用计算机这个词

关于误报的另一件事。Alexa 押韵几乎没有人会说。

与 alexa 押韵的 19 件事

计算机押韵 74 件事。

是否有任何技术原因限制唤醒词定制

当不使用辅助设备时,应用处理器(我认为 Alexa 和 Google Home 中的 ARM)会暂停并处于尽可能低的功耗状态。唤醒词检测由非常节能的 DSP 负责,DSP 会侦听环境噪声/声音并运行算法来决定是否与唤醒词匹配。如果它找到了一个具有良好置信度的匹配项,则 DSP 会唤醒 ARM 内核以继续进行其余的处理。

现在,由于目标是节能,所讨论的 DSP 会运行算法并将模板模式存储在片上存储器而不是主要的板载 RAM 上。这允许系统甚至将 DDR RAM 带到最低功耗状态。

由于 DSP 有许多关键的事情要做,而且片上内存很少,因此助手唤醒词仅限于少数几个可以由算法以高置信度匹配的精选词。