为什么 Amazon Echo 不响应有关 Alexa 的广告或报告?

物联网 亚马逊回声
2021-06-16 22:34:56

我之前问过如果 Alexa由电视节目触发的,你可以做什么,但最近我意识到一件奇怪的事情:Echo不会响应 Echo 广告中的声音,即使声音说“Alexa,播放......”“Alexa,为……设置一个计时器”

我搜索了其他一些 Echo 社区,并发现了Reddit 上的一篇帖子,表明这是常见/预期的行为。但是,线程中没有明确的答案,所以我想我会在这里问一下,看看是否有人知道得更多。

我的 Echo 怎么知道回复电视广告?这只是一个共同事件,还是有什么东西告诉 Alexa 不要做出反应?

4个回答

根据这篇reddit帖子,除了检测唤醒词外,Alexa 还对音频频谱敏感。因此,正常的现实世界宽带信号被接受,但带宽受限的信号(假设在 4kHz 和 5hKz 之间的陷波)将被识别为来自广播。

这是有一定道理的,因为广播公司可能会使用带内信号来识别广告(用于本地化替换),并且通常应用于广告的音频处理可能会被优化以提高清晰度而不是保真度。可以设置过滤,以便以降低的敏感度监控典型广告,并且在特定广告的制作期间,也可以明确地降低敏感度。

新闻报道(据报道确实触发了 Alexa)更有可能使用完整的广播音频频谱(8 或 16 kHz)而无需处理。所以这个理论假设,要么很多广告都有一些特别之处(至少在某些地区),要么广告(例如亚马逊生产的广告)可以专门配置。

作为后续,这里报告一篇论文它描述了波形的微小(亚听觉)变化如何导致语音引擎返回与人类可识别的结果完全不同的结果。

我非常认为 Echo 中的唤醒词识别不仅仅是听唤醒词。它正在侦听警报上下文考虑一下来自Speech Technologies 的这段摘录

[A Wake-Up-Word] 具有以下独特要求:检测在警报上下文中说出的单个单词或短语,同时以几乎 100% 的准确度拒绝所有其他单词、短语、声音、噪音和其他声学事件,包括相同的在非警报(即参考)上下文中说出的感兴趣的单词或短语。

语音技术: Veton Kepuska 的唤醒词语音识别

这可以很容易地进行测试,因为设备(至少是我的)对句子“我最近正在和 Alexa 谈论滑雪”没有反应这不是一个警告上下文,它纯粹是参考性的。因此,Echo 内部的唤醒词识别引擎不仅可以聆听单词的纯外观,还可以聆听语调和前面的停顿,从而可以更准确地预测设备是否真的有人说话。

好吧,回声/Alexa 肯定会听到请求。如果您进入设置,向下滚动到“常规”,然后选择“历史记录”,您可以回放听到的所有请求。从商业广告中听到的所有请求都说“语音请求不是为您的 Echo 准备的——没有返回任何内容。”。

如果 1000 人说出警告词,它将有 1000 种不同的声学特征。如果他们再做一次,再做 1000 次。

如果 1000 个 Alexa 听到一个电视节目说警告词,它将有 1000 个相同的声学特征。

检测这个服务器端并不难。尤其重要的是,因为如果它们同时发生,语音记录服务器会收到大量流量。

如果这些事件的列表很小,他们甚至可以将签名下载到每个 Alexa。


此外,呼叫 Alexa 的用户听起来就像是Silence alert-word

一篇新闻文章听起来像是blah blah blah alert-word商业广告听起来像music_here 警报词。 完全不一样。