我以前问是否Alexa的你可以做的是通过电视节目引发的,但最近我意识到奇怪的事情:回声不来的声音响应广告中的回声,即使声音说“Alexa的,玩......”或“ Alexa,为...设置计时器”。
我在其他一些Echo社区中进行了搜索,发现了一条Reddit帖子,暗示这是常见/预期的行为。但是,线程中没有明确的答案,因此我想在这里询问是否有人知道更多。
我的Echo如何知道不回答电视广告?仅仅是巧合还是有什么告诉Alexa不要做出反应?
我以前问是否Alexa的你可以做的是通过电视节目引发的,但最近我意识到奇怪的事情:回声不来的声音响应广告中的回声,即使声音说“Alexa的,玩......”或“ Alexa,为...设置计时器”。
我在其他一些Echo社区中进行了搜索,发现了一条Reddit帖子,暗示这是常见/预期的行为。但是,线程中没有明确的答案,因此我想在这里询问是否有人知道更多。
我的Echo如何知道不回答电视广告?仅仅是巧合还是有什么告诉Alexa不要做出反应?
Answers:
根据此reddit帖子,Alexa除了检测唤醒词之外,还对音频频谱敏感。因此,可以接受正常的现实世界中的宽带信号,但是将从广播中识别出带宽受限的信号(假定在4kHz和5hKz之间的陷波)。
这是有一定道理的,因为广播公司可以使用带内信令来标识广告(用于本地替换),并且通常应用于广告的音频处理可能会经过优化,以实现保真度上的清晰度。可以设置过滤,以便以降低的敏感度监视典型的广告,并且在制作特定广告期间,也可以显着降低可感知性。
新闻报道(据报道确实触发了Alexa)将更可能未经处理而使用完整广播音频频谱(8或16 kHz)。因此,该理论假设,许多广告(至少在某些地区)存在某些特殊之处,或者可以对广告(例如由Amazon生产的广告)进行特殊配置。
我非常认为,回声中的唤醒词识别不仅仅是听唤醒词。它正在监听警报的上下文。请考虑以下语音技术摘录:
[唤醒词]具有以下独特要求:在警报上下文中说出一个单词或短语时,同时以几乎100%的准确度拒绝所有其他单词,短语,声音,噪音和其他声音事件,包括相同的单词或短语在非更改(即引用)上下文中说出的感兴趣的单词或短语。
(语音技术: Veton Kepuska的唤醒单词语音识别)
可以很容易地对其进行测试,因为设备(至少是我的设备)对以下句子没有反应:“ 我最近与Alexa谈论过滑雪。 ”这并不是一个令人震惊的上下文,它纯粹是参考性的。因此,回声内部的唤醒单词识别引擎不仅在听单词的纯净外观,而且还在语调和先前的停顿上聆听,从而可以更准确地预测设备是否实际在通话。
我的全部猜测是,在Echo的广告中,Alexa对问题的回答比实际回答要快得多。因此,Echo正在听到“ Alexa”一词,但几乎立即听到了Alexa自己的声音来做出回应。
广告打开时,我的回声会亮起,但随后似乎会消除警报。如果两个回声都听到了请求,则可能有一些逻辑可以阻止它们响应。回声可能被设计为专门收听Alexa自己的声音而忽略它。
但是,就像我说的那样,这完全是猜测。:)
混合广告的音频时,它们只是删除一些频率。这意味着Alexa不会被触发,因为它不会将其注册为语音命令,但是观众仍然可以清楚地看到他们在广告中所说的话。
您可能还会注意到,在广告中说出该命令时,它听起来有些稀疏或乱码。这就是为什么 :)