1. 首页 > 英语一对一线上外教

从“Hey Siri”到“Siri”的一小步,苹果语音识别的一大步


“嘿 Siri,给我讲个笑话”,相信很多 iPhone 用户都曾尝试过与苹果智能语音助手 Siri 对话,但在未来,大家与 Siri 聊天时可能要换个词。日前有消息称,苹果计划将智能语音助手Siri的唤醒词从“嘿Siri”简化为“Siri”。这一变化预计将在 2023 年或 2024 年的某个时候推出,Apple 正在将 Siri 集成到第三方 APP 中,为用户提供更多上下文和帮助。

在线识别字体_英语在线读音识别_英语识别在线

作为苹果公司推出的智能语音助手,早在2011年就出现的Siri无疑是近十年来手机厂商在AI领域探索的代表之一。尽管苹果未来只是去掉了“嘿”这个词,但这个小小的改变代表了苹果AI技术的巨大进步,也意味着苹果在智能语音助手领域赶上了竞争对手亚马逊。. 毕竟长期以来英语识别在线,尽管作为智能语音助手领域的先行者,Siri却被用户吐槽“有点笨”、“不聪明”。

从“Hey Siri”到“Siri”,体现了苹果在语音识别技术上的重大突破。就像每个人都有自己的名字一样英语识别在线,智能语音助手其实也需要特定的词汇来让自己知道用户在呼唤自己。某种程度上,唤醒词也是智能语音助手品牌形象的重要组成部分。通过语音助手每次启动时发出的唤醒词,消费者对品牌的记忆就是这样日复一日。它在重复过程中不断加强。

英语在线读音识别_英语识别在线_在线识别字体

那么为什么智能语音助手一定需要唤醒词呢?这是因为智能语音助手不可能24小时在线,需要保证只有在用户需要的时候才进入工作状态,其他时间保持休眠状态。相较于按专属按键唤醒或点击图标唤醒等触控唤醒机制,使用特定的唤醒词激活智能语音助手更符合这款产品的特点。

语音唤醒称为keyword spotting(以下简称KWS),即在连续的语音流中实时检测说话人的特定片段,这个特定片段就是唤醒词。一般来说,如果不手动禁用语音助手,后者会作为系统级服务长期留在后台。但智能语音助手作为一项需要大量AI算力的功能,在工作状态下需要大量的性能开销,功耗也会相应增加。

在线识别字体_英语在线读音识别_英语识别在线

面对这个问题,开发者想出了一个解决方案,通过专用于语音唤醒的低功耗协处理器实时监控麦克风。当检测到相似的按键唤醒词时,语音助手将从休眠状态切换到工作状态。这种策略的好处在于,除了减轻设备的续航压力外,还能避免语音助手一直在工作,处理不发送给自己的音频信息。

事实上,语音唤醒的难点主要是低功耗和用户临时需求之间的矛盾。一个能够有效唤醒语音助手而又不会导致系统误判的唤醒词,也是整个KWS机制的核心。你一定发现了,国内市场智能语音助手的唤醒词往往是“天猫精灵”、“小爱同学”、“小度小度”等4个字。这是由于汉语发音和音节的关系。字数可以简单理解为音节数。

英语识别在线_在线识别字体_英语在线读音识别

在线识别字体_英语识别在线_英语在线读音识别

为什么起床词一般是4个音节,而不是中国人更习惯的3个音节或2个音节?这是因为音节越短,误醒的问题就越严重。但如果音节较长从“Hey Siri”到“Siri”的一小步,苹果语音识别的一大步,就会从词组变成句子,会降低用户的交流体验。同理英语识别在线,“嘿”是英文语气助词,就像中文语境中的“你好”一样。就是增加唤醒词的音节,让系统更准确的判断监听的声音是在跟谁说话。的。

反过来说,省略了“嘿”,意味着苹果的KWS技术有了长足的进步,已经可以做到只用一个词就判断用户意图的程度。之所以能够达到这种效果,其实技术原理并不复杂。苹果大概率是通过声纹识别技术实现了人声的定向分离,然后使用带有声纹识别编码器的卷积神经网络。准确捕捉目标用户的声音。

英语识别在线_在线识别字体_英语在线读音识别

到目前为止,谷歌相关设备仍然需要通过“OK Google”和“Hey Google”来唤醒Google Assistant。其中一个重要原因是“Google”这个词本身已经深入到用户的日常生活中,所以并不冷门,只是将这个词作为唤醒Google Assistant的“钥匙”,难免会导致误报频发唤醒。相比之下,Siri这种被创造出来的词汇,适用范围非常狭窄。iPhone只需监测与“Siri”发音相匹配的声纹,即可判断用户是否需要使用智能语音助手。

而且值得一提的是,据悉苹果还计划让Siri与第三方应用结合,这将大大提升Siri的易用性。要知道,前 Siri 团队的一些成员表示,领导力的缺失和管理层的不断变动,拖慢了 Siri 的进步。最重要的原因是苹果的封闭模式并没有为Siri破例。,并且没能给第三方开发者更多机会去创造更有用的 Siri 应用。

在线识别字体_英语在线读音识别_英语识别在线

在Siri登陆iPhone或者被收购之前,其创始团队其实是希望有一个第三方的开发生态,而这也被后来的多款智能语音助手实现了。例如,Siri最初希望实现的餐饮预订功能包括日期、地点、菜品等多个元素,而不是简单地搜索餐厅的订单号。

在线识别字体_英语在线读音识别_英语识别在线

未来英语识别在线,Siri将能够接入第三方应用,这意味着苹果智能语音助手可以借助第三方的力量,赋予自己更多的功能,完成更多的任务。如果此消息属实,则意味着在多年被忽视之后,Siri 可能正在崛起。

【本文图片来源于网络】

本文来自微信公众号,36氪授权发布。

本文由佚名发布,不代表阿卡索英语培训 - 英语一对一线上外教培训!立场,转载联系作者并注明出处:/xians/3450.html

联系我们

在线咨询:点击这里给我发消息

微信号:weixin888

工作日:9:30-18:30,节假日休息