最新新闻
天津累计报告阳性感染者97例 具体情况是怎样的呢 姐姐出嫁弟弟全班男同学来送亲 这也太有排面了吧! 女记者与球员争执被取消采访资格 具体是什么情况 郑州累计报告本土确诊103例 具体情况是怎样的呢 女子捞蛤蟆被速冻成雕塑 这是什么画面 义务教育教师工资为政府必保支出 具体是什么情况 女子回应被隔离在相亲对象家 他是怎么说的呢 新东方:俞敏洪博客不代表公司观点 为何遭“打脸” 赫希睡垫-太赫兹波对人体的好处与市场远景 江歌母亲:待2037年起诉凶手 是否还会上诉 天津累计报告本土病例40+13 目前是什么情况 22岁女子回村1天被安排20场相亲 具体是怎么回事 河南安阳新增本土确诊58例 当地目前什么情况 数“聚”保定 共赢未来 深圳增4例阳性感染者 含一家三口 到底什么情况 多地要求低风险地区返乡也需核检 具体是什么情况 女子回村1天被安排20场相亲 这也太夸张了!! 河南安阳新增本土确诊58例 最新通报详情! 姐姐出嫁弟弟全班男同学来送亲 这场面太震撼了!! 天津返安阳大学生:亲属更早出症状 具体什么情况 四十多个"弟弟"送姐姐出嫁 这也太霸气了!! 姐姐出嫁弟弟全班男同学来送亲 这是什么场面【图】 张庭夫妇如何规避禁止传销法规 具体怎么回事 姐姐出嫁弟弟全班男同学来送亲 这个场面绝了!! 男子隔离被安排到花果山主题酒店 住进去是什么体验 深圳增4例阳性感染者 含一家三口 具体情况如何 31省新增本土110例 河南87例 具体情况通报!! 天津累计报告本土病例40+13 当地疫情最新通报 多地要求低风险地区返乡也需核检 这意味着什么 天津累计报告本土病例40+13 具体情况是怎样的呢
您的位置:首页 >产经 >

Alexa研究人员开发了一个2麦克风语音识别系统 击败了7麦克风阵列

2021-10-04 13:00:48   来源:
导读 众所周知,在语音识别中,两个麦克风比一个好。直观来说,这是有道理的:声波以不同的时间延迟到达多个麦克风,可以用来增强特定方向的信号

众所周知,在语音识别中,两个麦克风比一个好。直观来说,这是有道理的:声波以不同的时间延迟到达多个麦克风,可以用来增强特定方向的信号强度,同时减少其他方向的信号。然而,从历史上看,语音增强的问题——从噪声中分离语音——已经独立于语音识别而得到解决,并且文献表明这种方法产生不达标的结果。

然而,亚马逊Alexa部门的研究人员认为,他们已经开发了一种新颖的声学建模框架,通过统一语音增强和语音识别来提高性能。在实验中——当应用于双麦克风系统时——他们声称,与使用旧方法的七麦克风系统相比,他们的模型将语音识别的错误率降低了9.5%。

他们用两篇论文描述了他们的工作(“用于远程语音识别的频域多通道声学建模”和“用于远程语音识别的多维几何空间声学建模”),并计划下个月在布莱顿举行的国际声学会议和信号处理上发表演讲。

第一篇论文描述了一种多麦克风方法,它取代了独立的手动编码算法。这些算法确定波束形成器的方向(对传感器输出进行空间滤波以增强波的振幅),并通过单个神经网络识别语音信号。亚马逊目前的Echo扬声器阵容可以动态调整波束形成器,以适应新的声学环境。然而,通过在不同环境的大语料库中训练单个模型,研究人员可以取消适应步骤。

“晁盖的目的.技术是将单个(声束)导向任何方向,但这是一种计算密集型的方法,”Alexa Speech Group的语音科学家熊谷健一在一篇博客文章中解释道。“借助Echo智能扬声器,我们将多个波束形成器指向不同的方向,并确定产生最清晰语音信号的波束形成器.这就是为什么Alexa可以理解你的天气预报请求,即使电视在几码外肆虐。”

单个神经网络和传统模型都将波束形成器的输出以对数滤波器组能量或多个不规则频带中信号能量快照的形式传递给特征提取器。在传统模型的情况下,它们被归一化用于背景噪声的估计,提取器的输出被传递给人工智能系统,人工智能系统计算对应于不同“电话”或短语音信息单元的特征的概率。

根据本文作者的说法,如果模型的每个组件(例如,特征提取器和波束形成器优化器)单独初始化,性能将会得到提高。他们补充说,不同的训练数据使该模型能够处理不同设备类型的各种麦克风配置。

“在其他优势中,这意味着新设备或不太广泛使用的设备的ASR系统可以受益于更广泛使用的设备生成的交互式数据,”Kumatani说。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。