达到超低错误率 IBM语音识别软件已接近人类水平
你知道在对话过程中,一个人听错或漏听字词的概率是多少吗?在我们听到的20个词中,普通人一般会听错或漏听1到2个词。这意味着,在5分钟的对话中,你可能会错过80个词。但是,对大多数人来说,这并不会构成沟通障碍。可是,如果和一台电脑对话呢?
3月7日,IBM宣布说,该公司的语音识别软件的错误率已经降到了5.5%。美国《软件开发时代》3月8日报道说,人类的语音识别错误率大约为5.1%,这意味着,IBM的语音识别软件已经与人类的语音识别能力非常接近。
IBM总裁弗吉尼亚·罗曼提 据美国《商业内幕》3月9日报道,IBM此前曾创造错误率仅为6.9%的语音识别记录,但在2016年,微软宣布其语音识别软件的错误率仅为6.3%。但5.5%并不是IBM的最终目标,IBM也将人类的语音识别错误率5.1%设定为自己的目标。
“现在还不是庆祝的时候。”《软件开发时代》引用IBM科学家乔治·桑恩的话说,“我们将继续致力于创造一种能够跟得上人类耳朵、声音和大脑的交互相的软件。现在的成果让我们充满动力,未来的工作也会在目前工作的基础上进行,最重要的是,我们想要达到最高的标准。”
IBM早期研究语音识别的科学家 《商业内幕》说,这一突破对智能手机中的人工智能软件,比如Siri和谷歌助手等来说是一个积极信号。
尽管取得了可喜进步,但这一技术距离识别人类自然对话仍有不小距离。“识别人类的对话依然是一个巨大的挑战,因为人类的对话,特别是自然而然的对话,是非常复杂的。”美国哥伦比亚大学计算机科学系教授朱莉娅·希尔施贝格说。
哥伦比亚大学计算机科学系教授朱莉娅·希尔施贝格 尽管因为音调和习惯用语等问题,这一软件识别人类的自然对话尚有一定距离,但对机械朗读的识别程度已经很多。
此外,IBM介绍说,5.5%低错误率是通过长短期记忆、WaveNet语言模型和三个强声学模型实现的。而这一结果则是使用SWITCHBOARD和CallHome语料库测试得出,具有相当的权威性和业内认同。
声明:OurSeo登载此文出于传递更多信息之目的,并不代表本站赞同其观点和对其真实性负责,请读者仅作参考,并请自行核实相关内容。如有侵权请联系我们,会及时删除,如若转载请注明出处。