微軟語音識別出錯率達5.1%創(chuàng)新低 比肩專業(yè)速錄員
2017-08-22 09:25:55
來源:鳳凰科技??
微軟公司
鳳凰科技訊 據(jù)科技博客TechCrunch北京時間8月21日報道,微軟公司在當?shù)貢r間周日宣布,其對話式語音識別系統(tǒng)的出錯率達到5.1%,創(chuàng)下目前為止的最低水平,超過了去年微軟人工智能及研究事業(yè)部一組研究人員所實現(xiàn)的5.9%出錯率,達到了專業(yè)速錄員的同等水平。在此次研究中,專業(yè)速錄員具備重復收聽錄音等優(yōu)勢。
這兩次研究轉錄的是Switchboard語料庫中的錄音。Switchboard語料庫包含了2400段電話對話,自上世紀90年代以來一直被研究人員作為測試語音識別系統(tǒng)的樣本。
新研究由微軟人工智能及研究事業(yè)部的一組研究人員實施,目標是在出錯率上達到一組速錄員的同等水平,后者可以反復收聽錄音樣本,了解對話語境,與其他速錄員合作。
整體來說,通過改進微軟語音識別系統(tǒng)中基于神經(jīng)網(wǎng)絡的聽覺和語言模型,實施最新研究的研究人員能夠在去年基礎上把出錯率降低大約12%。顯然,他們還可以讓語音識別器了解整體對話,適應錄音樣本的語境,預測對話中很可能出現(xiàn)的下一個詞匯或短語。這正是人類在與其他人對話時的做法。
微軟的語音識別系統(tǒng)已被用于語音助手小娜、實時翻譯字幕功能Presentation Translator以及微軟認知服務中。(編譯/簫雨)
新鮮有料的產(chǎn)業(yè)新聞、深入淺出的企業(yè)市場分析,輕松有趣的科技人物吐槽。鳳凰科技(ID: ifeng_tech),讓科技更性感。
原創(chuàng)文章
最新文章
商務合作
- QQ:61149512