AI“讀唇術(shù)”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的唇部動作的的技術(shù),一種僅靠檢測喉嚨運動的“讀唇術(shù)”據(jù)說也被研發(fā)出來了。

圖片 1.png

據(jù)《itmedia》網(wǎng)站消息,近日,東京大學(xué)和索尼計算機科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現(xiàn)從口形(無聲說話)到語音的轉(zhuǎn)化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內(nèi)容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內(nèi)容。

AI系統(tǒng)“Derma”應(yīng)用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學(xué)習(xí),通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
“華小v”三強決戰(zhàn)光明頂,vivo何以制勝?
2
香薰加濕器究竟是不是智商稅?
3
蘋果最薄旗艦iPhone Air終迎國行版上市,10月22日開售!
4
頻繁加征關(guān)稅 家電出口商家的應(yīng)對之道
5
十一家電市場大促數(shù)據(jù)來了,補貼很吸人,均價下跌
6
家電國補進入倒計時,下一步“棋”該如何下?
7
巨頭子品牌競逐中低端,空調(diào)市場變天?
8
時隔13年 AMD再戰(zhàn)Arm架構(gòu)!全新APU代號“聲波”
9
觀察:“小涼神”空調(diào)為何六年包修?
10
重構(gòu)移動影像體驗,vivo X300系列發(fā)布,售價4399元起
11
華寶新能美學(xué)曲面光伏瓦入選《時代》雜志2025年度“最佳發(fā)明獎”
12
快手電商[安踏寵粉月]活動生意聲量雙破峰,讓品牌增長看得見
13
聯(lián)動內(nèi)容生態(tài)和商業(yè)生態(tài),快手助力立白實現(xiàn)營銷突圍
14
快手科技副總裁宋婷婷:讓“她力量”在互聯(lián)網(wǎng)時代更加燦爛地綻放
15
推動短劇行業(yè)精品化發(fā)展,第九屆平遙國際電影展“快手聚光短劇計劃”榮譽揭榜
16
前三季度市場規(guī)模收縮,雙11能否為彩電業(yè)帶來“暖冬”?
17
千人在青島“眾測”海爾空調(diào),開啟雙十一
18
風雅相傳 器度不凡 心系天下三星W26正式發(fā)布
19
2025 vivo開發(fā)者大會:自研藍河操作系統(tǒng)3正式發(fā)布
20
RGB-Mini LED秀出硬實力,海信電視斬獲多項ACE2025 “凱博”大獎
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512