-->
AI“讀唇術”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術”。現(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術識別說話人的唇部動作的的技術,一種僅靠檢測喉嚨運動的“讀唇術”據(jù)說也被研發(fā)出來了。

圖片 1.png

據(jù)《itmedia》網(wǎng)站消息,近日,東京大學和索尼計算機科學研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現(xiàn)從口形(無聲說話)到語音的轉化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內(nèi)容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內(nèi)容。

AI系統(tǒng)“Derma”應用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學習,通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
長焦Live神器,vivo S50系列正式發(fā)布,售價 2999 元起
2
臺積電日本第二晶圓廠暫停施工,擬升級更先進的4nm制程
3
2026年國補繼續(xù),期待細則出臺
4
GCC運營商如何實踐5G-A體驗經(jīng)營?
5
電視行業(yè)年底沖量拉貨,12月TV面板價格將趨于穩(wěn)定
6
2026年國補釋放新信號,政策更加精準化
7
華碩推出Dual RTX 5060 Ti EVO:供電接口位置少見
8
一加Turbo系列官宣 李杰:同檔性能、續(xù)航強得可怕
9
銅價上漲,空調(diào)鋁代銅再提速,格力態(tài)度很關鍵
10
破解“能凍不能解”世紀難題!美菱M鮮生Ultra501S冰箱重塑家庭保鮮新標準
11
快手快聘年度紀實片:藍領工作《職得》被看見
12
突破行業(yè)困局 “超激鼓”技術為激光打印機行業(yè)良性發(fā)展提供新方案
13
蘋果首款智能眼鏡或2026年發(fā)布 依賴iPhone聯(lián)動
14
預計2025年家用投影市場出貨量為521.9萬臺,同比下滑16.1%
15
26年新規(guī)上線,冰箱、熱水器行業(yè)將迎來“大換血”
16
受蘋果首款折疊屏iPhone影響 預計2026年折疊屏手機出貨量暴漲近30%
17
全球2025Q3真無線耳機TOP5出爐:蘋果第一、小米第二
18
小米、格力、美的等家電廠商簽署自律公約:推進空調(diào)“鋁代銅”
19
蘋果iOS 26.2正式版下周發(fā)布:動效絲滑流暢!8大新功能
20
每個設備都智能,為何生活更麻煩?
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512