AI“讀唇術”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術”?,F在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內容。近日,不同于運用機器視覺技術識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術”?,F在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內容。近日,不同于運用機器視覺技術識別說話人的唇部動作的的技術,一種僅靠檢測喉嚨運動的“讀唇術”據說也被研發(fā)出來了。

圖片 1.png

據《itmedia》網站消息,近日,東京大學和索尼計算機科學研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現從口形(無聲說話)到語音的轉化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內容。

AI系統(tǒng)“Derma”應用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學習,通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

最新文章
1
直擊CES 2025,探索清潔電器新趨勢、新技術、新產品
2
2025年新型儲能十大發(fā)展趨勢預測
3
國補延續(xù)家電市場高增長還會繼續(xù)嗎?
4
成本、產能、尺寸制約?OLED電視市場發(fā)展緩慢的原因?
5
百樂滿118億大手筆收購富士通空調 雙方未來如何走向?
6
國家補貼銷量大漲!海信奪中國電視12月出貨量冠軍:行業(yè)唯一超百萬臺出貨
7
Mac Studio首發(fā)!蘋果最強芯片M4 Ultra今年登場
8
CES觀察:同樣聚焦畫質+AI,彩電巨頭們如何玩出個性?
9
全球16連冠:海爾究竟領先在哪?
10
本田攜手亞馬遜云科技打造下一代軟件定義汽車,并利用生成式AI提升充電體驗
11
引領聚合力 共創(chuàng)好產品:2024中國家電行業(yè)“好產品”發(fā)布盛典在北京召開
12
CES2025:中國“智”造新年秀實力第一站,長虹攜多款AI產品描繪生活之美
13
新年新氣象,盤點2025年智能電視行業(yè)發(fā)展的趨勢和方向
14
國補擴圍,洗碗機、凈水器市場即將迎來爆發(fā)式增長?
15
融合科技與藝術之美,家電如何構建幸福生活?
16
AI改為GPT-4o,999元賣爆的中國首款AI眼鏡出海了!
17
最新手機數碼類國補政策出爐,最高補貼五百元,想換機的朋友直接沖!
18
CES 2025:六大手機廠商缺席 一加和TCL成明星
19
日本芯片公司Rapidus將向博通提供2nm芯片樣品:與臺積電競爭
20
徹底告別劉海、藥丸屏!iPhone 18 Pro系列變成單挖孔
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512