科技讓機器“看”懂你說的話

發(fā)布時間：2024-08-11

從文字識別到語音輸入，科技的發(fā)展讓我們的生活更加便利，也讓人機互動的方式更加匪夷所思，但是這并不意味著這項技術(shù)就已經(jīng)發(fā)展到頭了，事實上任由不少的問題等待著我們?nèi)ソ鉀Q，例如用機器去解讀唇語。
唇語是一種非常特殊的技巧，其本質(zhì)是通過眼睛觀察對方說話時候嘴唇的運動方式，來理解對方表述的內(nèi)容。由于一般正常說話的時候，人的嘴唇和語音是同步的，并且在發(fā)音過程中，嘴唇運動的方式并不相同，因此可以實現(xiàn)“看”懂對方說話內(nèi)容的目的。但是在實際的使用過程中，由于說話時嘴唇的運動變化的區(qū)別很難察覺，因此理解唇語的難度也非常高。
簡而言之，想要實現(xiàn)唇語的解讀總結(jié)起來就有兩個要素：識別嘴唇運動以及做出對應(yīng)反饋。而這兩點其實對于機器來說是具備優(yōu)勢。一方面，機器通過影像傳感器來捕捉運動對象已經(jīng)是一種很成熟的技術(shù)了，并且這項技術(shù)目前的精度非常高，想要瞬間識別嘴唇的運動并不困難；另一方面，在存儲技術(shù)以及半導(dǎo)體技術(shù)的發(fā)展下，目前機械的交互響應(yīng)速度已經(jīng)非常可觀，結(jié)合大數(shù)據(jù)以及人工智能算法的輔助，只要能夠預(yù)先在系統(tǒng)中針對不同唇形對應(yīng)的發(fā)音情況，在短時間內(nèi)針對捕捉到的唇形破譯出說話內(nèi)容也并非一件難事。
那么是不是說唇語解讀系統(tǒng)就很容易被制造出來呢？答案其實是否定的，事實上，即便在唇語解讀核心的兩個基礎(chǔ)條件已經(jīng)可以滿足的前提下，仍有一個更加嚴(yán)重的問題影響著唇語的解讀難度——干擾因素。事實上，在我們的正常生活中，面部的角度、光照、毛發(fā)遮擋、衣物遮擋等，都可能成為影響唇語捕捉的要素，再加上一部分人說話習(xí)慣的影響，嘴唇變化實際的可能其實遠(yuǎn)比預(yù)想的還要多，這也就導(dǎo)致了這種機器的制造難度非常高。即便是目前唇語識別準(zhǔn)確率較高的非接觸式視覺圖像方法，因為因為干擾因素的存在，而出現(xiàn)失誤。
那么沒有其他解決方法嗎？答案是有的，那就是從唇形更進(jìn)一步地深入到肌肉動作的解讀。我們說話時，嘴唇的運動是通過肌肉伸縮完成的，而肌肉運動會帶動臉部變化，因此如果能夠捕捉到肌肉的細(xì)節(jié)，就可以避免干擾因素的存在來完成唇形識別。但是也正因為肌肉的動作非常細(xì)微，因此解讀難度也就有了明顯的上升。
而就在最近，清華大學(xué)機械工程系智能與生物機械團隊推出一種新穎的唇語解讀系統(tǒng)，這套系統(tǒng)通過自供電的柔性傳感器采集肌肉的微小動作信號，并采用基于原型學(xué)習(xí)的深度學(xué)習(xí)模型進(jìn)行唇語的捕捉與解讀，因此準(zhǔn)確率也更高。
而這項成果的公開，也讓人機互動以及恢復(fù)失聲人群的基本語音交流能力等研究有了進(jìn)一步的進(jìn)展。不過，就現(xiàn)階段來說，這項技術(shù)還需要解決樣本容量的問題，由于唇語的機器解讀依賴庫的大小，因此，理論上來說，隨著越來越多的唇語模型被收入到數(shù)據(jù)庫中，機器“看”懂語言的能力也會越來越強。
原標(biāo)題：科技讓機器“看”懂你說的話

上一個：ssd表示什么意思，計算機的SSD是甚么代表的有是甚么
下一個：干奶酪水分分析儀使用方法測試標(biāo)準(zhǔn)

智能化多用戶電表真的比老式機械電表走的快嗎？實驗來解決
氣電量儀測量冰箱壓縮機故障解決方法
無線儀表打印電子吊秤的使用注意事項
真空電阻加熱爐的優(yōu)勢
iphone xr的icloud在哪里(蘋果xr手機icloud在哪里)
自控自吸清水泵體安裝步驟及注意事項
ipad怎么刷機清除id(ipad怎么刷機忘記密碼)
牛蛙餐廳遇供應(yīng)鏈短板液氮速凍牛蛙能帶它飛上風(fēng)口嗎？
西門子PLC中國總代理商
大屏幕小米手機max(小米max多大屏幕尺寸)

AV 无码 高潮 在线下载,黄色亚洲无码在线,精品国产sm在线大全,国产色系视频在线观看,亚洲人成网站在线播放2019

科技 讓機器“看”懂你說的話

AV 无码高潮在线下载,黄色亚洲无码在线,精品国产sm在线大全,国产色系视频在线观看,亚洲人成网站在线播放2019

科技讓機器“看”懂你說的話