(資料圖片)
近日,百度旗下北京百度網(wǎng)訊科技有限公司“虛擬對象驅(qū)動方法、深度學習網(wǎng)絡的訓練方法及裝置”專利獲得授權(quán)。
專利摘要顯示,本公開提供了一種虛擬對象驅(qū)動方法、深度學習網(wǎng)絡的訓練方法及裝置、設備、介質(zhì)和產(chǎn)品,涉及人工智能領(lǐng)域,尤其涉及深度學習、計算機視覺、虛擬/增強現(xiàn)實和圖像處理技術(shù)領(lǐng)域,可應用于虛擬數(shù)字人、元宇宙等場景。
專利具體實現(xiàn)方案包括:響應于獲取的語音數(shù)據(jù),確定基于語音數(shù)據(jù)的初始語音特征;對初始語音特征進行時序增強處理,得到目標語音特征;基于目標語音特征和目標虛擬對象的基準面部圖像,生成針對目標虛擬對象的唇形圖像序列;以及根據(jù)唇形圖像序列,對目標虛擬對象進行驅(qū)動,以使目標虛擬對象執(zhí)行與語音數(shù)據(jù)匹配的唇部動作。
據(jù)悉,該專利能使虛擬人發(fā)聲時唇部肌肉運動更加自然,貼近真人。借助這一技術(shù)和百度類ChatGPT項目文心一言(ERNIE Bot),百度有望推出與用戶對話更加自然的高擬真度虛擬形象。
(文章來源:上海證券報·中國證券網(wǎng))