人民網
人民網>>經濟·科技

AI手語主播上崗 助聽障人士觀冰雪賽事

劉 艷
2022年02月08日09:15 | 來源:科技日報
小字號

原標題:AI手語主播上崗 助聽障人士觀冰雪賽事

2月4日,央視新聞AI手語主播上崗,她將在冬奧會新聞播報、賽事直播和現場採訪中,為聽障人士送上實時手語翻譯服務。

這位由“百度智能雲曦靈”數字人平台打造的首個AI手語主播,已在剛剛開啟的冰雪賽事中上線,她提供的手語服務,讓聽障人士可以快捷獲取賽事資訊,感受賽事精彩。

從“段子手”朱廣權與AI手語主播在線pk的視頻可看到,AI手語主播的“手速”沒有被朱廣權的超快語速難住。她的專業能力是怎樣練成的?

手語數字人的本質是解決翻譯問題,難點在於,手語並非按照語言逐字翻譯,而要根據語句整體意思進行語言精煉和語序調整。同時,為幫助聽障人士更好理解,還需實時配合表情和唇語。

這就要求AI手語數字人必須解決信息凝練度、低時延和精細化三方面極其復雜的技術難題。也就是說,AI手語主播不僅要有高精度的數字人形象,更要擁有能夠語音識別、手語翻譯和手語表達的AI大腦。

AI手語主播的AI大腦依托於百度智能雲。為保証AI手語主播具備高可懂度的手語表達能力和精准連貫的呈現效果,通過百度自主研發的機器翻譯技術,百度智能雲構建出一套精確的手語翻譯引擎,可懂度達85%以上,媲美主流的中英、中日等方向的機器翻譯結果﹔結合百度自研的語音識別技術,可將冰雪賽事的文字及音視頻內容,快速精准地轉化為手語﹔通過專為手語優化的自然動作引擎,完成AI手語主播的動作驅動,實時演繹為數字人的動作、表情和唇語﹔百度智能雲基於《國家通用手語詞典》規范建立的規模龐大的手語動作庫,保証了手語表達的動作准確性﹔而用百度首創的4D掃描數據進行訓練,可讓AI手語主播的表情自然生動,口型生成准確度高達98.5%。如此復雜的數字人研發,百度智能雲隻用了不到2個月。

目前,數字人尚未實現規模化產業落地,主要原因在於制作技術門檻高、周期長、成本高。百度集團副總裁吳甜曾說:“百度希望通過領先的全棧AI能力,把虛擬人的生產周期縮短到小時級別,降低生產成本,並且用AI驅動生成內容。”

2021年12月,百度發布了集數字人生產、內容創作、業務配置服務為一體的智能數字人平台“百度智能雲曦靈”,基於人像驅動、智能對話、語音交互、智能推薦四大技術引擎,讓數字人“能聽、能說、能理解、可互動”,讓相關企業能以低成本快速定制2D卡通、真人形象及3D卡通、超寫實數字人像,實現對話服務、內容創作全流程業務配置,極大降低了數字人開發難度。

比如,在百度智能雲曦靈平台上傳一張照片,就能快速生成一個可被AI驅動的2D數字人像。如今,2D數字人的生產流程已從一個星期縮短到半個小時,3D數字人的生成也已從兩三個月壓縮到一兩周的時間。

與此同時,數字人個性化功能開發也更加完善。比如,通過輕量化模型訓練,用戶說20句話即可生成屬於自己音色的數字人。百度AI人機交互實驗室負責人李士岩說:“我們近一兩年的奮斗目標是通過百度智能雲曦靈平台的開放,讓每個人、每一家企業實現數字人自由。”

據了解,百度智能雲曦靈已為諸多行業提供了一站式虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創建與運營服務。

(責編:羅知之、初梓瑞)

分享讓更多人看到

返回頂部