【環(huán)球網(wǎng)科技綜合報(bào)道】11月20日消息,知名視覺特效及虛擬現(xiàn)實(shí)體驗(yàn)服務(wù)供應(yīng)商數(shù)字王國集團(tuán)有限公司(下稱“數(shù)字王國”)在近期上線的“Intel’s AI Podcast”中首次展示了其進(jìn)階虛擬人——“Douglas”。
區(qū)別于時下以純語音為交互模式的虛擬助手、聊天機(jī)器人,數(shù)字王國選擇以寫實(shí)級數(shù)字替身,即虛擬人“Douglas”,為人機(jī)交互的載體。數(shù)字王國方面表示,Douglas擁有與真實(shí)人類無異的面部特征,更具備變色龍般轉(zhuǎn)換外形的能力,這一優(yōu)勢為其在2021年邁入消費(fèi)級路徑賦予了廣泛且靈活的可能性。
據(jù)了解,Douglas由基于數(shù)字王國軟件研發(fā)部門高級主管Doug Roble博士打造的數(shù)字替身演化而來。此前,相關(guān)技術(shù)已在構(gòu)建可實(shí)時操控的虛擬人以及融入人工智能的面部捕捉領(lǐng)域取得諸多成就。
為了創(chuàng)建Douglas,Doug Roble進(jìn)行了上百小時的表演捕捉,包括朗讀書籍以記錄表情與聲音。數(shù)字王國隨后利用多種光照條件下拍攝的人像照片來訓(xùn)練神經(jīng)渲染工具。依托捕獲的數(shù)據(jù),該工具現(xiàn)能夠達(dá)成過往傳統(tǒng)技術(shù)無法達(dá)成的逼真水平,同時使得生成數(shù)字替身的過程越發(fā)迅速。據(jù)稱,甚至僅借助極少的表情與聲音,如時長為10分鐘左右的視頻或30分鐘左右的音頻,就能精確地模仿另一個人的行為舉止。
據(jù)介紹,Douglas基于機(jī)器學(xué)習(xí)解決方案和數(shù)字王國自主研發(fā)的技術(shù),足以模擬真實(shí)人類的舉動,通過語言處理、神情雕琢及視覺跟蹤等能力,其還能識別人類并與人類對話。據(jù)稱其對話水平與智能語音助手“Alexa”和“Siri”旗鼓相當(dāng),不會在交流時出現(xiàn)長時間停頓,可以流暢自然地與人類溝通。
因此,除了面部寫實(shí),Douglas還尤其適用于重復(fù)型任務(wù)組成的應(yīng)用場景,例如需要多次處理同一問題的客戶服務(wù)領(lǐng)域等。當(dāng)下版本的Douglas可連接至任意虛擬助手或聊天機(jī)器人系統(tǒng),為實(shí)時人機(jī)交互提供虛擬面孔和情感層面的智能響應(yīng)。完善后的Douglas預(yù)計(jì)將支持全球范圍內(nèi)在線會議平臺的部署。作為虛擬人,其寫實(shí)級效果預(yù)示著這一技術(shù)可能撬動更為多元的感官體驗(yàn)。
數(shù)字王國CEO謝安表示:“Douglas的誕生極具開創(chuàng)意義,這標(biāo)志著前所未有的自主虛擬人即將擁抱容量巨大且亟待釋放的消費(fèi)級人機(jī)交互賽道。來自數(shù)字王國的藝術(shù)家和科學(xué)家持續(xù)投身于面部捕捉和自主行為操控的拓展,加速虛擬人面向消費(fèi)者群體的商業(yè)化進(jìn)程?!?
來源:環(huán)球網(wǎng)