11月7日,2023年世界互聯(lián)網(wǎng)大會“互聯(lián)網(wǎng)之光”博覽會開幕。現(xiàn)場,數(shù)字技術展區(qū)螞蟻集團大屏上的數(shù)字火炬人讓不少游客駐足。
亞運會開幕式上,數(shù)字火炬手緩緩跑過會場,這正是由螞蟻集團的數(shù)字人技術支撐的。
螞蟻集團智能交互部工作人員莫殘告訴記者,數(shù)字火炬人項目的重點是實現(xiàn)兩個目標,第一個是希望每個用戶都能擁有一個自由度高、人物精美的形象;第二個是希望覆蓋的用戶能夠盡量達到億級的規(guī)模。
“我們在原有的數(shù)字人基礎上做了很多優(yōu)化,用人工智能增強現(xiàn)實,包括云計算和區(qū)塊鏈相關的技術。”莫殘介紹。
在杭州亞運之外,數(shù)字人的技術已經(jīng)應用到了更多的場景。莫殘在現(xiàn)場向潮新聞記者展示,數(shù)字人主要有兩種表現(xiàn)方式,一種是完全寫實的真人版,另一種是偏卡通的形象。在醫(yī)療領域,患者只要掃描處方上的二維碼,數(shù)字人醫(yī)生就會出現(xiàn)在屏幕上,柔聲向患者介紹如何正確地服用藥物,患病期間需要注意哪些方面。“患者有問題也可以向它提問,數(shù)字人能夠做出進一步的解釋。”
數(shù)字陪診師幫助患者用藥。
在金融領域,如果有用戶想做授信申請,但并不清楚具體的流程和需要的材料,數(shù)字人可以幫助用戶完成材料的認證和上傳。此外,全國首個政務服務數(shù)字人“小贛事”能夠為江西的用戶提供政務服務。
“像在直播間里,不同的觀眾會有不同的問題,真人主播可能來不及一一回答,只能挑一些問題進行回答, 數(shù)字人可以同時回復所有用戶的疑問。”莫殘表示,目前,AI數(shù)字人直播業(yè)務已經(jīng)助力不少商家進行賣貨,能夠根據(jù)商家的不同特點定制專屬數(shù)字人,“我們在不斷通過大模型豐富數(shù)字人的應變能力,讓它有自己的性格特點,并且可以進一步外顯到形象和動作習慣上”,實現(xiàn)數(shù)字人“一人一面”的未來正離我們越來越近。
“后續(xù),我們會把數(shù)字人的模型做得更加逼真,讓它成為大數(shù)據(jù)的載體,可以在各種生活化的領域用數(shù)據(jù)人去替代現(xiàn)在的人力,實現(xiàn)即時交互。”莫殘認為,在AIGC的大模型時代,數(shù)字人將成為人機交互的下一個標準化入口,幫助用戶更好地解決線上線下的問題。
請輸入驗證碼