大皖新聞?dòng)?/strong> 在日前舉辦的科大訊飛成立25周年司慶活動(dòng)上,科大訊飛董事長劉慶峰預(yù)告,訊飛星火V4.0將于6月27日發(fā)布,將會(huì)進(jìn)一步強(qiáng)化國內(nèi)的領(lǐng)先地位。日前,隨著語音和音視頻能力都有所提升的GPT-4o的發(fā)布,底座大模型再次迎來智慧升級(jí),對(duì)此劉慶峰也表示,站在當(dāng)前語音和大模型全新的戰(zhàn)略機(jī)遇交匯處,訊飛星火要通過五大核心戰(zhàn)略,來打贏大模型之戰(zhàn)。
五大戰(zhàn)略打贏大模型之戰(zhàn)
劉慶峰詳解大模型時(shí)代科大訊飛核心戰(zhàn)略。
第一,賦能現(xiàn)有的軟硬件和行業(yè)產(chǎn)品,形成基本盤。背靠科大訊飛的根據(jù)地業(yè)務(wù),深入教育、醫(yī)療、工業(yè)、汽車、家電等行業(yè)賽道,同時(shí)打造基于大模型的翻譯機(jī)、學(xué)習(xí)機(jī)等王牌硬件產(chǎn)品。
第二,開拓以央國企為代表的重點(diǎn)行業(yè)客戶市場(chǎng)。按照大模型能力可達(dá)程度的三個(gè)臺(tái)階,提供真正解決行業(yè)和企業(yè)剛需的方案。
第三,開辟新興賽道的軟硬件一體化授權(quán)和新硬件機(jī)遇,比如機(jī)器人硬件、醫(yī)療硬件等。
第四,在萬物互聯(lián)時(shí)代,AI助手的入口級(jí)戰(zhàn)略機(jī)遇。以“能聽會(huì)說”為前端,以“能理解會(huì)思考”為后端,將極大推動(dòng)萬物互聯(lián)時(shí)代進(jìn)程。
第五,推進(jìn)“訊飛超腦2030”計(jì)劃,邁向家庭陪伴機(jī)器人的萬億市場(chǎng)。
劉慶峰通過多項(xiàng)行業(yè)和產(chǎn)品應(yīng)用,亮出目前大模型成績單。據(jù)了解,目前中國汽車出口的多語種技術(shù),幾乎全部由科大訊飛提供。奇瑞、蔚來、廣汽、一汽等國產(chǎn)品牌都在和訊飛合作,國際汽車品牌大眾在評(píng)估后也迅速落地應(yīng)用,于3月13日發(fā)布首款搭載星火大模型的車型“ID.UNYX” 。
劉慶峰表示,大模型應(yīng)用落地的一個(gè)關(guān)鍵是云邊端一體化和軟硬件一體化,在底座能力和垂直方向上要做透還要做好,用更小的算力做出相對(duì)更優(yōu)效果?!霸谠苽?cè),我們有很好的大參數(shù)的通用模型(各種不同尺寸都有),也有星火一體機(jī)、‘飛星一號(hào)’算力平臺(tái)等完全自主可控的硬件支撐;在邊、端側(cè),科大訊飛有在汽車等行業(yè)落地的中等參數(shù)模型和軟硬件一體化方案,也有完全能夠在手機(jī)等智能終端上安裝和使用的‘小’模型和方案。從而形成了云邊端一體化和軟硬件一體化的綜合落地優(yōu)勢(shì)?!?/p>
“本輪的通用人工智能,從國內(nèi)外的發(fā)展看都是‘大平臺(tái)加英雄主義’,沒有通用大模型的底座能力,沒有算法、數(shù)據(jù)等各方面的積累,就沒有辦法做出改變世界的大模型應(yīng)用和產(chǎn)品。所以必須站在大平臺(tái)之上。”劉慶峰說,從底座能力和承擔(dān)的國家戰(zhàn)略任務(wù)看,訊飛星火就是這個(gè)大平臺(tái),再往后大平臺(tái)屬性還會(huì)進(jìn)一步增強(qiáng);除此之外,還要有英雄主義,讓每個(gè)人的創(chuàng)造力真正被激發(fā)出來,成為充滿想象力、充滿戰(zhàn)斗力、充滿開拓精神的英雄。
智能語音應(yīng)用將迎來全面重構(gòu)
科大訊飛從語音起家。而OpenAI從通用底座的GPT-4,到有視覺功能的GPT-4V,到語音大模型Whisper、文生視頻大模型Sora,再到今年5月份發(fā)布的語音和音視頻能力都有所提升的GPT-4o,對(duì)全球語音市場(chǎng)都帶來非常大的推動(dòng)。
劉慶峰表示,原來的語音合成、語音識(shí)別、機(jī)器翻譯等單點(diǎn)技術(shù),通過大模型的理解能力、文本生成能力在后臺(tái)加持提升,實(shí)現(xiàn)了語義理解、指令跟隨、多輪對(duì)話、情緒感知、超擬人合成,真正使得語音交互得到提升。
“在這個(gè)背景下,語音領(lǐng)域的幾乎所有應(yīng)用都值得用新方式重構(gòu)一遍,這就是現(xiàn)如今語音產(chǎn)業(yè)的全新戰(zhàn)略機(jī)遇?!眲c峰說,醫(yī)療導(dǎo)診機(jī)器人、酒店服務(wù)機(jī)器人、所有企業(yè)的客服機(jī)器人等都可以重新做一遍;7×24小時(shí)營業(yè)場(chǎng)所的部分崗位、企業(yè)中的服務(wù)類崗位等都可以用數(shù)字員工;汽車、手機(jī)、家庭助手等終端的智能語音服務(wù)也能得到很大提升?!邦愃频膽?yīng)用領(lǐng)域非常多,產(chǎn)業(yè)空間巨大?!?/p>
他分析,GPT-4o對(duì)萬物互聯(lián)時(shí)代語音浪潮的推動(dòng),類似于當(dāng)年Siri對(duì)語音應(yīng)用的推動(dòng)?!八鼈涫荜P(guān)注的原因:超擬人合成,使得說話不再是朗讀腔調(diào),而是真的像人一樣自由對(duì)話;全雙工交互,可以同時(shí)(瞬時(shí))進(jìn)行信號(hào)的雙向傳輸,人機(jī)對(duì)話可以隨時(shí)打斷和繼續(xù);通過語音到語音的端到端建模實(shí)現(xiàn)快速反應(yīng)的極致交互體驗(yàn)。”
劉慶峰說,目前科大訊飛在超擬人合成技術(shù)方面,中英文、多語種都做到了國際領(lǐng)先。下一步,科大訊飛將發(fā)力遠(yuǎn)場(chǎng)高噪音多人說話場(chǎng)景、高表現(xiàn)力個(gè)性化場(chǎng)景、云邊端一體化、軟硬件一體化,從技術(shù)優(yōu)勢(shì)、市場(chǎng)先機(jī)、落地成效構(gòu)建全方位持續(xù)領(lǐng)先優(yōu)勢(shì)。
大皖新聞?dòng)浾?項(xiàng)磊 實(shí)習(xí)生 唐雪玲
請(qǐng)輸入驗(yàn)證碼