大皖新聞訊 1月15日,科大訊飛發布了當前全國產算力平臺上唯一的深度推理大模型“訊飛星火X1”。據了解,盡管在全國產算力平臺上訓練深度推理模型遭遇了諸多挑戰,但科大訊飛攜手華為,最終成功“訓練”出我國首個基于全國產算力訓練的具備深度思考和推理能力的大模型。
訊飛星火X1中文數學能力在國內領先
在發布演示中,研究員們展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現。訊飛星火X1不僅準確給出了這些題目的答案,還對解題思路和步驟進行了詳細拆解。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。“深度推理模型有三大典型特征:一是化繁為簡,將復雜問題分步拆解簡化;二是進行自我探索和反思驗證;三是基于答案正確與否的優質反饋信息進行強化訓練。”據介紹,訊飛星火X1在近期參加的小初高(含競賽)、大學(含競賽)、AIME、MATH 500等多項“考試”中成績十分亮眼,用更少的算力,實現了業界一流的效果,在國內領先。
一直以來,訊飛星火堅持走全國產化路線。盡管在全國產算力平臺上訓練深度推理模型遭遇了諸多挑戰,但科大訊飛攜手華為,成功攻克了訓練推理強交互、高吞吐推理優化以及國產算子優化等一系列難題,最終成功訓練出訊飛星火X1。
據了解,早在2023年10月,科大訊飛與華為聯合打造的首個國產萬卡算力集群“飛星一號”平臺上線。一年后,科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”正式啟動,引領國產大模型底座的發展。
據了解,基于全國產算力,訊飛星火X1目前已經率先在教育等真實場景中實現了應用落地。而在醫療領域,訊飛星火X1的模型策略已取得初步驗證成效,可使得專科輔助診斷和復雜病歷內涵質控的準確率均達90%。
訊飛星火4.0 Turbo底座能力再升級
此次發布,訊飛星火4.0 Turbo底座能力也實現了全新升級,七大核心能力全面提升,全面對標OpenAI 最新版的GPT-4o。據介紹,此次升級最重要的特點,是針對行業、企業的痛點問題,在數學能力、行業知識、圖文識別、長文本能力等能力上實現提升。
比如,圖文識別能力直接關乎著企業能否高效地采編和利用行業、私域數據,是大模型“學習”的基礎。在各行各業的實際工作中,經常面臨圖文識別的“疑難雜癥”:如醫療的體檢報告、法院的文書、學術論文、企業合同等,還有復雜長表格、雜亂版式、手寫公式、印章手寫合同、傾斜少線等情況。
而訊飛星火4.0 Turbo圖文識別能力升級,使得通用文檔版面分析、文字識別的準確率相對提升了40%,復雜表格結構、潦草手寫文字等方面的準確率相對提升了60%,可以解決上述難題,大幅提升高價值數據的獲取能力。此次升級還針對性地提升了文檔要素檢測能力,在知識切分和構建的粒度上更加精細、準確,能有效防止大模型幻覺,同時發布了掃描文檔解析的極速版本,文檔理解速度提升了10倍以上。對于一份500頁的項目文件,從掃描、識別到解析的全過程,僅需2分鐘即可全部完成。
大模型的長文本能力一直是用戶關注的重點,特別是在企業知識問答這類嚴謹的應用場景中,用戶對大模型幻覺的容忍度幾乎為零。因此,訊飛星火推出了基于智能體的全新長文本框架,并行業首發了句子級溯源功能。這一新框架優化了超長注意力機制,同時利用大規模網頁和書籍數據進行知識關聯式合成,使得知識回復的錯誤率降低了40%,句子級溯源效果更是超越了GPT-4o,緩解了問答搜索服務中因大模型幻覺而需要反復溯源確認的應用落地難題。
大皖新聞記者 項磊
編輯 許正文
請輸入驗證碼