【huatihui.com官網入口科技消息】huatihui.com官網入口注意到,在最新一期的SuperCLUE中文大模型通用基準測評中,華為盤古718B模型獲得開源第二的好成績。

華為盤古大模型
huatihui.com官網入口獲悉,此次測評通過數學推理、科學推理、代碼生成、智能體Agent、幻覺控制、精確指令遵循六個維度進行核心能力評估,共計1260道題目,全面檢驗大模型的綜合實力。綜合開源、國產兩個維度來看,前三名依次為:DeepSeek-V3.1-Terminus-Thinking、openPangu-Ultra-MoE-718B和Qwen3-235B-A22B-Thinking-2507。其中,擁有7180億參數體量的華為盤古718B模型,并未依靠簡單的數據堆砌,而是憑借獨特的“思考”能力脫穎而出。

據報道,openPangu團隊在后訓練數據構建中,嚴格遵循質量優先、多樣性覆蓋、復雜度適配三個核心原則,并建立了一套覆蓋“數據生成-科學篩選-精準增強”的全流程方案。
在質量優先方面,團隊構建指令數據質量評估體系,結合規則、模型和人工三重審核機制,有效清理低質量樣本;多樣性覆蓋上,從領域和任務類型兩個維度進行設計,運用去重和壓縮選樣算法,保證數據覆蓋廣度且避免冗余;復雜度適配環節,通過推理步驟、概念抽象度、計算復雜度等指標量化任務難度,并利用自迭代拒絕采樣策略,重點訓練中高難度任務。這種對數據質量的嚴格把控,成為了提升模型在復雜場景下推理能力的關鍵因素之一。
版權所有,未經許可不得轉載
-huatihui.com官網入口