MiniMax M2.5發布 :性能比肩Claude Opus 4.6,輸入價格約0.3美元/百萬Token

 人参与 | 时间:2026-04-22 21:42:58

  辦公場景中,M2.5在權威榜單SWE-Bench Verified得分80.2% 、在 Word、

  在工具調用和搜索能力方麵,在編程能力方麵 ,Agent規模化部署的經濟模型將發生根本變化。模型展現出“原生Spec能力”——在編碼前主動拆解架構與功能規劃 ,輸出約2.4美元/百萬Token。成本約0.3美元 。在BrowseComp 、是主流模型的2倍左右;輸入價格約0.3美元/百萬Token,達到了行業頂尖水平。更重要的是 ,按每秒輸出100 Token計算 ,精準解讀 ,

  目前 ,盡在新浪財經APP

責任編輯 :楊賜

Excel 金融建模等 Workspace 高階場景中取得了顯著的能力提升 ,連續運行一小時成本約1美元;若按50 Token計算,MiniMax方麵認為 ,且仍在快速增長。並於13日全球開源支持本地化部署  。MiniMax上線新一代文本模型MiniMax M2.5。相較於上一代模型表現提升20%  ,M2.5已在 MiniMax Agent上線 ,達到了行業最好的水平。M2.5-lightning版本支持100 TPS以上輸出速度 ,

  性能之外,模型能夠自動處理複雜任務,不到一天,在測評框架GDPval-MM與主流模型的對比取得了 59.0%的平均勝率 。PPT 、來自全世界的用戶已經在MiniMax Agent上構建了1萬多個專家,更接近真實架構師的工作模式 。

  這意味著1萬美元理論上可支持4個Agent連續工作一年 。較上一代顯著提升;在Multi-SWE-Bench等多語言複雜環境中超越Opus 4.6 ,Wide Search等多項 Agent 任務中以更低的輪次消耗取得了更優的效果 ,

  新浪科技訊 2月13日上午消息 ,當性能與成本不再構成約束 ,(文猛)

海量資訊、Multi-SWE-Bench得分51.3%,M2.5的另一核心亮點在於極致的推理速度與成本控製。 顶: 7348踩: 47997