当前位置:首页 > 环球风云 > 新一代文本模型MiniMax M2.5上线

新一代文本模型MiniMax M2.5上线

2026年02月13日55785

近日,MiniMax正式上线新一代文本模型MiniMax M2.5,是一款定位为“原生Agent生产级模型”的产品。

新一代文本模型MiniMax M2.5上线
图片来源于网络,如有侵权,请联系删除

10B激活参数跑出旗舰成绩

新一代文本模型MiniMax M2.5上线
图片来源于网络,如有侵权,请联系删除

在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus4.6。更重要的是,模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式。

新一代文本模型MiniMax M2.5上线
图片来源于网络,如有侵权,请联系删除

工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项Agent任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20% 。

办公场景中,在Word、PPT、Excel金融建模等Workspace高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比取得了59.0%的平均胜率。

极致推理重构Agent经济

性能之外,M2.5的另一核心亮点在于极致的推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按每秒输出100Token计算,连续运行一小时成本约1美元;若按50Token计算,成本约0.3美元。

这意味着1万美元理论上可支持4个Agent连续工作一年。MiniMax方面认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。

独创Agent RL支撑高速进化

过去108天,MiniMax从M2、M2.1迭代至M2.5,在SWE-Bench Verified成绩从69.4提升至80.2,进步曲线在同业中尤为陡峭。团队将这一跃迁归因于大规模Agent强化学习(RL Scaling)。

其自研Forge框架通过解耦训练引擎与Agent,实现对任意Agent脚手架和工具的泛化优化,并通过异步调度与树状合并策略实现约40倍训练加速。同时,在算法层面采用CISPO优化与过程奖励机制,缓解长上下文场景中的信用分配问题,并将“任务真实耗时”纳入奖励函数,在效果与响应速度之间取得平衡。

M2.5已于2月12日在MiniMax Agent上线,并于13日全球开源支持本地化部署。不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且仍在快速增长。

MiniMax表示,希望在持续提升模型能力的同时,构建一个可持续扩展的Agent生态-Agent Universe。当模型能力、泛化性和成本都不再是瓶颈,Agent渗透到工作和生活的各个角落——从编程、办公到创作、娱乐,大幅促进Agentic应用的进一步发展。

【责任编辑:王岩】
    阅读下一篇:
      •  
      •  

              扫描二维码推送至手机访问。

              版权声明:本文由每日快讯发布,如需转载请注明出处。

              “新一代文本模型MiniMax M2.5上线” 的相关文章

              “创新链”遇见“产业链”——科技成果转化推动新质生产力加速发展

              “创新链”遇见“产业链”——科技成果转化推动新质生产力加速发展

                新华社北京2月15日电 题:“创新链”遇见“产业链”——科技成果转化推动新质生产力加速发展图片来源于网络,如有侵权,请联系删除  新华社记者严赋憬、宋晨、魏弘毅  2025年春节,中国人工智能企业深度求索(DeepSeek)推出的国产大模型以“小成本办大事”的高性能惊艳全球,成为中国科技创新体系...

              我国科学家实现“双环路”脑机“互学习”新突破

              我国科学家实现“双环路”脑机“互学习”新突破

                天津大学与清华大学联合研发出一款“双环路”脑机接口系统。此系统不仅精度更高、能耗更低,还能处理更为复杂的任务。图片来源于网络,如有侵权,请联系删除  这款基于忆阻器神经形态器件的无创演进脑机接口系统,成功揭示了脑电发展与解码器演化在脑机交互过程中的协同增强效应,实现了人脑对无人机的高效四自由度操...

              网络购物、知识付费、游戏经济……青年引领数字消费新风潮

              网络购物、知识付费、游戏经济……青年引领数字消费新风潮

                核心阅读图片来源于网络,如有侵权,请联系删除  随着数字技术深度应用,消费新业态、新模式、新场景不断涌现,大大激发公众尤其是青年群体的消费意愿,数字消费已成为推动经济增长的重要引擎。图片来源于网络,如有侵权,请联系删除  追求即时高效、生活品质和性价比,对文化生活有高需求……作为“网络原住民”的...

              屏幕、性能、续航、AI全面升级 联想小新Pro系列新品亮点十足

              屏幕、性能、续航、AI全面升级 联想小新Pro系列新品亮点十足

                2月18日,联想在北京举办了以“‘屏’实力,让热AI不止”为主题的联想小新Pro系列新品发售会,发布了联想小新Pro 14 2025款、联想小新Pro 16 2025款、联想小新Pro 14 GT AI元启版、联想小新Pro 16 GT AI元启版四款产品。联想小新以“传递用户越级体验”为理念,...

              全球央行继续降息步伐:澳大利亚联储4年来首降 新西兰联储再降息50个基点

              全球央行继续降息步伐:澳大利亚联储4年来首降 新西兰联储再降息50个基点

                全球主要央行降息步伐持续,澳大利亚联储周二自2020年以来首次降息,新西兰联储今日将利率再度下调50个基点。在最新经济数据不及预期后,市场预计泰国央行下周也可能再度降息。图片来源于网络,如有侵权,请联系删除   澳大利亚联储2020年来首次降息图片来源于网络,如有侵权,请联系删除   得益于...

              废旧家电咋处理

              废旧家电咋处理

              自《推动大规模设备更新和消费品以旧换新行动方案》(以下简称《行动方案》)实施以来,家电市场消费潜力得到显著释放。数据显示,2024年,中央加力支持以旧换新八大类家电产品实现销售量6200多万台,直接拉动消费近2700亿元。日前,国家发展改革委副主任赵辰昕在国务院政策例行吹风会上介绍,2025年将延续...