当前位置:首页 > 环球风云 > 新一代文本模型MiniMax M2.5上线

新一代文本模型MiniMax M2.5上线

2026年02月13日55796

近日,MiniMax正式上线新一代文本模型MiniMax M2.5,是一款定位为“原生Agent生产级模型”的产品。

新一代文本模型MiniMax M2.5上线
图片来源于网络,如有侵权,请联系删除

10B激活参数跑出旗舰成绩

新一代文本模型MiniMax M2.5上线
图片来源于网络,如有侵权,请联系删除

在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus4.6。更重要的是,模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式。

新一代文本模型MiniMax M2.5上线
图片来源于网络,如有侵权,请联系删除

工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项Agent任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20% 。

办公场景中,在Word、PPT、Excel金融建模等Workspace高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比取得了59.0%的平均胜率。

极致推理重构Agent经济

性能之外,M2.5的另一核心亮点在于极致的推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按每秒输出100Token计算,连续运行一小时成本约1美元;若按50Token计算,成本约0.3美元。

这意味着1万美元理论上可支持4个Agent连续工作一年。MiniMax方面认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。

独创Agent RL支撑高速进化

过去108天,MiniMax从M2、M2.1迭代至M2.5,在SWE-Bench Verified成绩从69.4提升至80.2,进步曲线在同业中尤为陡峭。团队将这一跃迁归因于大规模Agent强化学习(RL Scaling)。

其自研Forge框架通过解耦训练引擎与Agent,实现对任意Agent脚手架和工具的泛化优化,并通过异步调度与树状合并策略实现约40倍训练加速。同时,在算法层面采用CISPO优化与过程奖励机制,缓解长上下文场景中的信用分配问题,并将“任务真实耗时”纳入奖励函数,在效果与响应速度之间取得平衡。

M2.5已于2月12日在MiniMax Agent上线,并于13日全球开源支持本地化部署。不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且仍在快速增长。

MiniMax表示,希望在持续提升模型能力的同时,构建一个可持续扩展的Agent生态-Agent Universe。当模型能力、泛化性和成本都不再是瓶颈,Agent渗透到工作和生活的各个角落——从编程、办公到创作、娱乐,大幅促进Agentic应用的进一步发展。

【责任编辑:王岩】
    阅读下一篇:
      •  
      •  

              扫描二维码推送至手机访问。

              版权声明:本文由每日快讯发布,如需转载请注明出处。

              “新一代文本模型MiniMax M2.5上线” 的相关文章

              解决“一老一小”保障难点 蚂蚁保“好医保”上线中老年版、新版少儿长期医疗险

              解决“一老一小”保障难点 蚂蚁保“好医保”上线中老年版、新版少儿长期医疗险

                随着国内普惠保险体系的逐步健全,保险服务覆盖面正不断扩大。12月10日,互联网保险优选平台蚂蚁保宣布,旗下百万医疗险品牌“好医保”推出了专门针对中老年、慢病群体的“好医保·中老年长期医疗”(简称“好医保”中老年版)。除了新上线的中老版本,“好医保·少儿长期医疗”近期也进行了版本更新,优化了赔付比...

              推动算法和平台治理透明化,让网络空间向上向善

              推动算法和平台治理透明化,让网络空间向上向善

              新华网北京1月6日电(朱家齐)在数字化浪潮席卷而来的当下,算法已然成为推动社会运转的关键引擎。它的诞生,是人类智慧为提高效率交出的一份答卷。凭借强大的数据分析和处理能力,算法让信息的筛选、资源的分配变得更加精准高效,提升了各个领域的运行效率,为我们的生活带来了便利。图片来源于网络,如有侵权,请联系删...

              国家计算机病毒应急处理中心监测发现14款违规移动应用

              国家计算机病毒应急处理中心监测发现14款违规移动应用

                新华社天津2月17日电(记者张建新、栗雅婷)国家计算机病毒应急处理中心近期通过互联网监测发现,14款移动应用存在隐私不合规行为。图片来源于网络,如有侵权,请联系删除  1、个人信息处理者在处理个人信息前,未以显著方式、清晰易懂的语言真实、准确、完整地向个人告知个人信息处理者的名称或者姓名、联系方...

              我国科学家实现“双环路”脑机“互学习”新突破

              我国科学家实现“双环路”脑机“互学习”新突破

                天津大学与清华大学联合研发出一款“双环路”脑机接口系统。此系统不仅精度更高、能耗更低,还能处理更为复杂的任务。图片来源于网络,如有侵权,请联系删除  这款基于忆阻器神经形态器件的无创演进脑机接口系统,成功揭示了脑电发展与解码器演化在脑机交互过程中的协同增强效应,实现了人脑对无人机的高效四自由度操...

              2025年我国智能算力规模预计增长43%

              2025年我国智能算力规模预计增长43%

                “DeepSeek系列模型的发布将加速人工智能的渗透、扩散和普及,实质性带动算力需求的增长。”2月13日,《2025年中国人工智能计算力发展评估报告》发布,浪潮电子信息产业股份有限公司(以下简称“浪潮信息”)高级副总裁刘军在发布会上说。图片来源于网络,如有侵权,请联系删除  《报告》由国际数据公...

              腾讯紧急调用元宝支持微信搜索,助力更多用户体验DeepSeek

              腾讯紧急调用元宝支持微信搜索,助力更多用户体验DeepSeek

                2月18日,为了让更多用户方便稳定地体验和使用DeepSeek,腾讯内部紧急协调部署,调用元宝支持微信搜索,给用户提供更多入口和选择。图片来源于网络,如有侵权,请联系删除  从2月18日开始,尚未被灰度到AI搜索的用户,点击微信对话框顶部的搜索栏,进入微信搜索,将有机会在页面中看到“下载元宝(体...