美团开源万亿参数大模型 LongCat-2.0:国产算力与Agentic Coding的里程碑

6月30日,美团正式发布了新一代基础大模型 LongCat-2.0,并宣布将对外开源。作为业界首个全程在五万卡国产算力集群上完成预训练到推理全流程的万亿参数模型,LongCat-2.0 的问世不仅标志着“国模+国芯”全流程闭环的实质性突破,更为全球开发者在 Agentic Coding(智能体编程)领域提供了全新的基础设施。

国模国芯全栈协同:验证国产算力极限

LongCat-2.0 最大的硬核亮点在于其训练底座的“全国产化”。该模型总参数量高达 1.6T,预训练数据规模超过 30T tokens。面对万卡级训练中的硬件故障、通信异常等挑战,美团团队自2023年起与国产算力厂商协同攻坚,通过自研确定性算子、弹性扩缩卡和自动故障恢复等机制,将月均日故障率降低70%以上,训练 MFU(模型算力利用率)提升1.5倍,最终实现了稳态日吞吐超 1T tokens 的卓越表现。这证明了国产算力不仅能“训出”万亿模型,还能保障其在真实任务中的稳定运行。

架构创新:让算力用在“刀刃”上

在模型架构设计上,LongCat-2.0 采用 MoE(混合专家)架构,并围绕真实 Agentic Coding 任务进行了多项原创设计:

  • 零计算专家(Zero-Computation Expert):业界首创的 Token 级动态激活机制。在处理代码任务时,简单的 Token(如标点、常见助词)直接路由至零计算专家,不占用算力;而复杂推理 Token 则自动激活更多专家。这使得模型在 33B~56B 的动态激活范围内,大幅降低了推理成本。
  • LSA 稀疏注意力机制:原生支持 1M(百万级)超长上下文。通过智能筛选关键信息,将长文本计算量从平方级降至线性级,使得 Agent 能够一次性“看见”并精准定位整个中型微服务项目。
  • MOPD 多专家融合架构:融合了 Agent Experts(专攻工具调用与自主纠错)、Reasoning Experts(深耕数学与 STEM 推理)和 Interaction Experts(优化指令遵循),由门控网络根据任务类型动态调度,全面提升综合表现。
性能领跑:登顶全球开发者调用榜单

在正式开源前,LongCat-2.0 的预览版已通过 OpenRouter 平台面向全球开放。凭借在代码生成与自动化编程上的强劲实力,该模型迅速跻身全球大模型调用量前三。在 Hermes、Claude Code 等主流 Agent 框架中,其月调用量分列全球第一和第二,成为最受全球 Agent 开发者欢迎的模型之一。

在权威评测中,LongCat-2.0 同样表现优异。在考察深层工程能力的 SWE-bench Pro 中获得 59.5 分,超越了 Gemini 3.1 Pro、GPT-5.5 和 Claude Opus 4.6;在真实终端指令交互评测 Terminal-Bench 2.1 中取得 70.8 分,展现了在真实运维与开发环境中的稳定执行力。

全面开源:赋能全球开发者生态

为了回馈全球开发者社区,美团官方宣布,将于近期在多平台同步开源 LongCat-2.0 的 Infra 框架、推理引擎以及模型参数等核心技术。这一举措将极大降低企业级 AI Agent 的落地门槛,加速 Agentic Coding 在复杂办公场景与软件工程中的闭环应用。