模型介绍
近日,智谱全新开源 GLM-5.2!PAI 平台现已支持 GLM-5.2 模型,一键即可部署调用!
GLM-5.2 支持1M 无损上下文,在长程任务中保持领先,多个长程任务基准均为开源最强模型;提供更强体感、更实用的Coding 能力,在主流编程基准上,GLM-5.2 保持开源 SOTA,与 Claude Opus 4.8 处于可比区间;通过模型架构、推理系统和训练基础设施的协同设计,带来极致 Infra 优化。
在全球百万用户参与盲测的前端开发评估系统 Code Arena 上,GLM-5.2 取得全球可用模型第一的表现。
除 GLM-5.2 外,PAI-Model Gallery 同样支持MiniMax M3、Kimi K2.7 Code、Qwen3.6、DeepSeek-V4、GLM-5.1等前沿模型的一键部署。其中 DeepSeek-V4 支持Deepseek-V4-Pro 和 Deepseek-V4-Flash 全系列模型,含 FP8/Int8 量化版,并可使用真武 810E 高效支持推理需求(DeepSeek-V4-Flash-Int8-W8A8)!
一键部署 GLM-5.2 模型
- 在 PAI-Model Gallery 模型广场找到GLM-5.2模型,或通过链接直达该模型:
GLM-5.2:https://pai.console.aliyun.com/#/quick-start/models/GLM-5.2/intro
GLM-5.2-FP8:https://pai.console.aliyun.com/#/quick-start/models/GLM-5.2-FP8/intro
- 在模型详情页右上角点击「部署」,选择计算资源后,即可一键完成云上部署。
GLM-5.2 支持 vLLM 高性能部署框架 / SGLang 高性能部署框架,支持分布式部署,需 16*GPU 或以上资源;
GLM-5.2-FP8 支持 vLLM 高性能部署框架 / SGLang 高性能部署框架,支持单机部署,需 8*GPU 或以上资源;
- 部署成功后,在服务页面可以点击“查看调用信息”获取调用的调用地址和 Token,想了解服务调用方式可以点击模型详情页,查看调用方式说明。
PAI-Model Gallery 简介
Model Gallery 是阿里云人工智能平台 PAI 的产品组件,它集成了国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域。通过 PAI 对这些模型的适配,用户可以以零代码方式实现从训练到部署再到推理的全过程,简化了模型的开发流程,为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。
PAI-Model Gallery 访问地址:https://pai.console.aliyun.com/#/quick-start/models
阿里云 PAI-Model Gallery 已同步接入 GLM-5.2、Kimi K2.7 Code、MiniMax M3、Kimi K2.7 Code、Qwen3.6-35B-A3B 与 DeepSeek-V4 等最新主流模型,提供企业级部署方案。
✅ 零代码一键部署
✅ 自动适配云资源
✅ 开箱即用API
✅ 全流程运维托管
✅ 企业级安全 数据不出域
更多模型支持
PAI-Model Gallery 持续提供开源社区热门模型的快速部署、微调、蒸馏、评测实践,模型覆盖Qwen、Wan、DeepSeek、Kimi、MiniMax等优秀开源模型,同时还提供 Qwen3-235B-A22B-PAI-optimized、Qwen3-Next-80B-A3B-Instruct-FP8-PAI-optimized、DeepSeek-R1-0528-PAI-optimized 等 PAI 优化版本模型,内置了 PAI 优化版的 EP+PD 分离部署等模板,性能更优。
联系我们
欢迎各位小伙伴持续关注使用 PAI-Model Gallery,平台会不断上线 SOTA 模型,如果您有任何模型需求,也可以联系我们。您可通过搜索钉钉群号(77450028832),加入 PAI-Model Gallery 用户交流群。