GLM-4.6

智谱旗下AI大模型

GLM-4.6是智谱旗下新一代旗舰模型，于2025年9月30日发布。该模型总参数量355B，激活参数32B，通过智谱MaaS平台提供服务1，已上线智谱MaaS平台bigmodel.cn2。智谱同步升级GLM Coding Plan套餐（最低20元包月），新增图像识别与搜索能力，支持Claude Code、Roo Code等10+主流编程工具，并为高频开发者提供三倍用量的GLM Coding Max套餐3。

GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升4。支持200K上下文窗口，token效率提升30%以上，并通过原生Agent功能实现PPT生成与前端代码优化。该模型在八大基准（AIME 25、LCB v6、HLE等）测试中性能全面超越Claude Sonnet 4/4.5，其中74个真实场景编程任务实测领先。该模型在寒武纪AI芯片上实现FP8+Int4混合量化推理部署，成为首套国产芯片运行的模型-芯片一体化解决方案25。同时基于vLLM框架完成对摩尔线程新一代GPU的适配，可在原生FP8精度下稳定运行1。

基本信息

外文名
GLM-4.6
所属企业
智谱3
发布时间
2025年9月30日

模型介绍

智谱AI为 GLM-4.6设定的的描述为“最先进的模型，擅长处理全方位任务”，该模型集成了多模态生成等便捷功能，在预设的AI PPT和灵感画板模式中，模型可以快速将想法变为现实。其强大之处体现在：

极高的代码生成质量：在多个复杂项目中实现了“一次性成功”，代码逻辑严谨、功能完整。

深刻的需求理解与规划能力：无论是拆解游戏规则，还是规划全栈应用开发步骤，都展现了清晰的“思路”。

惊人的执行效率：分钟级的响应速度，大幅提升了开发和研究的效率。

全面的综合能力：无缝整合了联网搜索、多模态生成和应用部署，使其成为一个真正的「全能工作站」。

智谱的GLM-4.6不论是在技术架构、性能表现，还是在使用成本上都为全球业界树立了新的标杆。GLM-4.6会继续开源，计划上线Hugging Face、ModelScope等平台，遵循MIT协议1。

发展过程

2025年9月30日，智谱AI正式发布了旗下新一代旗舰模型GLM-4.61。

主要特点

作为GLM系列的最新版本，GLM-4.6在多个方面实现了全面提升，包括但不限于：

高级编码能力：在公开基准与真实编程任务中，GLM-4.6代码能力对齐Claude Sonnet 4，是国内已知的最好的Coding模型。

上下文长度：上下文窗口由128K增加至200K，适应复杂的代码与智能体任务。

推理能力：推理能力提升，并支持在推理过程中调用工具。

搜索能力：增强了模型的工具调用和搜索智能体，在智能体框架中表现更好。

更强的写作能力：在文风、可读性与角色扮演场景中更符合人类偏好3。

根据智谱报告，GLM-4.6模型在八大权威基准评测上性能有了全面提升，包括：AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench 和 τ²-Bench。新模型在其中多个基准上胜过了Claude Sonnet 4/Claude Sonnet 4.5，位居国产模型首位。

在Claude Code环境下进行的74个真实场景编程任务测试，GLM-4.6实测性能超过了Claude Sonnet 4，以及其他国产模型。

编程任务测试