GLM-4.6
GLM-4.6是智谱旗下新一代旗舰模型,于2025年9月30日发布。该模型总参数量355B,激活参数32B,通过智谱MaaS平台提供服务1,已上线智谱MaaS平台bigmodel.cn2。智谱同步升级GLM Coding Plan套餐(最低20元包月),新增图像识别与搜索能力,支持Claude Code、Roo Code等10+主流编程工具,并为高频开发者提供三倍用量的GLM Coding Max套餐3。
GLM-4.6在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升4。支持200K上下文窗口,token效率提升30%以上,并通过原生Agent功能实现PPT生成与前端代码优化。该模型在八大基准(AIME 25、LCB v6、HLE等)测试中性能全面超越Claude Sonnet 4/4.5,其中74个真实场景编程任务实测领先。该模型在寒武纪AI芯片上实现FP8+Int4混合量化推理部署,成为首套国产芯片运行的模型-芯片一体化解决方案25。同时基于vLLM框架完成对摩尔线程新一代GPU的适配,可在原生FP8精度下稳定运行1。
基本信息
- 外文名
GLM-4.6
- 所属企业
智谱3
- 发布时间
2025年9月30日
模型介绍
智谱AI为 GLM-4.6设定的的描述为“最先进的模型,擅长处理全方位任务”,该模型集成了多模态生成等便捷功能,在预设的AI PPT和灵感画板模式中,模型可以快速将想法变为现实。其强大之处体现在:
极高的代码生成质量:在多个复杂项目中实现了“一次性成功”,代码逻辑严谨、功能完整。
深刻的需求理解与规划能力:无论是拆解游戏规则,还是规划全栈应用开发步骤,都展现了清晰的“思路”。
惊人的执行效率:分钟级的响应速度,大幅提升了开发和研究的效率。
全面的综合能力:无缝整合了联网搜索、多模态生成和应用部署,使其成为一个真正的「全能工作站」。
智谱的GLM-4.6不论是在技术架构、性能表现,还是在使用成本上都为全球业界树立了新的标杆。GLM-4.6会继续开源,计划上线Hugging Face、ModelScope等平台,遵循MIT协议1。
发展过程
2025年9月30日,智谱AI正式发布了旗下新一代旗舰模型GLM-4.61。
主要特点
作为GLM系列的最新版本,GLM-4.6在多个方面实现了全面提升,包括但不限于:
高级编码能力:在公开基准与真实编程任务中,GLM-4.6代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。
上下文长度:上下文窗口由128K增加至200K,适应复杂的代码与智能体任务。
推理能力:推理能力提升,并支持在推理过程中调用工具。
搜索能力:增强了模型的工具调用和搜索智能体,在智能体框架中表现更好。
更强的写作能力:在文风、可读性与角色扮演场景中更符合人类偏好3。
根据智谱报告,GLM-4.6模型在八大权威基准评测上性能有了全面提升,包括:AIME 25、LCB v6、HLE、SWE-Bench Verified、BrowseComp、Terminal-Bench 和 τ²-Bench。新模型在其中多个基准上胜过了Claude Sonnet 4/Claude Sonnet 4.5,位居国产模型首位。
在Claude Code环境下进行的74个真实场景编程任务测试,GLM-4.6实测性能超过了Claude Sonnet 4,以及其他国产模型。