智谱发布了新一代开源 AI 模型 GLM-4-32B-0414 系列,拥有320亿参数,效果媲美 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列,且支持友好的本地部署特性。该系列包含四款模型:GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414。所有模型均有高质量的预训练数据和强化学习过程,增强了其在指令遵循、工程代码、函数调用等领域的表现。在测试中,GLM-4-32B-0414 的性能比许多更大规模的模型还要优秀,部分指标与 GPT-4o、DeepSeek-V3 等模型相当。 GLM-4-32B-0414 在 IFEval 指令遵循测试中的得分为 87.6,在 TAU-Bench 零售场景测试中的得分为 68.7,在 SimpleQA 搜索增强问答测试中的得分为 88.1。此系列模型还为研究和企业提供了高性能 AI 解决方案,降低了计算成本,支持 MIT 许可。 该系列模型包括: - GLM-4-32B-Base-0414:在预训练阶段采用15T高质量数据,特别是在推理类合成数据的使用上为后续的强化学习打下基础。 - GLM-Z1-32B-0414:增强了数理能力和解决复杂任务的能力。 - GLM-Z1-Rumination-32B-0414:具有深度思考能力,能解决更复杂的开放性问题。 - GLM-Z1-9B-0414:开源9B小尺寸模型,在数学推理和通用任务中表现出色。 该系列在多个基准测试中表现优异,为 AI 领域提供了一个强大的开源选择。
阅读量:153
点赞量:9
收藏量:0