DeepSeek-R1-0528 更新官方详解:思考更深、推理更强,整体表现接近 o3 DeepSeek-R1-0528 是 DeepSeek R1 模型的最新版本,宣布完成小版本升级,用户可以通过官方网站、App 或小程序体验最新版本的“深度思考”功能。API 调用方式保持不变。 深度思考能力强化 该模型基于 2024 年 12 月发布的 DeepSeek V3 Base 模型,并在后训练过程中投入了更多算力,显著提升了思维深度与推理能力。新版模型在数学、编程与通用逻辑等多个基准测评中取得了优异成绩,整体表现接近国际顶尖模型如 o3 和 Gemini-2.5-Pro。 "DeepSeek-R1-0528 在评测中的表现" (https://img.ithome.com/newsuploadfiles/2025/5/c88435e8-a523-4bdd-8510-f0b12b0bb04c.png?x-bce-process=image/quality,q_75/format,f_webp) 与旧版 R1 相比,新版模型在复杂推理任务中的表现得到了显著提升。例如,在 AIME 2025 测试中,新版模型的准确率提升至 87.5%。 幻觉改善与创意写作 新版 R1 模型针对“幻觉”问题进行了优化,提升了改写润色、总结摘要和阅读理解的准确性,幻觉率降低了 45% 至 50%。同时,模型还对创意写作方面进行了增强,能更好地生成长篇、结构完整的议论文、小说等。 API 更新 新版 API 支持更强的功能,包括对思考过程的查看、Function Calling 和 JsonOutput 支持。max_tokens 参数已调整为最大支持 64K 的输出。 模型开源 DeepSeek-R1-0528 的权重和开源版本参数与之前版本相同,支持 128K 的上下文长度。该版本继续使用 MIT License 进行开源,用户可以通过模型蒸馏等方式进行训练。 详情请参考 "官方API指南" (https://api-docs.deepseek.com/zh-cn/guides/reasoning_model) 。
阅读量:263
点赞量:16
收藏量:0