DeepSeek 发布 R1-0528 升级版:推理更强、幻觉更少,数学基准显著提升
2025 年 5 月 28 日,DeepSeek 以 MIT 协议发布 R1-0528 升级版,推理能力显著提升、幻觉减少,在 AIME 2025 等数学基准上表现明显增强,是 R1 推理模型的一次重要迭代。
DeepSeek 发布 R1-0528 升级版:推理更强、幻觉更少,数学基准显著提升
2025 年 5 月 28 日,
DeepSeek 以 MIT 协议发布
图:DeepSeek 官网对话界面。R1-0528 于 2025 年 5 月 28 日以 MIT 协议在 Hugging Face 发布,官方称其推理更强、幻觉更少,并在 AIME 2025 等数学基准上表现明显增强。
版本速览
| 项目 | 内容 |
|---|---|
| 模型名称 | DeepSeek-R1-0528 |
| 发布时间 | 2025 年 5 月 28 日 |
| 所属系列 | R1 推理模型系列 |
| 升级重点 | 推理能力、数学基准、幻觉控制 |
| 开源许可 | MIT License |
本次更新亮点
- 推理能力显著提升:复杂任务的稳定性与准确性增强。
- 数学基准增强:官方提及在 AIME 2025 等评测上提升突出。
- 幻觉更少:官方表示新版本推理更可靠、幻觉减少。
R1 与 R1-0528 对比
| 维度 | DeepSeek-R1(初版) | DeepSeek-R1-0528 |
|---|---|---|
| 发布日期 | 2025-01-20 | 2025-05-28 |
| 推理稳定性 | 强 | 进一步增强 |
| 数学基准 | 对标 o1 | AIME 2025 等明显提升 |
| 幻觉控制 | — | 更少幻觉 |
| 许可 | MIT | MIT |
DeepSeek 版本演进时间线
| 版本 | 发布日期 | 定位 | 关键特性 |
|---|---|---|---|
| DeepSeek-V2 | 2024-05 | 架构奠基 | MLA + MoE,128K 上下文 |
| DeepSeek-V3 | 2024-12-26 | 旗舰基座 | 671B MoE,多 token 预测 |
| DeepSeek-R1 | 2025-01-20 | 推理特化 | 强化学习驱动,对标 o1 |
| DeepSeek-R1-0528 ✅ 本文 | 2025-05-28 | 推理升级 | 数学基准增强,幻觉更少 |
| DeepSeek-V3.1 | 2025-08-21 | 混合推理 | 思考 / 非思考双模式 |
| DeepSeek-V3.2-Exp | 2025-09-29 | 效率实验 | 稀疏注意力(DSA) |
| DeepSeek-V3.2 | 2025-12-01 | 正式迭代 | 通用增强 + Speciale |
| DeepSeek-V4(预览) | 2026-04-24 | 新一代 | Pro 1.6T / Flash 284B,百万上下文 |
重点影响解读
R1-0528 是 R1 系列的一次重要迭代,在不改变开源开放策略的前提下,进一步缩小了与顶级闭源推理模型的差距。对于已经接入
对开发者的影响
对于依赖数学、逻辑与多步推理的场景,建议在预发环境回归核心任务链路并对比 R1-0528 与旧版的结果质量,再分批灰度切换。
常见问题(FAQ)
Q:R1-0528 相比 R1 有哪些提升? A:推理能力显著提升、幻觉更少,并在 AIME 2025 等数学基准上表现明显增强。
Q:是否需要更换接入方式? A:作为同系列升级版本,建议在预发环境回归对比后再分批灰度切换。
Q:R1-0528 的开源许可是什么? A:MIT License,可自由使用与商用。
参考链接
版权声明:本文内容来自
DeepSeek 官方
。本平台对该内容进行了编译和整理,仅用于信息传播和学习交流之用。如有侵权,请联系我们进行处理。
用户评价