DeepSeek 发布 V4 系列预览版:V4-Pro 达 1.6T 参数,支持百万 token 上下文

2026 年 4 月 24 日,DeepSeek 发布 V4 系列预览版,包含 1.6T 参数的 V4-Pro 与 284B 的 V4-Flash,均支持百万 token 上下文,以 MIT 协议开源,并被华为、寒武纪等芯片厂商采用。

DeepSeek 发布 V4 系列预览版:V4-Pro 达 1.6T 参数,支持百万 token 上下文

2026 年 4 月 24 日,DeepSeek 发布 V4 系列预览版,以 MIT 协议开源。

DeepSeek-V4 预览版 Pro 与 Flash 百万上下文发布概览

图:DeepSeek 官网对话界面。V4 预览版于 2026 年 4 月 24 日以 MIT 协议开源,包含 1.6 万亿参数的 V4-Pro 与 2840 亿参数的 V4-Flash,二者均支持百万 token 上下文,并已获华为、寒武纪等芯片厂商采用。

版本速览

项目 内容
模型系列 DeepSeek-V4(预览版)
发布时间 2026 年 4 月 24 日
旗舰版本 V4-Pro:1.6T 总参数 / 激活约 49B
高性价比版本 V4-Flash:284B 总参数 / 激活约 13B
上下文长度 100 万 token
开源许可 MIT License
生态进展 华为、寒武纪等芯片厂商采用

本次发布亮点

  • V4-Pro 预览版 1.6T 总参数(激活约 49B),代表新一代基础模型能力上限。
  • V4-Flash 预览版 284B 总参数(激活约 13B),强调经济高效与吞吐。
  • 百万上下文:两款模型均支持 100 万 token 上下文窗口。
  • MIT 开源:延续开放策略,便于研究与商用落地。

V4-Pro 与 V4-Flash 对比

维度 DeepSeek-V4-Pro DeepSeek-V4-Flash
总参数 1.6T 284B
激活参数 约 49B 约 13B
上下文 100 万 token 100 万 token
定位 能力上限旗舰 经济高效高吞吐
适用场景 复杂推理、整库代码理解 高频应用、成本敏感场景

DeepSeek 版本演进时间线

版本 发布日期 定位 关键特性
DeepSeek-V2 2024-05 架构奠基 MLA + MoE,128K 上下文
DeepSeek-V3 2024-12-26 旗舰基座 671B MoE,多 token 预测
DeepSeek-R1 2025-01-20 推理特化 强化学习驱动,对标 o1
DeepSeek-R1-0528 2025-05-28 推理升级 数学基准增强,幻觉更少
DeepSeek-V3.1 2025-08-21 混合推理 思考 / 非思考双模式
DeepSeek-V3.2-Exp 2025-09-29 效率实验 稀疏注意力(DSA)
DeepSeek-V3.2 2025-12-01 正式迭代 通用增强 + Speciale
DeepSeek-V4(预览) ✅ 本文 2026-04-24 新一代 Pro 1.6T / Flash 284B,百万上下文

重点影响解读

V4 系列以「旗舰 + 高性价比」双线并进,百万级上下文窗口显著拓展了长文档、代码库与多轮 Agent 场景的处理边界。媒体报道指出,V4 已被华为、寒武纪等芯片厂商采用,体现出国产软硬件协同的进展。

作为预览版,正式能力以官方后续公告为准,建议关注稳定版发布节奏。

对开发者的影响

V4-Pro 适合追求能力上限的复杂任务,V4-Flash 则适合对成本与吞吐敏感的高频应用。百万上下文为整库代码理解、长文档问答等场景提供了新的工程空间,建议在评测环境验证长上下文下的质量与时延表现。

常见问题(FAQ)

Q:V4-Pro 和 V4-Flash 怎么选? A:V4-Pro(1.6T)追求能力上限,适合复杂任务;V4-Flash(284B)经济高效,适合高频、成本敏感场景。

Q:V4 的上下文窗口有多大? A:两款预览版均支持 100 万 token 上下文窗口。

Q:V4 是否开源? A:是,以 MIT 协议发布;作为预览版,正式能力以官方后续公告为准。

参考链接

版权声明:本文内容来自 DeepSeek 官方 。本平台对该内容进行了编译和整理,仅用于信息传播和学习交流之用。如有侵权,请联系我们进行处理。

用户评价

  • 加载评价中...