DeepSeek-V4-Flash Preview
免费
DeepSeek是幻方量化旗下深度求索自主研发的开源大模型和AI智能助手,专注于通用人工智能(AGI)底层模型与技术研发。推出了 DeepSeek-V3 和 DeepSeek-R1 等多个开源模型,分别对标 GPT-4o 和 OpenAI o1,在推理、数学和编程能力方面表现出色。首个以极低成本实现顶级推理能力的开源模型,应用覆盖智能对话、文本生成、代码生成、联网搜索、深度思考等领域。
核心参数与统计
DeepSeek最新V4系列在同一架构下,提供了以性能为核心的Pro版和以成本为核心的轻量版Flash两个版本:
| 特性 | DeepSeek-V4-Pro | DeepSeek-V4-Flash |
|---|---|---|
| 总参数 | 1.6万亿 (1.6T) | 2840亿 (284B) |
| 激活参数 | 约490亿 (49B) | 约130亿 (13B) |
| 架构 | 混合专家模型 (MoE) | 混合专家模型 (MoE) |
| 上下文窗口 | 1M tokens | 1M tokens |
| 最大输出 | 384K tokens | 384K tokens |
| 训练数据量 | 33万亿 (33T) tokens | 32万亿 (32T) tokens |
| 功能支持 | 思维链 (Thinking Mode)、JSON输出、工具调用 (Function Calls)、上下文缓存 (Context Caching) | 思维链 (Thinking Mode)、JSON输出、工具调用 (Function Calls)、上下文缓存 (Context Caching) |
效率提升:处理1M上下文时,V4-Pro的算力需求 (FLOPs) 仅为上一代V3.2的27%,KV缓存占用仅10%;V4-Flash两项指标更是低至10%和7%。
推理强度:提供三档推理模式按需选择:
- Non-think (直出模式):快速响应,适合日常对话。
- Think High (常规深度思考):平衡速度与质量。
- Think Max (最大深度思考):以更多输出Token为代价,最大化推理和代码场景的上限能力。
用户与市场认可
市场对DeepSeek的认可是多面的,既有C端的巨大声量,也有B端的深厚布局:
C端市场:用户活跃度呈波浪式发展:在2025年春节期间,DeepSeek的日活跃用户数曾超过豆包,并在2月1日突破3000万大关,成为史上最快达成该里程碑的应用。但之后,其APP下载量和日活出现回落。一些用户反映模型有时会生成"幻觉"内容、回答带有"AI味儿"等问题。
DeepSeek的核心用户画像偏向职场先行者,多为25-44岁的高线城市用户。
B端市场:技术底座的"隐形帝国":这是DeepSeek市场影响力的核心。尽管C端热度有所起伏,其技术底座正被广泛应用。据不完全统计,接入DeepSeek的企业已超过3万家,覆盖金融、医疗、工业等12个领域。
行业认可:性能比肩顶尖闭源模型:DeepSeek-V4系列在多个权威基准测试中表现出色,性能上可对标世界顶尖闭源模型,是开源大模型领域的重要力量。
| 能力维度 | DeepSeek-V4-Pro | 对标/对比模型 |
|---|---|---|
| Agent能力 | 开源模型最佳水平 | 体验优于Claude Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式 |
| 世界知识 | 大幅领先其他开源模型 | 稍逊于顶尖闭源模型Gemini-3.1-Pro |
| 推理性能 | 超越所有已公开评测的开源模型 | 在数学、STEM、竞赛型代码等测评中比肩世界顶级闭源模型 |
成本优势:重新定义AI服务的"价格屠夫"
DeepSeek最引人注目的特点之一,就是持续且惊人的成本优势,它正将人工智能从"昂贵技术"变为"基础服务"。
应用与网页:完全免费且不限量:DeepSeek的网页版和官方App对所有用户完全免费,不设次数限制。
API:极致的低价策略:对于企业和开发者,DeepSeek的API价格极具竞争力,其V4系列凭借架构创新实现了成本数量级的下降。
| 服务类型 | 组件 | DeepSeek-V4-Flash | DeepSeek-V4-Pro (2.5折优惠) | 竞品参考价 (GPT-5.5 Pro) |
|---|---|---|---|---|
| 输入 | 缓存命中 | 0.02元 / 百万Token | 0.025元 / 百万Token | ~3.4元 / 百万Token |
| 缓存未命中 | 1元 / 百万Token | 3元 / 百万Token | 约30美元 / 百万Token | |
| 输出 | 2元 / 百万Token | 6元 / 百万Token | 约180美元 / 百万Token |
训练成本:技术驱动的效率革命:以V2等前代模型为例,其训练成本仅为460万美元,相较于GPT-4(约7800万美元)和GPT-4o(约1.2亿美元),成本优势达到数量级水平。
DeepSeek的主要功能
DeepSeek的功能围绕高效处理、深度理解和灵活交互设计,核心功能包括:
- 超长上下文 (1M tokens):这是V4系列最显著的能力。能够一次性处理《三体》三部曲体量的文本,非常适合长文档分析、大规模代码库梳理和复杂对话历史追踪。
- 联网搜索:突破静态知识库的局限,实时获取最新资讯,确保回答的时效性。
- 文件上传与处理:支持上传PDF、Word、Excel、PPT、TXT、图片等多种格式的文件,并进行内容的解析、总结与分析。
- 智能Agent能力:作为SOTA(业界领先)级别的基础模型,可以驱动智能体自主完成编码、工具调用、多步骤任务规划等复杂工作。
- 思维链推理 (Thinking Mode):支持多档推理深度选择,从快速直出到最大深度思考,满足不同任务需求。
DeepSeek 的模型版本演进
DeepSeek 的迭代围绕基础模型能力持续推进,当前已进入 V4 预览阶段。版本脉络可分为两条:面向底层能力的模型版本,以及面向终端体验的 App 版本。
全新 V4 时代(预览)
DeepSeek-V4-Pro Preview:发布于 2026-04-24,约 1.6T 总参数(激活约 49B),定位高性能旗舰。
DeepSeek-V4-Flash Preview:发布于 2026-04-24,约 284B 总参数(激活约 13B),主打高性价比。
V3 系列主干演进
DeepSeek-V3(2024-12):671B MoE 基础版本,生成效率较 V2 明显提升。
DeepSeek-V3-0324(2025-03-24):推理、代码生成与中文写作能力增强。
DeepSeek-R1(2025-01-20):推理强化路线,数学与编程推理表现提升。
DeepSeek-R1-0528(2025-05-28):R1 重要升级,推理基准显著提升。
DeepSeek-V3.1(2025-08-21):混合推理架构,上下文扩展至 128K。
DeepSeek-V3.1-Terminus(2025-09-22):优化语言一致性与 Agent 能力。
DeepSeek-V3.2-Exp(2025-09-29):实验性版本,探索新稀疏注意力机制。
DeepSeek-V3.2(2025-12-01):通用能力进一步增强,知识更新至 2025 年 5 月。
V2 系列早期探索
DeepSeek-V2(2024-05):正式引入 MoE 架构。
DeepSeek-V2.5(2024-09):融合 V2 Chat 与 Coder V2 能力。
DeepSeek-V2.5-1210(2024-12-10):V2.5 系列后续完善版本。
App 与客户端版本
- 当前稳定版本:截至 2026-04,App 稳定版本为
v1.8.5。 - 灰度测试要求:参与 V4 等灰度测试通常需
v1.7.4或更高版本。 - 版本节奏:2026 年已发布
v1.8.0、v1.8.3、v1.8.4等;2025 年持续发布v1.6.x与v1.5.x多个版本。
API 版本演进脉络
| 时间节点 | deepseek-chat(非思考) | deepseek-reasoner(思考) | 关键更新 |
|---|---|---|---|
| 2025-05-28 | (未变动) | 对应 DeepSeek-R1-0528 |
推理能力重点增强 |
| 2025-08-21 | DeepSeek-V3.1 |
DeepSeek-V3.1 |
混合推理架构,128K 上下文 |
| 2025-09-22 | DeepSeek-V3.1-Terminus |
DeepSeek-V3.1-Terminus |
语言一致性与 Agent 能力优化 |
| 2025-09-29 | DeepSeek-V3.2-Exp |
DeepSeek-V3.2-Exp |
稀疏注意力实验版本 |
| 2025-12-01 | DeepSeek-V3.2 |
DeepSeek-V3.2 |
通用能力进一步提升 |
| 2026-04-24 | 指向 V4-Flash 非思考模式 | 指向 V4-Flash 思考模式 | V4 开启新阶段,旧模型名计划于 2026-07-24 停用 |
关于版本资料的说明
- 网络上存在部分非官方版本解析,个别历史版本可能未获官方渠道完整证实。
- 采用第三方资料时建议与官方发布记录、模型页和 API 公告交叉核验。
- 公开资料显示公司于 2023-07 成立,并在 2024-01 发布首个大模型 DeepSeek LLM。
DeepSeek的技术优势
DeepSeek通过算法而非算力堆积实现性能跃升,三大核心技术是其基石:
架构创新:采用MoE(混合专家)架构,在保证模型总参数量巨大的同时,每次推理只激活一部分参数(如V4-Pro激活490亿参数),大幅降低计算成本。
全新注意力机制:
- 混合注意力架构 (Hybrid Attention):通过CSA (压缩稀疏注意力) 和 HCA (重压缩注意力) 两种机制的配合,在1M超长上下文中,将计算量和显存占用降至传统方法的10%-27%,实现了真正的工程可用。
国产算力深度适配:DeepSeek已实现与华为昇腾NPU的深度协同和全面适配,走"国产芯片跑国产模型"的自主路线。
如何使用 DeepSeek
DeepSeek提供了多种使用方式,适合不同需求的用户:
| 使用方式 | 适合人群 | 特点 | 费用 |
|---|---|---|---|
| 网页版 | 所有用户 | 无需安装,打开浏览器访问 chat.deepseek.com 即可使用。 | 完全免费 |
| 手机App | 移动端用户 | 可在iOS或安卓应用商店搜索"DeepSeek"下载。 | 完全免费 |
| API调用 | 开发者与企业 | 可将AI能力集成到自有程序、工作流或产品中。 | 按调用量收费 |
| 私有化部署 | 企业/机构 | 适合对数据安全、合规有严格要求的场景,可部署在本地或私有云。 | 取决于硬件与维护成本 |
对于API调用,开发者可以访问DeepSeek开放平台创建API Key,并按需充值使用。
DeepSeek的产品定价
DeepSeek的定价体系清晰透明,延续了其在B端低廉、在C端免费的策略:
C端产品:免费:DeepSeek的官方网页版和移动App对所有用户完全免费,无使用次数限制。
B端API:按量付费:按实际使用的Token数量计费,价格表如上表所示。此外,API服务还包括每月10万次免费调用的入门额度。企业用户还可根据需求选择不同的付费套餐。
DeepSeek的应用场景
DeepSeek的应用场景非常广泛,已在多个行业落地:
- 地质勘探:应用于地质报告智能信息抽取、地质任务智能体构建、遥感影像智能解译等。例如,在报告处理中,信息抽取准确率达83%,人工整理时间减少超60%。
- 智慧政务:支持公文写作辅助、拟办意见自动生成等,提升办公效率。
- 金融与能源:中国银联等国字号企业已将DeepSeek推向营销、技术研发等核心业务。国家管网集团也已部署"满血版"DeepSeek模型,应用于智能调控、管道安全审核等核心场景。
- 个人与工作:涵盖代码生成、学术文献综述生成、复杂SQL查询、旅行规划助手等。
DeepSeek的适用人群
DeepSeek凭借其多版本策略,服务于广泛的用户群体:
- 个人用户与科技爱好者:可通过免费的网页版或App享受智能对话、信息查询、文件处理等服务。
- 学生与研究人员:利用联网搜索和超长上下文功能,高效完成文献综述、概念学习、论文润色等任务。
- 开发者与初创团队:通过调用API或使用社区版软件开发工具包(SDK),可以快速地将AI功能集成到应用中,或基于模型进行二次开发。
- 企业与中大型机构:对数据安全和业务合规性有更高要求的企业,可选择企业版进行私有化部署,并获取定制化解决方案。
总结与展望
总的来说,DeepSeek通过持续的技术创新,构建了一个面向C端完全免费、面向B端成本极低、提供开源模型和私有部署选项的商业体系。它以亲民的价格和开源的心态,推动了AI技术的平民化。
当然,DeepSeek也正面临挑战。C端用户对内容"AI味儿"过重、产生"幻觉"等问题的抱怨,以及其APP用户活跃度出现回落,都反映出在留住和持续吸引用户方面存在压力。
版本信息
- v4-pro-preview :V4 预览版旗舰模型,1.6T 总参数(激活约49B),代表新一代基础模型能力上限。
- v4-flash-preview :V4 预览版高性价比模型,284B 总参数(激活约13B),强调经济高效与吞吐。
- v3.2 :通用能力进一步增强,性能对标前沿模型,知识库更新至 2025 年 5 月。
- v3.2-exp :实验性迭代,重点验证新的稀疏注意力机制。
- v3.1-terminus :重点优化语言一致性(缓解中英文混杂)与 Agent 能力。
- v3.1 :引入混合推理架构,支持快速响应与深度思考模式切换,上下文扩展至 128K。
- r1-0528 :R1 重大升级,推理能力显著提升,数学基准(如 AIME 2025)表现明显增强。
- v3-0324 :V3 小幅增强版,提升推理、代码生成与中文写作能力。
- r1 :推理特化旗舰版本,强化学习驱动,数学、编程与逻辑推理能力突出。
- v3 :671B MoE 基座模型,生成速度相较 V2 明显提升,奠定后续系列基础。
- v2.5-1210 :V2.5 系列后续完善版本,融合 Chat 与 Coder 能力并持续优化。
- v2.5 :V2 系列融合版,整合 V2 Chat 与 Coder V2 能力。
- v2 :早期关键里程碑,正式引入 MoE 架构,为后续版本演进奠定技术路线。
用户评价