DeepSeek-V3 在复杂推理任务中超越GPT-4o，成本仅3%

2025-02-10

DeepSeek官方

2025年2月10日，深度求索人工智能公司正式对外发布 DeepSeek-V3 大语言模型。这是一款采用 671B 参数 MoE（混合专家）架构的开源模型，在数学推理、代码生成和复杂逻辑推理任务上，性能对标 OpenAI GPT-4o，但 API 调用价格仅为业界平均水平的 3-5%。

核心技术突破

DeepSeek-V3 采用了创新的 MoE 架构设计，虽然总参数量达到 671B，但每次推理仅激活 37B 参数，大幅降低了计算成本。模型支持 128K 上下文窗口，能够处理长达数十万字的文档。

DeepSeek-V3 采用创新的 MoE 混合专家架构，在保持高性能的同时大幅降低计算成本

在多项权威基准测试中，DeepSeek-V3 展现出卓越性能。在 MATH 数学推理任务上得分 88.5%，在 HumanEval 代码生成测试中达到 85.2%，均处于业界领先水平。

DeepSeek-V3 在多项关键基准测试中与 GPT-4o 性能相当，为开发者提供高质量的开源选择

"DeepSeek-V3 在保持顶级性能的同时，将成本降低到原来的 3%，这将彻底改变 AI 大模型的商业化格局。" — 梁文锋，DeepSeek 创始人

DeepSeek-V3 采用 MIT 开源协议，允许商业使用和二次开发。开发者可以通过以下方式使用：

DeepSeek-V3 适用于多种企业应用场景：

DeepSeek-V3 的发布对 AI 行业产生了深远影响。低成本、高性能的开源模型打破了大厂的技术垄断，为中小企业和开发者提供了更多选择。业内专家预测，这将加速 AI 技术在各行业的落地应用。

据悉，DeepSeek 团队正在研发更强大的 DeepSeek-R1 深度推理模型，预计将在复杂的数学、科学和逻辑推理任务上达到新的高度。同时，团队也在探索多模态能力的集成，未来有望支持图像、视频和音频的理解与生成。