新闻动态
2024年05月06日
DeepSeek 发布 V2 开源大模型:首创 MLA 架构,236B MoE 主打高性价比
2024 年 5 月,DeepSeek 发布 DeepSeek-V2 系列开源大模型,首次引入多头潜在注意力(MLA)与 MoE 稀疏架构,236B 总参数、单 token 激活约 21B,以极低推理成本对标主流模型,奠定后续 V3、R1 的高效路线。
来源:DeepSeek 官方
2026年06月09日
一文看懂 ChatPDF:面向研究与学习场景的文档问答平台
ChatPDF 提供文档级 AI 对话能力,覆盖摘要、问答、引用定位、多文件聊天与多语言支持,并提供免费层与 Plus 升级路径。
来源:ChatPDF 官方文档
Qwen 功能拆解与适用场景梳理
Qwen 是阿里巴巴通义实验室自研的旗舰开源大模型与 AI 对话产品。本文梳理 Qwen3 系列、Qwen Studio、Qwen Coder、Qwen-VL 多模态生态以及定价方案。
来源:Qwen 官方文档
Replicate 能力解析:AI模型训练场景怎么用
Replicate 提供统一 API 接入数千个开源 AI 模型,支持图像生成、LLM、视频、音频等多类任务,按实际用量计费,开发者无需管理 GPU 基础设施即可快速集成最新 AI 能力。
来源:Replicate 官方文档
Cohere 产品观察:AI聊天助手方向的能力盘点
Cohere 是加拿大企业级大模型平台,核心产品包括 Command、Embeddings、Rerank 与 North。本文整理其技术路线、部署模式、定价方式与应用场景。
来源:Cohere 官方文档
Canva 能力解析:AI图像与设计场景怎么用
Canva 是全球流行的在线设计平台,以模板化编辑与团队协作为核心,并集成 Magic Studio AI。本文梳理其功能、定价与应用场景。
来源:Canva 官方文档
Khanmigo 产品观察:AI学习方向的能力盘点
Khanmigo 是 Khan Academy 推出的 GPT-4 AI 学习导师,以苏格拉底式教学法为核心,引导学生主动思考而非被动接受答案。
来源:Khanmigo 官方文档
Groq 能力解析:AI模型训练场景怎么用
Groq 通过自研 LPU 硬件提供业界最快 AI 推理速度,最高 1000 tokens/秒,支持 Llama 4、Qwen3 等开源模型。
来源:Groq 官方文档
Jasper 怎么用:面向企业营销团队的 AI 内容平台
Jasper 是面向企业营销团队的 AI 平台,提供 AI Agents、品牌声音、Jasper Studio 等能力。本文梳理其能力栈、定价与适用场景。
来源:Jasper 官方文档
重新认识 Opus Clip:AI视频工具的核心能力
Opus Clip 用 AI 自动从长视频中提取最具传播力的片段,自动添加字幕、重构画面至 9:16,快速生成适合 TikTok、Reels、YouTube Shorts 的短视频,1M+ 用户在用。
来源:Opus Clip 官方文档
Sudowrite 产品观察:AI写作方向的能力盘点
Sudowrite 是专为小说家、编剧和创意写作者设计的 AI 助手,提供故事引擎、角色弧度、场景续写、感官描写增强等功能,帮助创作者克服写作障碍,加速故事完成。
来源:Sudowrite 官方文档
Midjourney 产品观察:AI图像与设计方向的能力盘点
Midjourney 是面向创意行业的 AI 图像生成工具。本文整理其核心参数、版本演进、使用方式、地区限制与订阅价格,便于个人创作者与团队快速评估。
来源:Midjourney 官方文档
2026年06月16日
腾讯云 DeepSeek-V3.2 将于7月16日下线,用户需迁移至V4系列
腾讯云公告DeepSeek-V3.2模型将于7月16日正式下线,建议用户迁移至V4系列。未完成迁移的系统将自动切换至最新模型。
来源:IT之家