Superwhisper 免费

-

Superwhisper 是一款面向写作、沟通、会议和代码工作流的 AI音频 语音输入工具,官方定位为 macOS、Windows 与 iOS 上的 AI voice to text,支持离线和云端转写、100+ 语言、自定义 AI modes、文件转写与快捷键输入。

Superwhisper 产品界面

核心参数与统计

Superwhisper 的官方定位是 “AI powered voice to text for macOS, Windows, and iOS”,核心任务不是做通用聊天机器人,而是把语音输入、转写、改写和自动粘贴嵌入用户已经在使用的应用。官网的产品页与下载页公开写明,它支持 macOS、Windows 与 iOS,提供离线与云端语音识别、100+ 语言和自定义 AI modes;下载页同时给出 macOS 2.16.1、Windows v1.4.13,以及 iOS 18 或更高版本要求。

项目 公开信息
官方定位 AI powered voice to text for macOS, Windows, and iOS
主要形态 桌面/移动端语音输入、文件转写、会议记录、自定义 AI modes
支持平台 macOS、Windows、iOS
系统要求 macOS 13.3+、Windows 10+、iOS 18+
当前 macOS 版本 2.16.1(2026-06-16,官方 changelog)
当前 Windows 版本 v1.4.13(官方下载页)
语言覆盖 官方称支持 100+ languages & dialects,并可翻译为英文
定价入口 Free、Pro、Enterprise;Pro 月付价格公开为 8 美元

边界说明:Superwhisper 的强项在“把口语变成可直接发送或可编辑文本”,而不是长音频资产管理、播客后期制作或企业呼叫中心质检。高价值场景通常是 Slack、邮件、代码工具、文档和会议笔记这类高频输入任务。

用户与市场认可

官网公开写明 “hundreds of thousands rely on Superwhisper to save time”,并展示来自 Vercel CEO 等用户背书,说明它已经越过早期小众试用阶段,至少在高频写作、技术团队和桌面效率用户中形成可见传播。该数字仍属于官方口径,未拆分月活、付费用户或企业席位,因此不宜延伸为营收或留存判断。

口碑信号:产品首页把 “Used by those who move fast” 放在核心叙事中,重点面向创业公司、工程团队、创作者和快节奏知识工作者。它的用户认可更偏向“输入效率提升”,而不是语音识别基准排名。

平台信号:Superwhisper 拥有官网直装、App Store 入口、X、Discord、YouTube 和 GitHub 组织链接,说明团队以独立产品和社区渠道运营。App Store 页面在当前区域访问会跳转到地区化页面,具体评分、评价量和地区可用性仍应以 Apple App Store 实时页面为准。

成本优势:用语音替代键盘输入的时间成本

Superwhisper 的成本优势主要体现在个人和团队的输入效率,而不是单纯订阅价最低。官网定价区公开提供 Free、Pro 和 Enterprise;Free 可长期使用基础能力,Pro 提供更完整的云端/本地模型、BYOK、文件转写和翻译能力,Enterprise 面向团队管理和合规。

C 端/个人:Free 方案公开为 0 美元,覆盖 any app voice to text、会议录音和转写、100+ 语言、小型 AI 模型无限使用、自定义 prompt 控制和邮件支持。官网 FAQ 还写明可免费试用 Pro 功能 15 分钟录音,购买后提供 30 天退款承诺。

开发者/API:Superwhisper 不是公开 API 平台;它面向终端用户提供 BYOK(Bring Your Own Key)和自定义模型连接能力。开发者成本主要来自个人订阅、外部模型 API Key、云端模型调用和本地硬件性能,而不是按官方 API 调用量计费。

企业/私有化:Enterprise 公开为 Custom,包含 SOC 2 Type II certified、集中 billing/authentication 和 model access control 等团队能力。合同价格、席位、SSO 细节、数据保留和模型访问策略未公开,企业采购需以官方实时商务页面为准。

层级 公开价格/形态 已公开能力 未公开或需确认
Free 0 美元 跨应用语音转文本、会议转写、100+ 语言、小型 AI 模型、自定义 prompt 免费额度细节以官网实时页面为准
Pro 8 美元/月;年付 49 美元;学生 40% off BYOK、Cloud/Local AI models、任意语言翻译为英文、音视频文件转写、优先支持 各模型调用上限与长期价格以官网实时页面为准
Enterprise Custom SOC 2 Type II、集中计费与认证、模型访问控制 席位、审计、合同、数据条款需商务确认

Superwhisper 的主要功能

Superwhisper 的功能不是把语音识别做成孤立窗口,而是围绕“录音、识别、改写、粘贴、复用”形成完整输入链路。

  • 跨应用语音输入:官网强调 voice to text works in any app,适合邮件、Slack、Cursor、浏览器和文档编辑器等输入框。
  • 离线与云端转写:离线模式保证无网络时仍可转写;云端模型用于更高准确率、更复杂语言或性能受限设备。
  • 自定义 AI modes:用户可以按 message、meeting、love letters、screenwriting、poetry 等任务设定语气、格式、语言模型和语音模型,让同一段口述输出不同风格。
  • Super Mode:官网描述为会根据屏幕上下文适配输出的 AI-enhanced mode,适合把选中文本、当前应用和语音指令组合成更具体的结果。
  • 文件转写:支持上传音频和视频文件生成 transcript,Pro 方案明确包含 “Transcribe audio and video files”。
  • Push to Talk 与快捷键:支持按住说话、释放完成,以及自定义快捷键启动、听写和控制。
  • 剪贴板集成:转写与编辑后的文本可自动粘贴到当前应用,减少手动复制粘贴。
  • 会议助手:官网公开会议录音和自动 notes 能力,适合会议纪要、访谈记录和复盘摘要。

这些能力的实际效果取决于麦克风质量、环境噪声、口音、语言模型选择和输出模式配置。对专业术语密集的团队,词汇表和自定义 prompt 往往比“换更贵模型”更先影响可用性。

Superwhisper 的模型与版本演进

Superwhisper 的版本演进以 macOS 客户端 changelog 最完整,Windows 与 iOS 也在下载页和 changelog 中作为独立平台存在。当前公开主线显示,2026 年上半年产品重心正在从“语音转写工具”扩展到“语音驱动的 AI 工作流入口”。

macOS 主线版本

  • 2.16.1(2026-06-16):新增 agent 响应代码片段复制按钮,优化 Coding agent 面板和多个 UI 细节,并修复实时转写开头漏词、窗口漂移与 Claude Code 集成问题。
  • 2.16.0(2026-06-09):加入主题控制、新声音效果、S1-Mini 本地模型实验入口和大词汇表处理能力;会议模式的 AI summary 开始尊重语言选择。
  • 2.15.0(2026-05-29):提升云端语音模型性能,改进 S1 词汇与时间戳处理、噪声环境静音移除和音频文件转写性能。
  • 2.14.0(2026-05-15):加入 BYOK GPT 5.5、历史搜索、词汇 CSV 导入、动态归一化、实时波形门控和 Codex hook 支持。
  • 2.13.0(2026-04-24):重设计 Modes,加入 Claude Code 与 Open Code agent 集成,增强 app/site activation UI。

能力路线

模型路线:changelog 出现 S1-Mini local model、Cloud hosted voice models、GPT 5.5 BYOK、Claude Opus/Sonnet、Gemini、Grok、Groq、Parakeet、ElevenLabs Scribe 等节点,说明产品并不押注单一供应商,而是把本地模型、云端语音模型和 BYOK 大语言模型组合成可选层。

稳定性路线:多个版本围绕长录音、静音移除、词汇表、实时连接、剪贴板和窗口位置修复迭代。对生产使用而言,这类细节比单次 demo 准确率更重要,因为语音输入失败往往发生在连续工作流和长会话中。

Superwhisper 的技术优势

Superwhisper 的技术优势来自“输入链路整合”而非单点识别算法宣传。它把本地/云端语音模型、外部 LLM、模式配置、快捷键、剪贴板和当前应用上下文放进一个桌面入口,减少用户从录音工具、转写工具、改写工具到目标应用之间的切换。

本地与云端并行:离线转写让用户在无网络或敏感文本场景下仍可工作;云端模型给 Intel Mac、长录音、复杂语言或高准确率场景提供补充。官网 FAQ 明确提示 Intel Mac 更适合 Cloud models,离线模型在 Apple Silicon Mac 上运行效果更好。

模式化输出:Custom Mode 允许设定格式规则、结构偏好和专用 prompt;同一段口语可以输出成正式邮件、简短消息、法律语气文本或代码代理指令。机制上是“语音识别 + LLM 后处理 + 应用上下文”,效果是降低二次编辑成本。

可替换模型层:BYOK 和 custom models 让高级用户把 OpenAI、Anthropic、Groq、Ollama 等供应商纳入自己的成本、隐私和质量策略。适合需要控制模型供应商或已有企业模型合约的团队。

如何使用 Superwhisper

Superwhisper 的入口以下载安装为主:用户可从 官方下载页 获取 macOS 与 Windows 客户端,iOS 用户通过 App Store 安装。安装后通常需要授权麦克风、辅助功能或输入相关权限,再设置快捷键和默认 mode。

使用方式 适合人群 特点 关键前提
macOS 客户端 高频桌面输入、开发者、写作者 当前公开版本 2.16.1,支持离线、云端、快捷键、Modes 与 Super Mode macOS 13.3+;离线模型更适合 Apple Silicon
Windows 客户端 Windows 桌面办公用户 下载页公开版本 v1.4.13,支持桌面语音输入 Windows 10+
iOS App 移动端听写、临时记录 官网公开 iOS 入口和 iOS 18+ 要求 App Store 地区可用性以实时页面为准
BYOK/自定义模型 高级用户、工程团队 使用自有模型 Key 或自定义连接控制成本与模型选择 需自行管理 API Key、权限和外部模型费用

典型流程:选择目标应用和输入框,按快捷键或 push-to-talk 开始说话,Superwhisper 完成转写与 mode 后处理,再把文本自动粘贴到当前应用。会议或文件转写场景则先录制或导入音视频,再生成 transcript 与摘要。

Superwhisper 的产品定价

Superwhisper 的公开定价分为 Free、Pro 和 Enterprise。官网结构化数据写明 Free 为 0 美元,Pro Monthly 为 8 美元;页面定价区还公开年付 49 美元、学生 40% 折扣和 Enterprise Custom。

Free:适合先验证“语音输入是否能替代键盘输入”的个人用户。公开能力包括任意应用语音转文本、会议录音与转写、100+ 语言、小型 AI 模型、自定义 prompt 和邮件支持。

Pro:面向需要更完整工作流的人群,公开包含 BYOK、Cloud/Local AI models、任意语言翻译为英文、音视频文件转写和优先支持。对每天大量写邮件、工单、代码说明或会议纪要的用户,Pro 的价值主要来自减少后期编辑时间。

Enterprise:面向团队管理,公开包含 SOC 2 Type II certified、集中计费与认证、模型访问控制。组织采购前应确认 SSO、审计日志、数据保留、模型供应商边界和企业合同支持范围。

Superwhisper 的应用场景

  • 桌面沟通输入:在 Slack、邮件、CRM、Notion 或浏览器输入框中用语音生成可发送文本,价值在于减少长句输入和重复编辑。
  • 开发与代码代理:changelog 已出现 Claude Code、Open Code、Codex hook 和 coding agent panel 等节点,适合把语音转为代码修改指令、提交说明或调试思路。
  • 会议记录与复盘:会议模式可记录并生成 notes,适合小团队例会、客户访谈和项目复盘;验收重点是说话人分离、摘要可信度和敏感信息处理。
  • 跨语言写作:100+ 语言与翻译到英文能力适合非英语母语用户把口语转为英文邮件、社交内容或工作消息。
  • 音视频文件转写:Pro 的文件转写适合把录音、采访和短视频素材转成文本草稿;长录音场景需关注模型速度、稳定性和分段质量。

Superwhisper 的适用人群

  • 高频写作与沟通用户:邮件、即时消息、文档和销售跟进量大,语音输入能直接减少键盘时间。
  • 开发者与技术团队:需要把想法、错误复现、代码审查意见或 agent 指令快速转成结构化文本。
  • 创作者与研究者:用语音记录想法、采访内容、草稿和会议纪要,再通过 mode 调整风格与格式。
  • 企业知识工作团队:希望统一管理语音输入工具、模型访问和团队账单,可评估 Enterprise。

不适配的边界也很明确:噪声极高、录音合规要求极严、必须完全离线且设备性能不足、需要呼叫中心级质检报表,或需要公开 API 批量处理的场景,不应只用 Superwhisper 解决。此类需求更适合专门的转写 API、会议智能平台或企业录音合规系统。

总结与展望

Superwhisper 的核心竞争力在于把 AI 语音输入做成跨应用的日常入口:用户不需要离开当前应用,就能完成说话、转写、改写和粘贴。它适合以文字沟通为主、但键盘输入成为瓶颈的人群,尤其是开发者、创作者、管理者和销售/客服类知识工作者。

当前限制主要有四类:第一,离线模型体验依赖硬件,官方已提示 Intel Mac 更适合云端模型;第二,云端模型和 BYOK 会引入外部模型费用与数据边界;第三,App Store 地区可用性、企业合同条款和完整数据保留策略需以官方实时页面为准;第四,语音输入质量仍受麦克风、噪声、口音和专业词汇影响。

落地建议是先用 Free 或 Pro 试用在 2 到 3 个固定场景中验证,例如邮件回复、Slack 消息、会议纪要和代码代理指令;若团队扩展到 Enterprise,再重点确认 SOC 2 证明、集中认证、模型访问控制、数据处理协议和 BYOK 管理策略。对个人用户而言,最值得观察的是 macOS changelog 中本地模型、Super Mode、coding agent 和长录音稳定性的持续改进。

版本信息

  • Superwhisper macOS 2.16.1 :官方 changelog 公开的 macOS 最新版本,新增 agent 响应代码片段复制按钮,优化 Coding agent 面板、分享卡片、Super picker、顶部栏与录音详情视图,并修复实时转写开头漏词、窗口边缘位置和 Claude Code 集成问题。
  • Superwhisper macOS 2.16.0 :官方 changelog 公开的版本,加入明暗/系统主题控制、新声音效果选项、S1-Mini 本地模型实验入口和更大词汇表处理能力。
  • Superwhisper macOS 2.15.0 :官方 changelog 公开的版本,新增无麦克风音频警告,提升云端语音模型性能、S1 词汇和时间戳处理、噪声环境静音移除与文件转写性能。
  • Superwhisper macOS 2.14.0 :官方 changelog 公开的版本,加入 BYOK GPT 5.5、模型与预设选择器提示、历史视图搜索、词汇 CSV 导入、动态归一化和实时波形门控等改进。

用户评价

  • 加载评价中...