Vapi
Vapi 是面向开发者的 AI音频 与语音 Agent 平台,可通过 Dashboard、SDK、API、电话、Web Call、Tools 和 Squads 构建可拨打、接听并执行业务动作的语音智能体。
核心参数与统计
Vapi 的产品定位是面向开发者的语音 AI Agent 平台,官网首页用 “Build Advanced Voice AI Agents” 描述其核心能力,文档页进一步说明它负责语音 Agent 所需的复杂基础设施,让团队把精力放在语音体验、业务流程和系统集成上。它不是单一的聊天机器人,也不是单纯的电话线路服务,而是把 STT、LLM、TTS、电话、Web Call、工具调用、日志与合规控制放在同一个开发平台中。
| 项目 | 当前公开信息 |
|---|---|
| 官方定位 | Developer platform for building voice AI agents |
| 主要入口 | 官网、Dashboard、API、Server SDK、Web SDK、CLI |
| 核心对象 | Assistants、Squads、Calls、Phone Numbers、Tools |
| 语音链路 | STT + LLM + TTS,可选择 OpenAI、Anthropic、Google、Deepgram、ElevenLabs 等多类提供商 |
| 电话能力 | 支持创建或导入号码,支持 inbound/outbound calls |
| Web 能力 | 支持在网页和应用中嵌入实时语音对话 |
| 官方规模指标 | 1 Billion calls supported、2.5M+ agents launched、750K+ developers |
| 官网披露延迟 | 首页统计区披露平均延迟 <500ms,文档介绍页描述 real-time conversations 为 sub-600ms |
| 公司背景 | YC Winter 2021;YC 页面披露成立于 2020,总部 San Francisco,团队规模 50 |
产品边界:Vapi 的价值集中在“让开发者把语音 Agent 放进真实电话和业务系统”,因此它更适合需要接入 CRM、日程、工单、订单、支付或内部 API 的场景。只需要普通语音转文字、单次 TTS 生成或离线音频处理的任务,并不是它的最佳使用面。
基础设施含义:Vapi 把实时音频流、模型调用、转写、合成、电话线路、调用记录和工具触发封装为平台能力。对团队而言,这会降低自建语音链路的工程门槛,但同时也要求在模型供应商、电话合规、数据保留和成本拆分上做清晰设计。
用户与市场认可
Vapi 的市场认可主要来自开发者生态、YC 背书、官网披露的使用规模和企业客户信号。YC 页面把 Vapi 描述为 “Voice AI for developers”,并披露其 Batch 为 Winter 2021、总部在 San Francisco、团队规模 50,这些信息说明它已经从早期项目进入有明确团队和招聘节奏的商业化阶段。
规模数据:官网首页统计区披露 1 Billion calls supported、2.5M+ agents launched、750K+ developers,以及企业客户 99.9% uptime。这些数字更适合用来判断平台使用广度和企业化方向,而不是直接推断收入或付费客户数量;后者未在公开页面中稳定披露。
企业信号:官网定价页和首页展示 Amazon Ring、Intuit、ServiceTitan、New York Life 等企业标识,并提供 “Contact Sales” 与 Scale 方案。对采购团队而言,这说明 Vapi 已经把产品从开发者自助试用扩展到企业销售、专属支持、SLA 和合规要求。
开发者采用逻辑:Vapi 的文档结构非常工程化,覆盖 Quickstart、API Reference、Webhooks、Server URLs、MCP、Tools、Squads、HIPAA、PCI、GDPR 等路径。它的采用门槛不是“会不会写 Prompt”,而是团队是否有能力把语音 Agent 与真实系统、数据权限和异常处理串起来。
成本优势
Vapi 的成本优势不在“所有费用打包到最低”,而在于把语音 Agent 的成本拆成可控的组件。官网定价页显示 Build 方案下 Vapi Hosting Cost 中 Calls 为 $0.05/min,SMS/Chat 为 $0.005/msg;STT、LLM、TTS 等模型提供商成本以 at cost 处理,若自带 API key 则可为 $0。Scale 方案则进入 volume based 与 custom 结构。
| 成本层级 | Build 公开信息 | Scale/企业公开信息 | 需要额外确认的部分 |
|---|---|---|---|
| C端/个人试用 | Dashboard 可创建 Agent;美国免费 Vapi Number 每个 wallet 最多 10 个 | 不适用 | 试用额度、调用量、并发和实际模型费以实时页面为准 |
| 开发者/API | Calls $0.05/min;SMS/Chat $0.005/msg;10 路并发 included,额外 $10/line/mo | Call Minutes custom;Call Concurrency custom | STT/LLM/TTS、Telephony、Transport 供应商成本需单独核算 |
| 企业/私有化 | Build 适合验证和早期上线 | Scale 需要 Contact Sales;含企业级 uptime、专属支持、SLA、SSO/RBAC 等条款 | 固定平台费、承诺用量、数据保留、合规附加项和合同条款需商务确认 |
显性费用:平台费按调用或消息计量,适合先用小规模真实电话流量验证转化率、接通率和自动化率。相比一开始自建 WebRTC、电话线路、音频流处理和调用日志,Vapi 的显性平台费更容易进入试点预算。
隐性费用:生产环境的总成本还包括模型、转写、合成、电话运营商、数据保留、监控、Prompt/工具维护和人工兜底流程。Vapi 提供成本估算器,但真实账单会随模型选择、平均通话时长、提示词长度、并发和转接策略变化。
合规附加项:定价页公开列出 HIPAA add-on $2000/mo、Zero Data Retention add-on $1000/mo。对医疗、金融、保险等团队而言,这些费用不能只看成附加开销,而应与数据保留、审计、供应商合规和内部风控成本一起评估。
主要功能
Vapi 的功能围绕“把语音 Agent 从 Demo 推到真实呼叫和业务流程”展开。文档把构建路径拆成 Assistants 和 Squads 两类核心原语,前者适合单一任务和快速迭代,后者适合多角色、多流程、需要保留上下文的转接。
- Assistants:用系统提示词、模型配置、声音、工具和结构化输出定义一个语音 Agent,适合客服、线索筛选、预约、路由等单任务场景。
- Squads:把复杂流程拆成多个专门 Assistant,并在对话中交接上下文,适合医疗分诊、预约、电商订单、退货、物业维修等多步骤任务。
- Phone Calls:支持创建电话号码、接听来电和发起外呼,官方 Quickstart 展示了创建 Assistant、绑定号码、发起 call 的完整路径。
- Web Calls:支持将实时语音对话嵌入网页或产品,让语音 Agent 不只存在于电话线路中。
- Tools:支持 Default Tools、Custom Tools、Code Tools、Integration Tools,可执行转接电话、访问外部数据、触发业务系统、运行 TypeScript 等动作。
- Knowledge Base 与结构化输出:适合把通话结果沉淀为可检索知识、质检字段、线索字段或后续流程输入。
- 合规与隐私控制:文档提供 HIPAA、PCI、GDPR、SSO、Static IP、Data Flow、Recording Consent Plan 等配置说明,面向受监管行业的上线需求。
这些功能的关键不是单点是否新奇,而是它们能否组成闭环:呼入/呼出触发、实时对话、业务工具调用、转接、记录、分析、合规和后续自动化。如果团队只做一次性语音 Demo,Vapi 的平台能力会显得偏重;如果目标是持续运营电话自动化,它的组合能力更有价值。
模型与版本演进
Vapi 是持续迭代的云平台,公开信息更适合按产品里程碑而不是传统版本号理解。当前可核验的最新节点是 2026-05-12 官方博客发布的 Series B 公告,标题强调为下一代企业语音 AI 提供动力,并在官网横幅中持续展示这一节点。
主线里程碑
- 2026-05-12:Enterprise Voice AI Scale Update。官方博客披露 Series B 节点,并将 1 Billion calls、2.5M+ agents、750K+ developers 等规模数据放入官网统计区,说明平台叙事从开发者工具扩展到企业级语音 AI 基础设施。
- 2025-04-18:Vapi MCP Server。官方博客发布 MCP Server,文档索引也提供 “Vapi MCP Server” 页面,用于把 Vapi 能力连接到支持 Model Context Protocol 的 AI 客户端和工作流。
- 2025-03-13:Vapi Voices。官方博客发布声音能力节点,强化语音 Agent 的自然表达和企业语音体验。
- 2025-02-25:Free Telephony。官方文档说明可在 Dashboard 创建免费 Vapi Number,目前直接创建限美国号码,每个 wallet 最多 10 个免费号码。
能力演进逻辑
Vapi 的演进路线可以概括为三段:先用 Assistants、电话和 SDK 降低语音 Agent 构建门槛;再用 Tools、Squads、Webhooks 和 Knowledge Base 支持真实业务工作流;最后用企业定价、合规配置、SLA、MCP 和规模化基础设施服务大客户。团队评估版本时,不应只看单个功能上线日期,更应验证当前 Dashboard、API 和文档是否已经覆盖自己的上线链路。
技术优势
Vapi 的技术优势来自实时语音基础设施和可组合架构,而不是自称拥有某一个固定大模型。文档说明一个 Vapi assistant 由 STT、LLM、TTS 三类核心技术组成,并允许开发者控制这些组件,选择 OpenAI、Anthropic、Google、Gladia、Deepgram、ElevenLabs 等提供商。
低延迟链路:语音 Agent 的体验高度依赖 turn-taking 与响应延迟。官网披露平均延迟 <500ms,文档介绍页描述 real-time conversations 为 sub-600ms,这意味着 Vapi 的核心工程价值在于把音频流、模型输出和语音合成串成可对话的实时链路。
模型与供应商可替换:Vapi 不把团队锁死在单个 STT、LLM 或 TTS 供应商上。机制上的效果是,团队可以按场景在质量、速度、成本、语言和合规之间切换组合;适用场景包括高质量销售外呼、低成本通知电话、多语言客服和医疗隐私场景。
工具调用与后端集成:Tools 让语音 Agent 能在对话中访问外部系统、触发 Webhook、执行 TypeScript 或调用 Make/GHL 工作流。机制上它把“说话”变成“说话并执行”,效果是电话场景可以完成预约、查单、转接、更新 CRM、发送通知等闭环动作。
Squads 降低复杂 Prompt 风险:文档明确指出大型全能 Assistant 会带来更高幻觉率、更高成本和更大延迟。Squads 通过拆分专业 Assistant 并保留上下文转接,适合把复杂业务流程拆成可测试、可维护的小单元。
如何使用
Vapi 的典型使用路径从 Dashboard 开始,也可以直接通过 SDK 和 API 构建。官方 Assistant Quickstart 展示了最短路径:创建 Assistant、绑定 Phone Number、发起或接听电话;文档也提供 Web SDK、Server SDK、Webhooks、CLI 和 API Reference,适合从无代码试点逐步进入工程集成。
| 使用入口 | 适合人群 | 典型动作 | 注意点 |
|---|---|---|---|
| Dashboard | 产品、运营、售前、早期验证团队 | 创建 Assistant、测试通话、创建电话号码、查看日志 | 适合快速验证,但上线前仍需梳理权限、成本和兜底流程 |
| API/Server SDK | 开发者、平台团队 | 创建 Assistant、发起 call、管理号码、接收 webhook | 需要保护 API key,并把业务系统接入工具调用 |
| Web SDK | 产品研发团队 | 在网页或 SaaS 产品中嵌入语音对话 | 需要处理浏览器权限、前后端鉴权和用户上下文 |
| CLI/MCP | 工程团队、AI 工作流团队 | 终端管理、接入 MCP 客户端和开发工作流 | 适合工程化管理,不适合作为唯一运营界面 |
试点路径:第一阶段用 Dashboard 建一个单任务 Assistant,例如预约、FAQ 或线索筛选;第二阶段接入 1 到 2 个业务工具,例如日历、CRM 或工单;第三阶段把异常、转接、通话记录、结构化输出和人工复核流程补齐。语音 Agent 上线后,最先验收的指标应是接通率、平均通话时长、任务完成率、转人工比例和单通电话总成本。
产品定价
Vapi 官网定价页采用 Build 与 Scale 两层结构。Build 面向自助构建和按量增长,Scale 面向企业级用量、专属支持和合同化部署。页面同时提供成本估算器,提醒用户把 Vapi Hosting、Transport、STT、LLM、TTS 等组件分开计算。
Build 方案:Calls 的 Vapi Hosting Cost 为 $0.05/min,SMS/Chat 为 $0.005/msg;Call Concurrency 包含 10 路,额外 $10/line/mo;Call history 14 days,Chat history 30 days。模型提供商成本按实际成本处理,自带 API key 时可为 $0。
Scale 方案:Call Minutes、Call Concurrency、数据保留、SLA、支持和商务条款均进入 custom 或 volume based。页面说明 Scale 包含固定平台费和承诺用量,适合有稳定月度通话量、企业级 uptime、专属支持、SSO/RBAC 或合规要求的团队。
附加项与边界:HIPAA add-on 为 $2000/mo,Zero Data Retention add-on 为 $1000/mo。免费号码文档说明目前只有美国号码可直接通过 Vapi 创建,每个 wallet 最多 10 个免费号码;全球号码仍可通过号码导入功能接入。生产预算应按“平台费 + 模型费 + 语音合成/转写 + 通信线路 + 合规/支持 + 内部维护”综合评估。
应用场景
Vapi 适合语音是主入口、且对实时响应和业务动作有要求的场景。它的典型价值来自“通话中完成任务”,而不是单纯回答问题。
- 客服与呼入支持:处理常见问题、身份验证、订单查询、余额查询、工单创建和转人工。收益来自减少重复人工接听,并把通话摘要与结构化字段自动回写系统。
- 销售线索筛选与预约:外呼或呼入时收集 BANT、需求、预算、时间表和联系方式,再调用日历或 CRM。收益来自提高线索响应速度,并减少销售团队在低意向电话上的时间。
- 医疗与预约分诊:Squads 可把分诊、紧急情况识别、预约和转接拆成不同 Assistant。该场景必须重点启用 HIPAA 相关配置,并避免把 PHI 存入不该存储的配置字段。
- 电商订单与退换货:通过工具调用查询订单、退货状态、物流和客户等级,把通话上下文传给下一个 Assistant 或人工坐席。
- 物业、保险和本地服务调度:适合维修报修、理赔初筛、派工、回访和提醒类电话,关键验收点是任务完成率、误转接率和人工复核成本。
这些场景的共同条件是:业务流程已经足够标准化,后端系统有可调用接口,且团队愿意为失败兜底、人工转接和合规审计设计闭环。没有稳定流程的团队,应先做小范围试点,而不是一次性把所有电话交给 Agent。
适用人群
Vapi 更适合有工程能力、业务流程清晰、电话量或语音交互价值足够高的团队。它对个人用户并非不可用,但真正优势会在“语音 + API + 电话 + 业务系统”的组合中体现。
- 开发者与 AI 工程团队:适合快速构建语音 Agent、接入模型供应商、写工具调用、管理 Webhooks 和部署到电话/Web 场景。
- 客服、销售和运营团队:适合把重复呼入、线索筛选、预约确认、回访提醒等流程半自动或全自动化,但需要产品/工程团队配合配置工具和数据流。
- 企业平台与合规团队:适合评估 SSO、RBAC、数据保留、HIPAA、PCI、GDPR、静态 IP、代理服务器等治理能力,决定是否纳入正式呼叫中心或业务系统。
- AI Agent 代理商与解决方案商:适合用 Vapi 作为底层语音 Agent 基础设施,为垂直行业客户搭建可定制的电话自动化方案。
不太适合的情况包括:只需要录音转写、只做单次语音生成、没有后端系统可接、通话量极低且无需自动化闭环、或无法承担模型/通信/合规成本波动的团队。语音 Agent 对体验容错率很低,缺少人工兜底和日志复盘机制时,上线风险会显著增加。
总结与展望
Vapi 的核心竞争力在于把语音 Agent 的底层复杂度包装成开发者平台:实时语音链路、电话/Web 通道、模型供应商选择、工具调用、Squads、日志、合规和企业支持都能在同一体系内组合。它适合从“可说话的 Demo”迈向“可接电话、可执行任务、可被审计的生产系统”的团队。
当前限制也很清楚:总成本不只来自 Vapi 平台费,模型、通信、转写、语音、并发、合规和数据保留都会影响预算;免费号码直接创建当前限美国号码;医疗和支付等场景必须严格配置 HIPAA/PCI 相关能力;复杂流程需要通过 Squads、工具和人工转接设计来降低幻觉和误执行风险。
后续观察重点包括三类:一是 Scale 方案在大客户中的 SLA、并发和数据保留能力是否进一步公开;二是 MCP、Tools、Code Tools 和集成生态能否让语音 Agent 更自然地进入企业工作流;三是 Vapi Voices、供应商选择和低延迟链路是否继续降低电话场景的自然度与成本门槛。落地时建议先用 1 条高频低风险流程验证,再扩展到多 Assistant、多渠道和企业合规部署。
版本信息
- Enterprise Voice AI Scale Update :官方博客发布 Series B 节点,披露 Vapi 已支持 1 Billion calls、2.5M+ agents launched、750K+ developers,并强调企业级语音 AI 扩展。
- Vapi MCP Server :官方博客发布 Vapi MCP Server,让开发者把 Vapi 语音 Agent 能力带入支持 MCP 的工作流和 AI 客户端。
- Vapi Voices :官方博客发布 Vapi Voices,补强语音 Agent 的 TTS/声音体验能力。
- Free Telephony with Vapi :官方文档与博客披露 Free Telephony 能力,美国号码可在 Vapi Dashboard 中创建免费 Vapi Number,并可绑定 Assistant 或 Squad。
用户评价