Keywords AI
免费
Keywords AI(当前运营品牌 Respan)是面向 AI 工程团队的 LLM 平台,把生产链路追踪、监控指标、在线/离线评测、Prompt 版本管理和统一 LLM Gateway 放到同一工作流中,适合需要治理成本、质量和模型路由的团队。
Keywords AI 工具正文
Keywords AI 的核心参数与统计
Keywords AI 当前对外运营品牌为 Respan。官方品牌页说明其法律实体是 Keywords AI, Inc.,品牌与产品统一使用 Respan;因此本工具条目保留历史工具名 Keywords AI,同时在正文中使用 Keywords AI(Respan)指代当前产品。官网结构化数据把产品描述为统一 LLM observability、evals、prompt optimization 与 LLM gateway 的 AI 工程平台,文档页进一步把核心数据结构定义为 span。
| 项目 | 当前公开信息 |
|---|---|
| 产品定位 | 面向 LLM 与 Agent 产品的 AI engineering platform |
| 核心数据结构 | span,保存输入、输出、模型、指标和 metadata |
| 主要工作流 | Trace & monitor、Evaluate & optimize、Prompt & gateway、Iterate |
| Gateway 覆盖 | 官方文档标注支持 250+ models |
| 集成生态 | changelog 标注 95+ integrations overview |
| SDK 与接入 | Python SDK、TypeScript SDK、API、OTLP/JSON ingestion、框架集成 |
| 公司与品牌 | 法律实体 Keywords AI, Inc.,运营品牌 Respan |
| 创始信息 | 官方结构化数据列出 foundingDate 2024、founder Hendrix Liu |
| 平台入口 | Web 控制台与 API |
边界定位:Keywords AI(Respan)不是单纯的聊天机器人或 Prompt 生成器,而是把 LLM 调用的路由、日志、评测和 Prompt 部署放进同一工程闭环。它更适合已经在生产中运行 LLM/Agent 流量的团队;只有少量手工 Prompt 实验的个人用户,通常难以马上用满它的监控和评测能力。
Keywords AI 的用户与市场认可
YC 背书:Y Combinator 公司页收录 Respan,并与官方站点、品牌页的公司信息互相印证。对采购或技术评估来说,这类公开公司页的价值不在于证明产品效果,而在于确认团队身份、公司存在和外部加速器背景。
工程团队导向:官方文档直接写明目标是 teams shipping LLM and agent products,并把 developers 和 PMs 放在同一套工作流里。这意味着它的核心用户不是单个 Prompt 作者,而是需要共同管理质量、成本、版本和上线风险的产品工程团队。
生态认可信号:2026-03-26 changelog 公开 95+ integrations overview,覆盖 Agent Frameworks、LLM SDKs、Coding Agents、Vector Databases 和 Model Providers。这个数字说明它已经从单一日志工具扩展到较完整的 AI 工程接入层,但企业客户数、付费客户数和营收规模未公开,不能据此推断商业渗透率。
Keywords AI 的成本优势:用一套 span 数据串起监控、评测与网关
Keywords AI(Respan)的成本优势不在“最低单价”,而在减少多套工具之间的数据搬运。span 同时承载输入、输出、模型、指标和 metadata 后,监控、评测、Prompt 版本和 Gateway 路由可以复用同一份生产数据,降低工程团队为日志、评测集、告警和部署各自建表的维护成本。
C 端 / 个人:Pricing 页标题与描述显示支持从免费方案开始,但个人用户如果没有真实 LLM 流量、数据集或 Agent trace,主要只能体验控制台、Prompt 与少量调用日志,收益边界较窄。免费额度、具体限制和超额计费以官方实时页面为准。
开发者 / API:Gateway 支持通过一个 API 路由 250+ 模型,并提供 fallbacks、retries、load balancing 和 caching。开发成本主要来自接入 SDK、替换 base URL、设置 metadata、维护评测器和处理额外网关延迟;文档明确提示 Gateway 会增加约 50-150ms 延迟,对极低延迟链路需要单独评估。
企业 / 私有化:Enterprise、Book a demo、support 和合规页面显示其面向企业采购,但企业条款、SSO、审计、数据保留、HIPAA BAA、区域托管等细节需要商务确认。对企业而言,隐性成本通常集中在数据治理、模型供应商账单归集、上线审批和评测标准制定,而不是单一平台订阅费。
Keywords AI 的主要功能
- LLM Observability:通过 traces、spans、threads 和 scores 展示 Agent 执行树、模型调用、输入输出、延迟、成本、token、错误率等指标,适合排查生产中的质量波动和异常调用。
- Monitoring Views 与 Alerts:文档说明 dashboard 可展示 requests、tokens、latency、cost、error rates,并支持保存 Views 与设置 Slack/Email monitors,用于把日常排障从手工查日志转为可订阅的监控视图。
- Online / Offline Evals:评测支持在线生产流量和离线测试集两种模式,可用 LLM judge、代码检查或人工评审生成 scores,适合比较 prompt 版本、模型和配置组合。
- Prompt Management:支持带
{{variables}}的模板、commit versions、playground 测试和无代码变更部署,适合把 Prompt 从代码仓库里拆出来交给产品和工程共同维护。 - LLM Gateway:通过单一 API 接入多模型,并提供自动日志、fallbacks、retries、load balancing 与 caching,适合多模型路由、供应商切换和成本/稳定性治理。
- Framework 与 SDK 接入:官方文档列出 OpenAI Agents SDK、Vercel AI、Mastra、LangGraph 等框架集成,并提供 Python、TypeScript SDK 与手动 ingestion 路径,适合从已有代码渐进接入。
这些功能的共同点是围绕“生产数据回流”。如果团队只是离线比较几个 Prompt,单独的表格或 notebook 已经足够;当 Prompt 版本、线上表现、模型成本和用户反馈需要闭环时,Keywords AI(Respan)的平台价值才会更明显。
Keywords AI 的模型与版本演进
Keywords AI(Respan)是持续迭代的云端产品,没有传统桌面软件式的语义化大版本号。当前可核验的版本脉络主要来自官方 changelog 与品牌页。
主线发布
- 2026-06-14 / Prompt bulk updates:最新公开 changelog 节点,新增 Prompt 批量更新,支持同时编辑多个 Prompt,并带有模型配置和 commit message 支持;同时改进 Prompt 与 Playground 数据加载性能。
- 2026-03-26 / Respan CLI 与 95+ integrations overview:公开
@respan/cliv0.6.0、respan integrate,并上线覆盖 Agent Frameworks、LLM SDKs、Coding Agents、Vector Databases 和 Model Providers 的集成概览。 - 2026-03-13 / OpenAI SDK TypeScript integration:新增 OpenAI SDK TypeScript 自动 instrumentation,覆盖 streaming、tool calls、multi-turn、structured output 和 batch API 示例。
- 2026-03-06 / Unified Python & TypeScript SDKs:公开统一的 Python 与 TypeScript SDK,以及 Pydantic AI 集成,说明产品开始更系统地面向 Agent 框架追踪。
品牌与产品线
品牌关系:品牌页明确写明法律实体为 Keywords AI, Inc.,运营品牌为 Respan。对外展示、文档、控制台和品牌素材均以 Respan 为主;在工具目录中继续使用 Keywords AI,是为了承接历史名称和用户搜索习惯。
产品线变化:官网顶部 banner 显示 Introducing Respan Gateway,首页主标题强调 Route、observe、evaluate every LLM call,说明产品已经从“LLM 监控/评测”扩展到“网关 + 可观测 + 评测 + Prompt 管理”的完整 LLMOps 工作流。
Keywords AI 的技术优势
span 统一数据模型:所有 LLM 交互都以 span 存储,包含 input、output、model、metrics 和 metadata。机制上的收益是 traces、threads、scores、dashboard、evals 和 prompt/gateway 数据可以对齐,减少“监控一套 ID、评测一套 ID、Prompt 版本又一套 ID”的断裂;适用于 Agent workflow 较长、工具调用较多的产品。
生产数据驱动评测:文档说明 datasets 可以从 production spans 或 CSV imports 构建,online evals 可以在 live production traffic 上运行。这样评测不只停留在静态样例集,而能把真实用户流量纳入回归检查;代价是团队需要先定义可解释的 evaluator 和人工复核流程。
Gateway 与观测联动:Gateway 流量会自动记录并回流到 tracing,Prompt variables 也能出现在 spans 中。机制上的效果是“模型路由/重试/缓存”的工程动作可以和“成本/延迟/输出质量”的观测结果放在一起看,适合多模型供应商并行使用的团队。
多入口接入:SDK、framework integrations、OTLP、JSON API 与 Gateway 并存,让团队可以按风险拆分接入路径:低侵入可先接 trace;需要统一路由时再切 gateway;已有复杂 Agent 框架时用对应 instrumentation。这个优势的边界是:接入越深,治理责任越高,metadata 规范和权限模型必须同步设计。
如何使用 Keywords AI
Keywords AI(Respan)的典型落地路径是先建立可观测数据,再用评测和 Prompt/Gateway 闭环优化。
| 入口 | 适合场景 | 关键动作 |
|---|---|---|
| Web 控制台 | 查看 traces、metrics、views、evals、prompts | 创建账户、生成 API key、查看 dashboard |
| SDK / Framework integrations | 已有 LLM 或 Agent 应用 | 安装 Python/TypeScript SDK,接入 OpenAI Agents SDK、Vercel AI、Mastra、LangGraph 等 |
| Manual ingestion | 已有日志系统或自定义链路 | 通过 OTLP 或 JSON API 发送 traces / spans |
| LLM Gateway | 需要多模型路由与自动日志 | 替换 base URL,配置模型、fallback、retry、load balancing、caching |
| Prompt management | Prompt 需要版本化和无代码部署 | 创建模板、提交版本、在 playground 测试并上线 |
推荐顺序:先用 tracing 捕获一条真实业务链路,确认 input/output、latency、cost、metadata 能被完整记录;再从生产 spans 抽样形成 dataset,加入 LLM judge、代码检查或人工评审;最后把稳定 Prompt 版本与 Gateway 路由纳入部署。这样可以避免在还没有数据基线时就过早讨论模型路由策略。
Keywords AI 的产品定价
Pricing 页公开展示 Free、Pro、Enterprise 的分层,并在页面描述中强调可从免费方案开始、在需要 dedicated support 时升级。公开页面未稳定给出全部企业合同条款,具体额度、席位、用量、保留期限和支持等级应以官方实时 Pricing 与商务确认为准。
| 层级 | 公开定位 | 成本关注点 |
|---|---|---|
| Free | 用于开始接入与验证 | 免费额度、调用量、团队成员、数据保留期限以实时页面为准 |
| Pro | 面向增长中的产品/工程团队 | 关注 spans / traces / evals 用量、成员权限、告警和 Prompt/Gateway 功能边界 |
| Enterprise | 面向规模化与合规团队 | 需要确认 SSO、审计、数据保留、HIPAA BAA、支持 SLA、区域与合同条款 |
| LLM 供应商费用 | 不等同于平台订阅 | OpenAI、Anthropic、Google、Azure 等模型调用费用仍需单独核算 |
成本核算方式:评估总成本时,应把平台订阅、模型调用费、额外 Gateway 延迟、日志保留、评测器调用费和人工评审时间一起计算。尤其是 online evals 和 LLM judge 会新增模型调用,若没有采样策略,评测成本可能随生产流量快速增长。
Keywords AI 的应用场景
- AI 客服与智能助手监控:对多轮会话、工具调用和回复质量做 trace,结合用户维度 metrics 与 alerts 发现成本异常、延迟上升或回复失败。
- Agent 工作流排障:把 Agent step、tool call、LLM call 按父子 span 展示,适合定位哪一步工具调用超时、哪一个子任务造成错误输出。
- Prompt 版本迭代:产品经理和工程师通过 Prompt templates、commit versions、playground 和 experiments 比较版本差异,减少上线后才发现质量回退的风险。
- 多模型路由与供应商治理:通过 Gateway 管理 250+ 模型的调用入口,在不同供应商之间设置 fallback、retry、load balancing 和 caching,适合希望降低单一模型依赖的团队。
- 合规敏感行业的 AI 应用:官网展示 GDPR 与 HIPAA 相关合规说明,并提到 healthcare organizations 可使用 Business Associate Agreement;医疗、金融等行业仍需按自身合规流程复核数据处理条款。
这些场景都依赖“线上数据足够完整”。如果没有稳定的 metadata、customer_identifier、Prompt 版本和业务标签,平台能记录调用,但很难形成可解释的质量和成本分析。
Keywords AI 的适用人群
- AI 产品工程团队:已经有 LLM/Agent 流量,需要把调用、成本、延迟、错误、质量评测和 Prompt 发布统一治理。
- 平台与基础设施团队:希望用 Gateway 管理多模型供应商、fallback、retry、缓存和路由策略,同时保留统一观测面。
- 产品经理与 Prompt 负责人:需要在不频繁改代码的情况下管理 Prompt 模板、版本、实验和上线。
- 质量与合规团队:需要对输出质量、人工评审、评测分数、数据保留和告警链路形成可审计记录。
不适配边界也很明确:只做一次性 Prompt 测试、没有生产调用、没有工程接入能力、或对新增 50-150ms Gateway 延迟无法接受的低延迟链路,通常不适合作为首选。此类场景更适合先用轻量日志、离线评测表或直接 SDK tracing,等业务进入持续迭代阶段再引入完整平台。
Keywords AI 的总结与展望
Keywords AI(Respan)的核心竞争力在于把 LLM 调用生命周期拆成一个闭环:生产 trace 记录事实,monitoring 发现成本和稳定性问题,evals 衡量输出质量,prompt management 管理版本,gateway 负责多模型路由与部署回流。与只做可观测或只做 Prompt 管理的工具相比,它更像 AI 产品的工程控制面。
当前限制主要有三类:第一,品牌已从 Keywords AI 转向 Respan,历史名称与当前官网之间需要在内部知识库中统一映射;第二,企业级价格、用量上限、数据保留和 SLA 未完全公开,需要商务确认;第三,Gateway 的额外 50-150ms 延迟和 LLM judge 评测成本,会影响高吞吐、低延迟或成本敏感业务。
后续值得观察的方向包括:Respan Gateway 的模型覆盖是否继续扩大,online evals 是否沉淀出更标准的评测模板,95+ integrations 是否持续增加主流 Agent 框架与向量数据库适配。落地时更稳妥的方式是先选一条有代表性的 LLM 业务链路做小范围试点,用一周到两周验证 trace 完整率、关键指标覆盖、评测成本和告警有效性,再决定是否扩大到企业级 Prompt 与 Gateway 治理。
版本信息
- Prompt bulk updates :官方 changelog 的最新公开节点,新增 Prompt 批量更新,并改进 Prompt 与 Playground 的加载性能。
- Respan CLI and integrations overview :官方 changelog 公开 Respan CLI、95+ integrations overview,并覆盖 Agent Frameworks、LLM SDKs、Coding Agents、Vector Databases 与 Model Providers 等集成分类。
- Unified Python and TypeScript SDKs :官方 changelog 公开统一 Python 与 TypeScript SDK,并加入 Pydantic AI 集成,用于追踪 Agent 运行。
用户评价