适合谁?
本指南适用于开发 AI 产品、API 服务或按用量收费的开发者。常见场景包括:| 业务类型 | 示例 |
|---|---|
| AI API 服务 | LLM API 代理、图像生成、语音识别 |
| AI SaaS | AI 写作助手、AI 代码补全、AI 翻译 |
| AI Agent 平台 | 自动化工作流、数据分析 Agent |
| API 服务 | 支付处理、消息服务、数据查询 |
Waffo Pancake 的收费方式
Waffo Pancake 不提供内置的用量计量功能,但你可以通过以下方式灵活实现 AI 产品收费:方式 1:订阅层级 + Token/请求配额
创建不同层级的订阅商品,每个层级包含不同的 token 或请求配额。以下价格仅为示例,请根据你的实际业务和成本设置。
| 方案 | 月费 | Token 配额 | 适合 |
|---|---|---|---|
| Starter | $9/月 | 100K tokens | 个人开发者 |
| Pro | $49/月 | 1M tokens | 小团队 |
| Scale | $199/月 | 10M tokens | 企业用户 |
方式 2:动态定价(Checkout Session)
通过priceSnapshot 在创建结账会话时传入动态价格,实现按实际用量收费。
方式 3:外部计量工具
使用专业的计量工具追踪用量,配合 Waffo Pancake 完成收费。推荐计量工具
LiteLLM
AI 模型代理和用量追踪,支持 100+ LLM 提供商。统一接口调用 OpenAI、Anthropic、Gemini 等模型,自带用量统计。
OpenMeter
开源用量计量平台,专为 AI 和 API 产品设计。实时追踪 token 消耗、API 调用次数,支持自定义计量指标。
业务场景
以下为示例场景,请根据你的实际业务调整。
场景 1:AI API 服务(按 Token 用量收费)
设置:- 创建分层订阅商品(Starter / Pro / Scale)
- 每个层级包含一定数量的 token 配额
- 使用 LiteLLM 或自建系统追踪 token 消耗
- 当用户接近配额时,提示他们升级
- 在 订阅 页面监控活跃订阅
- 在 分析 中按层级追踪收入
- 查看客户详情以了解使用模式
场景 2:AI SaaS(订阅 + Token 额度)
设置:- 创建带 token 额度的订阅商品
- 在产品 metadata 中记录额度信息
- 用户超出额度后,通过
priceSnapshot创建超额收费订单 - 通过 Webhook 自动处理续费和额度重置
- 监控订阅和一次性订单
- 在 分析 中追踪订阅收入 vs 超额收入
场景 3:AI Agent 平台(按任务/调用计费)
设置:- 创建基础订阅商品(含一定次数的 Agent 调用)
- 每次 Agent 执行完成后记录调用
- 超出包含次数后,使用动态定价创建一次性订单
- 使用 OpenMeter 追踪调用次数和成本
- 在 支付 中查看每客户收入
- 追踪 Agent 调用增长趋势
关键 Webhook 事件
| 事件 | 操作 |
|---|---|
subscription.activated | 设置初始 token/请求配额 |
subscription.updated | 调整配额以匹配新方案 |
subscription.canceled | 撤销 API 访问或降级到免费层级 |
subscription.past_due | 降低配额或限制 API 调用频率 |
order.completed | 发放额外 token 额度(超额购买) |
测试
上线清单
- 为每个层级创建了订阅商品
- 定价和配额文档清晰
- 用量追踪/计量工具已集成
- 配额限制正常工作
- 升级/降级流程已测试
- 超额收费流程已验证
- 商品已发布到生产环境
下一步
运营 SaaS 订阅
了解更多订阅管理知识
配置 Webhook 通知
通过 Webhook 自动化配额管理