Skip to content

AIHub Gateway PRD

版本: v1.0
日期: 2026-02-06
产品负责人: AIHub PM Team


一、问题陈述

1.1 核心问题

Beacon(AIHub 的 AI 能力品牌)需要稳定、可控的 AI 算力供应:

痛点影响
成本不透明各团队分散采购 AI API,无法统一成本核算
供应不稳定单一供应商故障导致 Beacon 功能中断
缺乏灰度能力无法按模型/场景智能路由请求
支付受限传统支付无法支持 Crypto 原生用户和 Agent 自主付费

1.2 战略定位

AIHub Gateway = Beacon 的算力中台 + x402 Web3 支付基础设施

┌─────────────────────────────────────────────────────────────┐
│                   AIHub 业务架构                             │
├─────────────────────────────────────────────────────────────┤
│  用户付费层(跟单分润 / VIP 订阅 / 交易手续费)               │
│                          ▲                                   │
│                          │ Beacon 驱动业务价值                │
│  ┌───────────────────────────────────────────────────────┐  │
│  │  Beacon: Vibe Trading | 智能问答 | 策略推荐 | 风险预警  │  │
│  └───────────────────────────────────────────────────────┘  │
│                          ▲                                   │
│                          │ 提供 AI 算力                       │
│  ┌───────────────────────────────────────────────────────┐  │
│  │             AIHub Gateway(算力中台)                   │  │
│  │             内部成本中心 + 可选对外开放                  │  │
│  └───────────────────────────────────────────────────────┘  │
└─────────────────────────────────────────────────────────────┘

二、用户场景

2.1 核心用户

用户场景需求
Beacon 开发团队调用 GPT/Claude/Gemini 支撑 Vibe Trading统一 API、成本可控、高可用
AIHub 运营监控 AI 算力消耗和成本用量仪表盘、成本报表
AIHub VIP 用户(远期)直接使用 AI 对话能力免费额度 + 按需付费
外部 AI Agent(远期)自主调用 AI 执行交易决策x402 自动扣款、即时结算

2.2 用户故事

P0: Beacon 开发

作为 Beacon 开发者,我希望通过一个统一的 API 调用任意 AI 模型,这样我不需要关心底层供应商切换。

P0: 运维监控

作为 AIHub 运营,我希望实时看到 AI 调用量和成本,这样我能及时发现异常并优化预算。

P1: 故障恢复

作为 Beacon 服务,当主供应商返回 429/503 时,我希望请求自动路由到备用供应商,这样 Beacon 功能不中断。


三、成功指标

指标Phase 0 目标衡量方式
调用成功率> 99%监控系统
平均延迟增加< 50msAPM
成本节约> 10%与直接调用对比
供应商切换时间< 1s故障转移测试

四、功能规格

4.1 Phase 0 MVP

ID功能说明验收标准
F1统一 API 入口OpenAI 兼容格式,支持 /v1/chat/completions请求格式与 OpenAI 一致
F2多模型支持GPT-5 系列、Claude 4 系列、Gemini 3 系列可通过 model 参数指定
F3多供应商切换云雾 API(主)+ OpenRouter(备)配置文件可热更新
F4故障自动转移429/503/超时自动切换供应商切换延迟 < 1s
F5API Key 鉴权每个调用方分配独立 API Key无 Key 返回 401
F6请求日志Token 消耗、响应时间、供应商、成本日志可查询

4.2 Phase 1+ 战略功能

功能战略价值优先级
钱包登录链上用户体系统一P1
x402 用户充值无地区限制的 Crypto 充值P1
x402 Agent 自主付费Agent 自主调用并付费,差异化核心P1
VIP 权益对接按等级分配免费调用额度P2
智能路由增强成本/速度/质量多维优化P2

五、技术架构

┌─────────────────────────────────────────────────────────────┐
│                    AIHub Gateway                             │
├─────────────────────────────────────────────────────────────┤
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────────────┐  │
│  │  API Layer  │  │ Auth Layer  │  │   (远期)            │  │
│  │  OpenAI 兼容 │  │  API Key    │  │   Payment Layer    │  │
│  └──────┬──────┘  └──────┬──────┘  │   x402 协议        │  │
│         │                │         └──────────┬──────────┘  │
│         ▼                ▼                    ▼              │
│  ┌─────────────────────────────────────────────────────────┐│
│  │                   Router Core                           ││
│  │  ┌───────────┐  ┌───────────┐  ┌───────────────────┐   ││
│  │  │优先级路由  │  │故障转移    │  │(远期)成本/速度路由│   ││
│  │  └───────────┘  └───────────┘  └───────────────────┘   ││
│  └──────────────────────────┬──────────────────────────────┘│
│                             │                                │
│  ┌──────────────────────────▼──────────────────────────────┐│
│  │                 Provider Pool                           ││
│  │  ┌─────────┐  ┌───────────┐  ┌─────────────────────┐   ││
│  │  │云雾 API  │  │ OpenRouter │  │ (远期) 官方直签    │   ││
│  │  │  主力    │  │   备选     │  │    规模化后       │   ││
│  │  └─────────┘  └───────────┘  └─────────────────────┘   ││
│  └─────────────────────────────────────────────────────────┘│
└─────────────────────────────────────────────────────────────┘

六、边界情况

场景处理方式
所有供应商都不可用返回 503 + 重试建议
Token 超过模型限制返回 400 + 具体限制说明
API Key 额度耗尽返回 402 + 充值引导
不支持的模型名称返回 400 + 支持的模型列表

七、排除范围

MVP 阶段不做

功能原因
x402 支付先验证核心能力
用户 Dashboard先用日志凑合
对外开放 APIPhase 2 再考虑
流式响应MVP 先实现同步

八、时间线

阶段目标时间
Phase 0MVP 上线,内部使用2 周
Phase 1VIP 权益 + x402 充值4-6 周
Phase 2Agent 自主付费 + 对外开放8-12 周

文档版本: v1.0 | 最后更新: 2026-02-06

AIHub 产品文档

请输入访问密码