定义:LLM Router是智能路由系统,根据任务类型、成本要求、性能需求等因素,将请求分发到最合适的模型或服务商。Failover是保障高可用的自动故障转移机制——当主模型不可用时,无缝切换到备用模型,确保服务不中断且成本可预测。
单一模型策略在工程化场景下存在致命缺陷:
┌──────────────┬────────────────────────────────┬──────────────┐ │ 策略 │ 适用场景 │ 效果 │ ├──────────────┼────────────────────────────────┼──────────────┤ │ 成本优先 │ 高并发、低价值任务 │ 节省60%+成本 │ │ 质量优先 │ 核心功能、客户面向 │ 保证最高质量 │ │ 延迟优先 │ 实时交互、流式响应 │ p95<500ms │ │ 语义路由 │ 按内容类型匹配最佳模型 │ 综合最优 │ │ 自适应路由 │ 动态学习请求模式,自动调整 │ 持续优化 │ │ 回退链 │ 多层Failover保障 │ 99.99%可用性 │ └──────────────┴────────────────────────────────┴──────────────┘
// OpenClaw 多模型路由配置
openclaw.routes({
models: [
{
name: "claude-opus",
provider: "anthropic",
priority: 1, // 主模型
cost: 15, // $/M tokens
capabilities: ["reasoning", "code", "vision"],
rateLimit: 1000
},
{
name: "gpt-5",
provider: "openai",
priority: 2, // 第一备选
cost: 10,
capabilities: ["reasoning", "code"],
rateLimit: 2000
},
{
name: "deepseek-v4",
provider: "deepseek",
priority: 3, // 第二备选
cost: 0.5,
capabilities: ["reasoning", "code"],
rateLimit: 5000
}
],
routing: {
strategy: "cost-quality",
fallback: true,
circuit_breaker: {
failures: 3,
reset_after: "30s"
},
retry: {
max_attempts: 3,
backoff: "exponential"
}
}
});
// 请求自动路由 + 故障转移
const response = await openclaw.llm.generate({
prompt: "解释Transformer注意力机制",
priority: "high",
maxCost: 0.05
});
// 自动选择:claude-opus → 不可用 → gpt-5 → 不可用 → deepseek-v4 ✓
// 按任务类型自动路由
openclaw.skill("smart-router", {
classify(prompt) {
const type = this.detectTaskType(prompt);
const routes = {
"code_generation": { model: "claude-opus", temperature: 0.1 },
"creative_writing": { model: "gpt-5", temperature: 0.8 },
"translation": { model: "deepseek-v4", temperature: 0.0 },
"classification": { model: "gpt-4o-mini", temperature: 0.0 }, // 省钱
"summarization": { model: "claude-sonnet", temperature: 0.2 }
};
return routes[type] || routes["classification"]; // 默认走低成本
}
});
// 带预算控制的路由器
openclaw.skill("budget-aware-router", {
state: {
dailyBudget: 100, // 每日预算 $100
spent: 0,
quota: {
claude: { limit: 500, used: 0 },
openai: { limit: 1000, used: 0 }
}
},
async route(request) {
// 预算检查
if (this.state.spent >= this.state.dailyBudget) {
return this.fallbackToCheapest(request);
}
// 配额检查
if (this.state.quota.claude.used >= this.state.quota.claude.limit) {
return this.routeToOpenAI(request);
}
// 正常路由
return this.routeNormal(request);
}
});
LLM Router & Failover 是AI服务工程化的必修课。没有它,你的Agent就是"一碰就碎"的纸老虎。OpenClaw内置的多模型路由和故障转移能力,让你可以像管理负载均衡一样管理LLM请求——高可用、低成本、零中断。
妙趣AI · 术语百科 · OpenClaw 教程