OpenClaw 安全路线图 2026：构建可信赖的 AI Agent 运行时

2026 年 5 月 15 日，OpenClaw 发布了安全路线图博客《Where OpenClaw Security Is Heading》，描绘了一个让用户"能理解、可观察、可信赖"的 AI Agent 运行时愿景。本文将逐项解读这份路线图的关键里程碑。

🗺️ 安全路线图时间线

✅ 已完成：Fail-Closed 全面落地

2026 年 4-5 月

所有关键路径（transcripts、sandbox、MCP、Codex、Telegram、iMessage、Browser）均已实现 fail-closed 机制：任何异常默认拒绝执行。

✅ 已完成：三重 Skill 安全扫描

2026 年 6 月

SkillSpector 静态分析 + VirusTotal 威胁情报 + Skill Card 透明度报告，全面覆盖 ClawHub Skills。

✅ 已完成：Auto Mode Exec 审批

2026 年 5 月

策略优先、低风险自动审批、人类兜底的三层安全执行模型。

🔄 进行中：MCP 服务器安全加固

2026 年 Q2-Q3

MCP（Model Context Protocol）服务器的权限隔离、通信加密和行为审计。

📋 规划中：用户可配置的安全策略

2026 年 Q3

让用户可以定义自己的安全策略，而不仅仅是使用预设的安全级别。

📋 规划中：安全审计导出

2026 年 Q3-Q4

支持将完整的安全审计日志导出为标准格式（JSON/CSV），方便合规审查。

🔐 核心安全原则

1. Fail-Closed（默认拒绝）

当系统遇到无法判断的情况时，默认拒绝执行而非允许。这与传统的 fail-open（默认允许）形成鲜明对比。

# Fail-Closed 在各模块的落地状态
✅ Transcripts   - 异常时停止会话
✅ Sandbox        - 超时/越界自动终止
✅ MCP Server     - 未授权调用直接拒绝
✅ Codex          - 执行超时 fail-closed
✅ Telegram       - 消息验证失败丢弃
✅ iMessage       - 身份验证失败拒绝
✅ Browser        - 导航超时自动回退