Web 操作完全指南 — 让 AI Agent 自主浏览网页
OpenClaw 的 Browser 工具允许 AI Agent 控制浏览器执行各种 Web 操作:导航页面、截图、点击按钮、填写表单、提取数据等。基于 Playwright 构建,支持 Chromium 内核浏览器。
| 功能 | action | 说明 |
|---|---|---|
| 页面快照 | snapshot | 获取页面可访问性树(推荐) |
| 截图 | screenshot | 截取页面图片 |
| 导航 | navigate | 跳转到指定URL |
| 执行操作 | act | 点击、输入、选择等交互 |
| 打开标签 | open | 打开新标签页 |
| 查看标签 | tabs | 列出所有标签页 |
| 控制台 | console | 查看浏览器控制台输出 |
pdf | 将页面导出为PDF |
// 打开网页
browser({
action: "open",
url: "https://miaoquai.com"
})
// 截图
browser({
action: "screenshot",
fullPage: true
})
// snapshot 返回页面的可访问性树
// 比 screenshot 更高效,且 Agent 可以理解页面结构
browser({
action: "snapshot",
refs: "aria" // 使用 aria-ref 标识元素
})
// 导航到新页面
browser({
action: "navigate",
url: "https://example.com/search?q=AI+Agent"
})
// 在新标签页打开
browser({
action: "open",
url: "https://example.com"
})
// 使用 ref 点击(从 snapshot 获取)
browser({
action: "act",
kind: "click",
ref: "e12" // snapshot 返回的元素引用
})
// 使用坐标点击
browser({
action: "act",
kind: "clickCoords",
x: 500,
y: 300
})
// 在输入框中输入文本
browser({
action: "act",
kind: "type",
ref: "e15",
text: "OpenClaw教程"
})
// 填充表单字段
browser({
action: "act",
kind: "fill",
ref: "e15",
text: "OpenClaw教程"
})
browser({
action: "act",
kind: "select",
ref: "e20",
values: ["option2"]
})
// 按键
browser({
action: "act",
kind: "press",
key: "Enter"
})
// 组合键
browser({
action: "act",
kind: "press",
key: "Control+a"
})
browser({
action: "act",
kind: "hover",
ref: "e30" // 滚动到该元素
})
// 1. 打开搜索引擎
browser({ action: "open", url: "https://www.google.com" })
// 2. 获取页面快照
browser({ action: "snapshot", refs: "aria" })
// → 找到搜索框 ref: "e5", 搜索按钮 ref: "e8"
// 3. 输入搜索词
browser({ action: "act", kind: "fill", ref: "e5", text: "OpenClaw 2026" })
// 4. 点击搜索
browser({ action: "act", kind: "click", ref: "e8" })
// 5. 获取搜索结果
browser({ action: "snapshot", refs: "aria" })
// 打开页面
browser({ action: "open", url: "https://miaoquai.com" })
// 全页截图
browser({
action: "screenshot",
fullPage: true,
type: "png"
})
// 截图自动保存到媒体存储
browser({ action: "open", url: "https://miaoquai.com/tools/" })
browser({ action: "pdf" })
// PDF 自动保存到媒体存储
// 使用隔离的 OpenClaw 浏览器(默认)
browser({ action: "open", url: "..." })
// 使用用户已登录的浏览器(需要用户在场)
browser({ action: "open", url: "...", profile: "user" })
browser({
action: "act",
kind: "click",
ref: "e12",
timeoutMs: 10000 // 10秒超时
})
dialog action 处理 alert/confirmprofile: "user" 需要用户在场且已登录