Browser Automation 详解 - Agent 浏览器自动化

当 web_fetch 搞不定动态页面时，Browser Automation 就是 Agent 的"眼睛和手"——它能像人一样操作浏览器，点击、输入、截图、提取数据。

📖 什么是 Browser Automation？

Browser Automation 是 OpenClaw 提供的浏览器控制能力，基于 Playwright 实现。Agent 可以通过 browser 工具控制 Chromium 浏览器，执行网页导航、元素交互、截图、数据提取等操作。

⚡ 何时使用 Browser vs web_fetch？

场景	web_fetch	browser
静态页面内容	✅ 快速、轻量	⚠️ 杀鸡用牛刀
JavaScript 渲染页面	❌ 拿不到内容	✅ 完美支持
需要登录的页面	❌ 无法处理	✅ 复用登录态
表单填写/提交	❌ 不支持	✅ 完整支持
截图/PDF	❌ 不支持	✅ 支持

🔧 核心操作

# 1. 打开页面 browser action=open url="https://example.com" # 2. 获取页面快照（DOM 结构） browser action=snapshot # 3. 点击元素 browser action=act kind=click ref="e12" # 4. 输入文本 browser action=act kind=fill ref="e15" text="搜索内容" # 5. 截图 browser action=screenshot # 6. 执行 JavaScript browser action=act kind=evaluate fn="document.title"

🎯 实战场景

场景1：竞品网站监控

# 打开竞品网站
browser action=open url="https://competitor.com/pricing"

# 截图存档
browser action=screenshot fullPage=true

# 提取价格信息
browser action=act kind=evaluate fn="document.querySelector('.pricing').innerText"

场景2：自动化表单提交

# 打开表单页面
browser action=open url="https://example.com/form"

# 填写字段
browser action=act kind=fill ref="e10" text="张三"
browser action=act kind=fill ref="e12" text="zhangsan@example.com"

# 提交
browser action=act kind=click ref="e20"

🛡️ 安全模式

profile="openclaw" — 隔离浏览器，无登录态（默认）

profile="user" — 复用用户浏览器，有登录态（需用户在线）

target="sandbox" — 在沙箱中运行，更安全

🌐 Browser Automation（浏览器自动化）

📖 什么是 Browser Automation？

⚡ 何时使用 Browser vs web_fetch？

🔧 核心操作

🎯 实战场景

场景1：竞品网站监控

场景2：自动化表单提交

🛡️ 安全模式

🔗 相关推荐

🌐 Browser Automation（浏览器自动化）

📖 什么是 Browser Automation？

⚡ 何时使用 Browser vs web_fetch？

🔧 核心操作

🎯 实战场景

场景1：竞品网站监控

场景2：自动化表单提交

🛡️ 安全模式

📚 相关术语

🔗 相关推荐

📚 推荐阅读