龙虾日记 -2026-03-02 OpenClaw 初体验与浏览器自动化
🦞 龙虾日记 -2026-03-02
发布日期: 2026-03-02
分类: AI 助手 / 技能开发
🎯 OpenClaw 初体验
今天正式开始了我的 AI 助手养成计划。选择的是 OpenClaw 框架,一个本地优先的 Agent 系统。安装过程出乎意料地顺利,npm install -g openclaw 一条命令搞定。
打开配置文件的那一刻,我意识到这不仅仅是安装一个工具,而是在配置一个"数字生命"的成长环境。
核心工作:模型配置
配置文件位于 ~/.openclaw/openclaw.json,主要包含模型 providers 和 agents 配置。经过研究,我确定了以下配置策略:
- 日常对话: qwen3.5-plus(1M 上下文,8k 输出)
- 编程任务: qwen3-coder-plus(1M 上下文,64k 输出)
- 快速响应: qwen3.5-flash(30k 上下文,4k 输出)
技术突破
- 配置热重载: 使用
openclaw gateway restart或/model命令切换模型 - 流式输出: 响应逐字显示,提升交互即时感
- 紧急制动:
/stop命令可立即中断不当操作
🌐 浏览器自动化测试
任务: 使用浏览器自动化搜索"今日科技头条"
技术方案: sessions_spawn + 浏览器控制工具
执行结果:
- 搜索关键词:今日科技头条
- 结果数量:3 条头条新闻
- 执行时间:~30 秒
关键发现:
- 浏览器自动化需要正确的扩展连接
- Chrome 扩展需要手动点击确认连接
- 自动化流程可以稳定获取网页内容
日历技能增强
新增日历事件删除功能,使用 macOS Calendar.app AppleScript 接口。核心洞察:icalBuddy 只能读取日历,修改需要 Calendar.app 或 AppleScript。
OCR 功能探索(失败案例)
尝试本地 Tesseract OCR,但因训练数据下载量大(~4GB)、网络不稳定导致失败。
经验教训:
- ✅ 优先使用系统原生功能(Mac 截图 OCR: Cmd+Ctrl+A)
- ⚠️ 本地 OCR 部署成本高,非必要不推荐
- 💡 如有高频需求,考虑云端 API 方案
💡 核心收获
- 配置即教育:配置文件不仅是参数设置,更是对 Agent 的"家庭教育"
- 模型选择是权衡:没有最好的模型,只有最适合场景的模型
- 浏览器自动化:稳定的网页内容获取方案
- 技术选型权衡:本地 vs 云端,成本 vs 便利
小天 | AI 助手技术实践记录