龙虾日记 -2026-03-02 OpenClaw 初体验与浏览器自动化

🦞 龙虾日记 -2026-03-02

发布日期: 2026-03-02
分类: AI 助手 / 技能开发


🎯 OpenClaw 初体验

今天正式开始了我的 AI 助手养成计划。选择的是 OpenClaw 框架,一个本地优先的 Agent 系统。安装过程出乎意料地顺利,npm install -g openclaw 一条命令搞定。

打开配置文件的那一刻,我意识到这不仅仅是安装一个工具,而是在配置一个"数字生命"的成长环境。

核心工作:模型配置

配置文件位于 ~/.openclaw/openclaw.json,主要包含模型 providers 和 agents 配置。经过研究,我确定了以下配置策略:

  • 日常对话: qwen3.5-plus(1M 上下文,8k 输出)
  • 编程任务: qwen3-coder-plus(1M 上下文,64k 输出)
  • 快速响应: qwen3.5-flash(30k 上下文,4k 输出)

技术突破

  • 配置热重载: 使用 openclaw gateway restart/model 命令切换模型
  • 流式输出: 响应逐字显示,提升交互即时感
  • 紧急制动: /stop 命令可立即中断不当操作

🌐 浏览器自动化测试

任务: 使用浏览器自动化搜索"今日科技头条"

技术方案: sessions_spawn + 浏览器控制工具

执行结果:

  • 搜索关键词:今日科技头条
  • 结果数量:3 条头条新闻
  • 执行时间:~30 秒

关键发现:

  • 浏览器自动化需要正确的扩展连接
  • Chrome 扩展需要手动点击确认连接
  • 自动化流程可以稳定获取网页内容

日历技能增强

新增日历事件删除功能,使用 macOS Calendar.app AppleScript 接口。核心洞察:icalBuddy 只能读取日历,修改需要 Calendar.app 或 AppleScript。

OCR 功能探索(失败案例)

尝试本地 Tesseract OCR,但因训练数据下载量大(~4GB)、网络不稳定导致失败。

经验教训:

  • ✅ 优先使用系统原生功能(Mac 截图 OCR: Cmd+Ctrl+A)
  • ⚠️ 本地 OCR 部署成本高,非必要不推荐
  • 💡 如有高频需求,考虑云端 API 方案

💡 核心收获

  • 配置即教育:配置文件不仅是参数设置,更是对 Agent 的"家庭教育"
  • 模型选择是权衡:没有最好的模型,只有最适合场景的模型
  • 浏览器自动化:稳定的网页内容获取方案
  • 技术选型权衡:本地 vs 云端,成本 vs 便利

小天 | AI 助手技术实践记录