OpenClaw 养成记(2026.03.02 - 03.05)

核心背景

从 2026 年 3 月 2 日开始,我开始配置和调优 OpenClaw AI 助手,目标是建立一个安全、高效、可扩展的个人助理系统。

Day 1-2: 基础配置(3 月 2-3 日)

核心工作

  • 配置 openclaw.json,添加多个大模型 API(CodingPlan、阿里云 Qwen 等)
  • 设置各模型的 contextWindow 和 maxTokens 参数
  • 理解配置结构:models.providers = 模型仓库,agents.defaults = 代理配置
  • 学会用 openclaw gateway restart 和/new 重载配置
  • 开启 proactive 主动模式,让 AI 自动拆解任务、提醒进度

技术细节

  • 日常对话:qwen3.5-plus(1M 窗口,8k 输出)
  • 编程任务:qwen3-coder-plus(1M 窗口,64k 输出)
  • 开启流式输出(Streaming),提升交互即时性
  • 掌握/stop 紧急制动和/model 模型切换

Day 3: 安全规则确立(3 月 4 日)

核心工作

建立安全红线,防止 AI 失控造成不可逆损失。

风险识别

  • 失控误操作(批量删除邮件/文件)
  • 账号封禁(自动登录第三方服务)
  • 敏感信息泄露(读取密码/密钥文件)
  • 供应链投毒(安装恶意插件)
  • 成本失控(token 消耗无限制)

安全规则

  • ❌ 禁止:批量删除/发送邮件、读取敏感文件、自动登录、安装未验证插件
  • ⚠️ 需确认:单文件操作、使用凭证、访问外链
  • 📋 触发确认:上下文压缩前、环境切换、连续指令

参考案例

Meta AI 安全总监 Summer Yue 因上下文压缩丢失安全指令,AI 删光 200+ 邮件。

Day 4: 技能探索(3 月 4-5 日)

核心工作

安装和测试新技能,扩展 AI 能力边界。

已安装技能

  • Browser - 浏览器自动化(截图、访问网页)
  • OCR 视觉识别 - 图片文字识别(Qwen 多模态)
  • Whisper - 语音转文字(本地部署,无需 API)
  • Music Generator - 音乐生成(待配置 Hugging Face token)

技术突破

  • 安装 edge-tts 实现文字转语音
  • 用 ffmpeg 转码为 Opus 格式(16k 采样率,单声道)
  • 通过飞书 API 发送语音消息
  • 本地部署 Whisper 实现语音识别闭环

Day 5: 多 Agent 工作组(3 月 5 日)

核心工作

搭建多 Agent 协作系统,实现并行任务处理。

团队配置

Agent 负责 模型
主 Agent 总指挥、协调 qwen3.5-plus
coder 编程专家 qwen3-coder-plus
writer 内容运营 glm-5
analyst 数据分析 qwen3-max
social 社交追踪 kimi-k2.5
image-maker 图片生成 aliyun-qwen/z-image-turbo
video-maker 视频生成 付费模型

技术实现

  • 每个 Agent 独立 workspace
  • 通过 sessions_spawn 派发任务
  • 配置 agents.list 和 bindings
  • 默认任务队列,单 Agent 最大并发 2

Day 6: 个人网站重生(3 月 5 日)

核心工作

恢复荒废 6 年的博客,重新开始记录。

网站信息

  • 地址:https://wlz0726.github.io
  • 框架:Hexo + Next 主题(静态 HTML)
  • 内容:317 篇旧文章(2016-2020)+ 1 篇新日记
  • 部署:GitHub Pages

技术细节

  • 手动更新首页 HTML(添加新文章链接)
  • 保持纯静态网站(删除 Hexo 配置文件避免构建错误)
  • 文章格式:/YYYY/MM/DD/文章标题/index.html

下一步计划

  1. 试运行一周 - 观察 proactive 模式表现
  2. 微调参数 - 根据实际消耗调整成本熔断阈值
  3. 配置 Hugging Face token - 测试音乐生成功能
  4. 持续写日记 - 每周记录工作表现
  5. 扩展技能 - 连接更多工具(飞书、GitHub 等)

技术栈总结

类别 工具/服务
框架 OpenClaw 2026.2.26
模型 Qwen3.5-Plus、Qwen3-Coder-Plus、Kimi-K2.5、GLM-5
语音 edge-tts、Whisper、ffmpeg
部署 GitHub Pages、Hexo
通信 飞书 API
技能 Browser、OCR、Whisper、Music Generator