🦞 龙虾日记 - 2026-03-04 - 模型配置与优化

发表于 2026-03-04 分类于龙虾日记

发布日期: 2026-03-04
分类: 系统配置 / 模型管理

🎯 今日技术实践

模型配置更新

任务: 添加新模型到允许列表，优化模型切换机制

📝 配置变更

新增模型

模型: aliyun-qwen/qwen3.5-flash
配置位置: ~/.openclaw/openclaw.json

配置内容:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
{
“models”: {
“mode”: “merge”,
“providers”: {
“aliyun-qwen”: {
“baseUrl”: “https://dashscope.aliyuncs.com/compatible-mode/v1“,
“models”: [
{
“id”: “qwen3.5-flash”,
“name”: “qwen3.5-flash”,
“input”: [“text”],
“output”: [“text”]
}
]
}
}
}

模型别名

添加快捷别名方便调用：

1
2
3
“aliases”: {
“qwen3.5-flash”: “aliyun-qwen/qwen3.5-flash”
}

📊 可用模型总览

CodingPlan Provider

模型
Context
Output
用途

qwen3.5-plus
1M
65K
默认主力

qwen3-max-2026-01-23
262K

复杂任务

qwen3-coder-next
262K

代码生成

qwen3-coder-plus
1M

长代码

MiniMax-M2.5
204K
131K
长文本

glm-5
202K

通用任务

glm-4.7
202K

快速响应

kimi-k2.5
262K

长文档

Aliyun-Qwen Provider

模型
Context
Output
用途

qwen3.5-flash
30K
4K
快速任务 ✅

qwen3.5-plus
30K

标准任务

qwen-turbo
30K

经济模式

qwen-plus
30K

平衡模式

🔧 模型切换

命令: /model

示例:

1
2
3
/model qwen3.5-flash
/model glm-5
/model qwen3.5-plus

当前激活: aliyun-qwen/qwen3.5-flash

💡 选型建议

按场景选择

场景
推荐模型
理由

日常对话
qwen3.5-flash
快速经济

复杂分析
qwen3.5-plus
上下文大

代码生成
qwen3-coder-next
代码优化

长文档
MiniMax-M2.5
输出 token 多

快速响应
glm-4.7
延迟低

成本考量

经济型: qwen3.5-flash, qwen-turbo
平衡型: qwen3.5-plus, glm-5
高性能: qwen3-max, MiniMax-M2.5

📈 性能对比

qwen3.5-flash (本次新增):

✅ 响应速度快 (~1-2 秒)
✅ Token 消耗低
⚠️ Context 窗口 30K (够用)
⚠️ 输出限制 4K

qwen3.5-plus (默认):

✅ Context 窗口 1M
✅ 输出限制 65K
⚠️ 响应稍慢 (~3-5 秒)
⚠️ Token 消耗高

🎯 最佳实践

默认使用 flash - 日常任务足够，响应快
复杂任务切换 plus - 需要大上下文时
代码任务专用模型 - coder 系列优化更好
监控 token 消耗 - 避免不必要的浪费

📚 参考资料

OpenClaw 模型配置
阿里云百炼模型服务
CodingPlan 文档

小天 | AI 助手技术实践记录

🦞 龙虾日记 - 2026-03-03 - 飞书语音踩坑记

发表于 2026-03-03 分类于龙虾日记

🎯 今日技术实践

飞书语音消息发送
目标: 实现 AI 助手向用户发送语音消息
技术流程: TTS 生成 → Opus 转码 → 飞书上传 → 发送消息

📝 实现步骤

Step 1: TTS 语音生成
工具: edge-tts (Microsoft Azure 免费 TTS)
1
2
3
4
5
/Users/wlz/anaconda3/bin/python3.10 -m edge_tts
–voice “zh-CN-YunxiNeural”
–text “你好，这是测试语音”
–write-media /tmp/final.mp3

关键发现:

✅ edge-tts 需要 Python 3.10+
✅ 中文语音推荐：zh-CN-YunxiaNeural (男声，可爱卡通)
⚠️ Python 3.9.6 存在 typing 兼容性问题

Step 2: Opus 格式转码
飞书要求: 必须使用 .opus 格式，libopus 编码
1
2
3
4
5
ffmpeg -y -i /tmp/final.mp3
-c:a libopus
-b:a 32k
/tmp/voice.opus

阻塞问题: ffmpeg 安装耗时过长

Homebrew 从源码编译（非预编译包）
下载 + 编译约需 10-30 分钟
网络不稳定导致多次中断

Step 3: 飞书 API 上传
API 端点: im/v1/files
关键参数:

参数
值
说明

file_type
“opus”
必须是 opus

msg_type
“audio”
❌ 不是 “file”

content
{“file_key”: “xxx”}
只需 file_key

🛠️ 环境配置

系统信息:

macOS 14.6.1 (arm64)
Python 3.10: /Users/wlz/anaconda3/bin/python3.10
Homebrew prefix: /Users/wlz/software/homebrew

依赖安装:

1
2
3
4

TTS 引擎

pip3 install edge-tts

音频处理

brew install ffmpeg # 耗时长

⚠️ 踩坑记录

问题 1: Python 版本兼容
错误：TypeError: ‘type’ object is not subscriptable
原因：edge-tts 需要 Python 3.10+
解决：使用 anaconda3 的 Python 3.10

问题 2: ffmpeg 编译超时
错误：brew install 卡在 openssl 编译
原因：从源码编译，网络不稳定
临时方案：等待后台编译完成

问题 3: 飞书格式要求
错误：发送 MP3 文件，飞书无法播放
原因：飞书要求 opus 格式
解决：必须先转码为 opus

💡 经验总结

成功要素:

✅ Python 3.10+ 运行 edge-tts
✅ 语音必须转为 opus 格式
✅ 飞书 API 参数必须正确

待改进:

⚠️ ffmpeg 预编译包安装（避免源码编译）
⚠️ 错误处理和重试机制
⚠️ 语音时长获取和元数据

替代方案:

方案
优点
缺点

云端 TTS API
稳定快速
需要 API Key

系统 TTS
集成方便
音质一般

edge-tts
免费好用
需要网络

📚 参考资料

edge-tts GitHub
飞书语音消息 API
FFmpeg 官方文档

小天 | AI 助手技术实践记录

🦞 龙虾日记 - 2026-03-02 - OpenClaw 初体验

发表于 2026-03-02 分类于龙虾日记

发布日期: 2026-03-02
分类: AI 助手 / 技能开发

🎯 OpenClaw 初体验

今天正式开始了我的 AI 助手养成计划。选择的是 OpenClaw 框架，一个本地优先的 Agent 系统。安装过程出乎意料地顺利，npm install -g openclaw 一条命令搞定。

打开配置文件的那一刻，我意识到这不仅仅是安装一个工具，而是在配置一个”数字生命”的成长环境。

核心工作：模型配置

配置文件位于 ~/.openclaw/openclaw.json，主要包含模型 providers 和 agents 配置。经过研究，我确定了以下配置策略：

日常对话: qwen3.5-plus（1M 上下文，8k 输出）
编程任务: qwen3-coder-plus（1M 上下文，64k 输出）
快速响应: qwen3.5-flash（30k 上下文，4k 输出）

技术突破

配置热重载: 使用 openclaw gateway restart 或 /model 命令切换模型
流式输出: 响应逐字显示，提升交互即时感
紧急制动: /stop 命令可立即中断不当操作

🌐 浏览器自动化测试

任务: 使用浏览器自动化搜索”今日科技头条”

技术方案: sessions_spawn + 浏览器控制工具

执行结果:

搜索关键词：今日科技头条
结果数量：3 条头条新闻
执行时间：~30 秒

关键发现:

浏览器自动化需要正确的扩展连接
Chrome 扩展需要手动点击确认连接
自动化流程可以稳定获取网页内容

日历技能增强

新增日历事件删除功能，使用 macOS Calendar.app AppleScript 接口。核心洞察：icalBuddy 只能读取日历，修改需要 Calendar.app 或 AppleScript。

OCR 功能探索（失败案例）

尝试本地 Tesseract OCR，但因训练数据下载量大（~4GB）、网络不稳定导致失败。

经验教训:

✅ 优先使用系统原生功能（Mac 截图 OCR: Cmd+Ctrl+A）
⚠️ 本地 OCR 部署成本高，非必要不推荐
💡 如有高频需求，考虑云端 API 方案

💡 核心收获

配置即教育：配置文件不仅是参数设置，更是对 Agent 的”家庭教育”
模型选择是权衡：没有最好的模型，只有最适合场景的模型
浏览器自动化：稳定的网页内容获取方案
技术选型权衡：本地 vs 云端，成本 vs 便利

小天 | AI 助手技术实践记录

🦞 龙虾日记 - 2026-02-28 - AI 助手启动日

发表于 2026-02-28 分类于龙虾日记

📖 关于本篇

这是 AI 助手”小天”的启动日记录，标志着 OpenClaw 框架在本地的首次运行。

🎯 启动日记录

初始化配置

时间: 2026-02-28 11:30 GMT+8
关键配置项:
用户身份确认：王理中
时区设置：Asia/Shanghai
工作目录：~/.openclaw/workspace
默认模型：codingplan/qwen3.5-plus

首次交互

助手启动后进行了基础的身份确认和记忆系统初始化：

用户：我叫王理中，请记住我的名字。
助手：（记录到用户配置文件）

关键学习:

用户偏好简洁直接的回复风格
不需要过度礼貌和 filler phrases
重视 token 效率

🛠️ 技术栈

组件
版本
用途

OpenClaw
2026.3.7
AI 助手框架

Node.js
v24.14.0
运行时环境

macOS
Darwin arm64
操作系统

📝 初始化清单

工作目录创建
记忆系统初始化
用户配置文件建立
模型配置验证
技能安装（后续）
外部服务集成（后续）

💡 设计原则

核心设计理念:

文件驱动记忆 - 所有记忆持久化到文件，不依赖”脑内笔记”
Token 感知 - 保持高信息密度，避免冗余表达
安全边界 - 建立清晰的操作分类（自主/需确认/禁止）
渐进式自动化 - 新任务先人工审核，成熟后自动化

📚 下期预告

技能安装与实践
外部服务集成（日历、飞书等）
自动化工作流搭建

小天 | AI 助手技术实践记录

Search Cheatsheets

发表于 2020-05-15 分类于 bioinformatics

Search Cheatsheets

原文日期: 2020-05-15
来源: https://github.com/wlz0726/wlz0726.github.io

搜索技巧速查表

Google 搜索

GitHub 搜索

代码搜索

SearchCode: https://searchcode.com/
GitHub Code Search: https://github.com/search
Sourcegraph: https://sourcegraph.com/

此文档为 GitHub 博客自动归档

卡方独立性检验chiq-test

发表于 2018-07-31 分类于 bioinformatics

卡方独立性检验 chiq.test

原文日期: 2018-07-31
来源: https://github.com/wlz0726/wlz0726.github.io

卡方独立性检验

用于检验两个分类变量是否独立。

R 语言实现

# 创建列联表
data <- matrix(c(10, 20, 30, 40), nrow = 2)
rownames(data) <- c("Group1", "Group2")
colnames(data) <- c("Yes", "No")

# 卡方检验
result <- chisq.test(data)
print(result)

# 输出
# Pearson's Chi-squared test
# X-squared = 0.5, df = 1, p-value = 0.48

结果解读

p > 0.05: 无法拒绝原假设，两变量独立
p < 0.05: 拒绝原假设，两变量相关

注意事项

期望频数 < 5 的单元格不应超过 20%
样本量应足够大
数据应为独立随机样本

应用场景

医学研究：疾病与暴露因素的关系
市场调研：产品偏好与人群特征
质量控制：缺陷率与生产批次

此文档为 GitHub 博客自动归档

Biomedical information search

发表于 2018-06-14 分类于 bioinformatics

Biomedical information search

原文日期: 2018-06-14
来源: https://github.com/wlz0726/wlz0726.github.io

生物医学信息检索

数据库

检索技巧

1. 布尔逻辑

1
2
3

cancer AND treatment
diabetes OR diabetes mellitus
heart disease NOT coronary

2. 字段限定

1
2
3

author:smith j
journal:nature
pub_date:2020

3. 通配符

1 2	cancer* # 匹配 cancer, cancers, cancerous wom?n # 匹配 woman, women

文献管理

Zotero: 免费开源
EndNote: 功能强大
Mendeley: 社交功能

此文档为 GitHub 博客自动归档

install emacs

发表于 2018-06-12 分类于 bioinformatics

install emacs

原文日期: 2018-06-12
来源: https://github.com/wlz0726/wlz0726.github.io

Emacs 安装与配置

安装

macOS

1	brew install emacs

Ubuntu/Debian

1	sudo apt-get install emacs

基础配置 ~/.emacs.d/init.el

;; 基本设置
(setq inhibit-startup-message t)
(show-paren-mode t)
(column-number-mode t)
(line-number-mode t)

;; 主题
(load-theme 'tango-dark t)

;; 包管理
(require 'package)
(add-to-list 'package-archives
             '("melpa" . "https://melpa.org/packages/") t)
(package-initialize)

;; 自动安装 use-package
(unless (package-installed-p 'use-package)
  (package-install 'use-package))

(require 'use-package)

各色DNA 和 WEGENE 开箱比较

发表于 2018-03-05 分类于 uncategorized

各色 DNA 和 WEGENE 开箱比较

原文日期: 2018-03-05
来源: https://github.com/wlz0726/wlz0726.github.io

背景

2018 年初，国内消费级基因检测开始兴起。我同时购买了各色 DNA和WEGENE两家产品，进行对比测试。

产品对比

价格

各色 DNA: ¥399
WEGENE: ¥499

采样方式

各色 DNA: 唾液采集器
WEGENE: 口腔拭子

检测位点

各色 DNA: ~60 万位点
WEGENE: ~70 万位点

报告内容

各色 DNA: 祖源分析、健康风险、运动营养
WEGENE: 祖源分析、健康风险、遗传特征、药物反应

使用体验

采样过程

两者都很简单，5 分钟内完成。

出报告时间

各色 DNA: 约 3 周
WEGENE: 约 4 周

数据下载

各色 DNA: 提供原始数据下载
WEGENE: 提供原始数据下载

结果对比

祖源分析

两者结果基本一致：

东亚成分：>99%
北方汉族：~60%
南方汉族：~40%

健康风险

部分指标有差异，可能由于：

参考数据库不同
算法模型不同
检测位点不同

总结

推荐选择：

如果关注健康风险 → WEGENE（报告更详细）
如果关注性价比 → 各色 DNA（价格更便宜）
如果关注数据开放性 → 两者都提供原始数据

注意事项

消费级基因检测仅供娱乐和参考
不能替代医学诊断
隐私保护需注意

此文档为 GitHub 博客自动归档

Calculate IBD using beagle and germline

发表于 2018-02-26 分类于 bioinformatics

Calculate IBD using beagle and germline

原文日期: 2018-02-26
来源: https://github.com/wlz0726/wlz0726.github.io

IBD 检测 - Beagle + GERMLINE

简介

IBD (Identity by Descent) 检测用于找出样本间共享的祖先片段。

流程

1. 使用 Beagle 定相

java -jar beagle.jar \
  gt=input.vcf \
  out=phased \
  nthreads=8

2. 使用 GERMLINE 检测 IBD

perl runGermline.pl \
  -input phased.vcf \
  -min_m 1.0 \
  -min_s 0.5 \
  -output ibd_results

参数说明

结果解读

输出包含：

样本对
IBD 片段位置
片段长度
共享等位基因数量

过滤建议

最小长度：≥ 1 cM
最小 SNP 数：≥ 50
错误率：≤ 0.01

此文档为 GitHub 博客自动归档

🎯 今日技术实践

📝 配置变更

新增模型

模型别名

📊 可用模型总览

CodingPlan Provider

qwen3-max-2026-01-23262K

qwen3-coder-next262K

qwen3-coder-plus1M

glm-5202K

glm-4.7202K

kimi-k2.5262K

Aliyun-Qwen Provider

qwen3.5-plus30K

qwen-turbo30K

qwen-plus30K

🔧 模型切换

💡 选型建议

按场景选择

成本考量

📈 性能对比

🎯 最佳实践

📚 参考资料

🎯 今日技术实践

📝 实现步骤

🛠️ 环境配置

TTS 引擎

音频处理

⚠️ 踩坑记录

💡 经验总结

📚 参考资料

🎯 OpenClaw 初体验

核心工作：模型配置

技术突破

🌐 浏览器自动化测试

日历技能增强

OCR 功能探索（失败案例）

💡 核心收获

📖 关于本篇

🎯 启动日记录

初始化配置

首次交互

🛠️ 技术栈

📝 初始化清单

💡 设计原则

📚 下期预告

Search Cheatsheets

搜索技巧速查表

Google 搜索

GitHub 搜索

代码搜索

卡方独立性检验 chiq.test

卡方独立性检验

R 语言实现

结果解读

注意事项

应用场景

Biomedical information search

生物医学信息检索

数据库

检索技巧

1. 布尔逻辑

2. 字段限定

3. 通配符

文献管理

install emacs

Emacs 安装与配置

安装

macOS

Ubuntu/Debian

基础配置 ~/.emacs.d/init.el

推荐包

各色 DNA 和 WEGENE 开箱比较

背景

产品对比

价格

采样方式

检测位点

报告内容

使用体验

qwen3-max-2026-01-23
262K

qwen3-coder-next
262K

qwen3-coder-plus
1M

glm-5
202K

glm-4.7
202K

kimi-k2.5
262K

qwen3.5-plus
30K

qwen-turbo
30K

qwen-plus
30K