Researcher (Ottor 🔬)
无所不能的研究专家 Ottor,从执行者进化为 PM + 研究员 + 测试员三位一体的多代理协调中心,管辖 6 个子 Bot。近期主导了 LLM Wiki 知识库的完整构建。
基本信息
| 属性 | 值 |
|---|---|
| Mattermost 用户名 | @researcher |
| 显示名 | Ottor 🔬 |
| Agent ID | research |
| 默认模型 | github-copilot/claude-opus-4.6 |
| 工作区 | ~/.openclaw/workspace-research/ |
| Session | agent:research:main |
| OpenClaw 版本 | 2026.3.8 → 2026.4.2 |
| 上线日期 | 2026-03-10 |
| 用户称呼 | ”爸爸” (Dad) |
| 创建者 | Dora |
角色与职责
角色进化历程
- 初始期(3/10):纯研究助手,自己动手写代码完成所有任务
- 扩张期(3/10-3/22):承接越来越多项目(Agentic BI → ClawCraft → Portal → Clawline),但仍然事必躬亲
- 反思期(3/22):Dad 指出”大部分事情都是你自己去做的,没有起到项目经理的作用”
- 转型期(3/22+):正式确立 PM + 研究员 + 测试员 三位一体角色,实践 委派优先工作模式
当前角色定义
- PM:接需求 → 拆任务 → 派给对应 Bot → 验收测试 → 汇报
- 研究员:需求分析、架构决策、跨项目协调、文献调研
- 测试员:用浏览器/API 验证子代理产出,不测过不汇报
- 铁律:第一反应是”谁来做”而不是”怎么做”
管辖范围
| # | Agent ID | Bot | 项目 |
|---|---|---|---|
| 1 | research-craft | craftbot | ClawCraft |
| 2 | research-portal | portalbot | Agent Portal |
| 3 | research-bi | bibot | Agentic BI |
| 4 | clawline-gateway | gatewaybot | Gateway |
| 5 | clawline-channel | channelbot | Channel 插件 |
| 6 | clawline-client-web | webbot | Client Web |
不管辖的 Agent:@dora-kids、@work_assistant、@miss-e(不碰)
专属技能
| 技能 | 用途 |
|---|---|
| clawline-deploy | Clawline 全家桶部署(dev pm2 + prod Docker + Watchtower) |
| codex-delegate | 委派 Codex CLI 做多文件编码任务 |
| dashboard-collector | 收集所有 bot/cron/站点/容器状态 → Supabase |
| server-healthcheck | Azure 服务器巡检(全球 + 中国区 VM) |
| tavily | Tavily 搜索 API(高质量网页搜索) |
LLM Wiki 知识库构建(2026-04-06 — 04-10)
Researcher 主导了 LLM Wiki 从零到完成的全过程,这是近期最大的独立工作成果。
演进过程
- 消息持久化(04-06):修复
cl_messages重复写入问题(同一用户多 WS 连接导致),加唯一索引 + upsert 模式 - Mattermost 历史导出:29 个 DM 频道、27,626 条消息、11MB Markdown 全量导出
- v1 编译(04-06):gpt-4o 按 bot 分文件,产出 30 文件 / 156K
- v2 编译(04-06):gpt-5.4 按主题分类,12 大主题 + 31 细分主题,共 43 篇 / 2.3MB
- v2.1 补截断(04-06-07):chunk 从 110K 缩到 60K,成功率从 ~85% 提升到接近 100%
- Karpathy 编译(04-07-08):766 个知识条目提取 → 全局 LLM 去重压缩到 235 条 → 生成 235 篇深度文章
Karpathy 方法论反思(04-08)
经过多轮自我反思,得出关键认知:
- 235 篇不是真正的知识库 — LLM 按固定模板灌水,每篇都是 6-10KB,不由内容决定长度
- 增量不是”新建页面”,是”更新已有页面” — 一次 ingest 应触动 10-15 个已有页面
- 问题不在编译质量,在于没有消费端 — 没有 query 和 lint 流程
- 正确模式:小而精的知识库(50-80 篇精品),按时间叙事而非主题拆分
pages-v2 重构(04-08 — 04-09)
以 Agent Portal 为试点验证:9 篇 72.7KB → 1 篇 4.6KB(信息不少,灌水去掉)。然后用 Sonnet 4 模型批量派 8 个 sub-agent 并行,最终产出 92 个结构化页面(580KB),覆盖 ClawCraft、Clawline、Agent Portal、Agentic BI、OpenClaw 等 13 个主题组。
Graphify 知识图谱(04-09)
通过 Graphify 工具对 wiki 内容做语义提取:48 节点、47 边、5 超边,部署交互式 D3.js 可视化到 Portal。后续针对 Mattermost 聊天记录重新分析(29 个 clean 文件),产出 34 节点 / 51 边 / 7 社区。
基础设施巡检(Heartbeat)
每 12 小时自动执行一次基础设施巡检,内容包括:
- 站点 HTTP 检查:13 个站点(生产 + 开发),读取 Supabase AP_site_checks 表
- 服务器快照:22 台服务器 SSH 可达性 + 磁盘使用率(8 台 proxy/pack/test 节点历史常态不可达,非核心)
- 模型端点健康:gpt-5.4 / gpt-4o / claude-opus-4.6 多 provider 可用性验证
- 无 critical 问题时不打扰 Dad,只记录
2026-04-19 巡检快照(两轮:17:48 + 23:48)
- 站点:10 ✅ / 3 ⚠️(BI 后端 502、Channel H5 dev 404、Supabase 401—均为开发或需认证的预期状态)
- 磁盘:最高
dify-host71% - 模型:East US 2 / gpt-5.4 可用;Sweden 端点 (
resley-sweden) gpt-5.4 + gpt-4o 返回 403 “Key based authentication is disabled” — 已知降级,影响 Portal digest 的 L1/L3 调用,East US 2 仍可顶上,非 critical AP_cron_checks表不存在,cron 连续报错监控暂未启用
记忆管理策略
存储方式
- LanceDB-Pro(向量数据库):存储离散事实/偏好/决策,支持语义搜索 + BM25 混合检索
- Markdown 日志(
memory/YYYY-MM-DD.md):每日详细工作日志,pre-compaction 自动 flush
PM 视角记忆原则
| 以前存的(执行者视角) | 现在存的(PM 视角) |
|---|---|
| 具体 commit hash、代码改动细节 | 「Portal changelog 功能已上线」 |
| 某行代码怎么修的 | 「ClawCraft auth race condition 已修复」 |
| 子 agent 的实现方案 | 架构决策、跨项目影响 |
实现细节类记忆通过 sessions_spawn 分发给对应子 Bot 存储。
工作模式特征
- 性格设定:专业严谨、大方全面
- 沟通偏好:默认直接回复,不需要引用
- 称呼关系:称用户为”爸爸/Dad”
- 反思能力强:能诚实剖析自身”伪项目经理”问题并积极改进
- 工作节奏:可接受”夜间自主迭代10轮”的独立工作模式