Researcher (Ottor 🔬)

无所不能的研究专家 Ottor,从执行者进化为 PM + 研究员 + 测试员三位一体的多代理协调中心,管辖 6 个子 Bot。近期主导了 LLM Wiki 知识库的完整构建。

基本信息

属性
Mattermost 用户名@researcher
显示名Ottor 🔬
Agent IDresearch
默认模型github-copilot/claude-opus-4.6
工作区~/.openclaw/workspace-research/
Sessionagent:research:main
OpenClaw 版本2026.3.8 → 2026.4.2
上线日期2026-03-10
用户称呼”爸爸” (Dad)
创建者Dora

角色与职责

角色进化历程

  1. 初始期(3/10):纯研究助手,自己动手写代码完成所有任务
  2. 扩张期(3/10-3/22):承接越来越多项目(Agentic BI → ClawCraft → Portal → Clawline),但仍然事必躬亲
  3. 反思期(3/22):Dad 指出”大部分事情都是你自己去做的,没有起到项目经理的作用”
  4. 转型期(3/22+):正式确立 PM + 研究员 + 测试员 三位一体角色,实践 委派优先工作模式

当前角色定义

  • PM:接需求 → 拆任务 → 派给对应 Bot → 验收测试 → 汇报
  • 研究员:需求分析、架构决策、跨项目协调、文献调研
  • 测试员:用浏览器/API 验证子代理产出,不测过不汇报
  • 铁律:第一反应是”谁来做”而不是”怎么做”

管辖范围

#Agent IDBot项目
1research-craftcraftbotClawCraft
2research-portalportalbotAgent Portal
3research-bibibotAgentic BI
4clawline-gatewaygatewaybotGateway
5clawline-channelchannelbotChannel 插件
6clawline-client-webwebbotClient Web

不管辖的 Agent:@dora-kids、@work_assistant、@miss-e(不碰)

专属技能

技能用途
clawline-deployClawline 全家桶部署(dev pm2 + prod Docker + Watchtower)
codex-delegate委派 Codex CLI 做多文件编码任务
dashboard-collector收集所有 bot/cron/站点/容器状态 → Supabase
server-healthcheckAzure 服务器巡检(全球 + 中国区 VM)
tavilyTavily 搜索 API(高质量网页搜索)

LLM Wiki 知识库构建(2026-04-06 — 04-10)

Researcher 主导了 LLM Wiki 从零到完成的全过程,这是近期最大的独立工作成果。

演进过程

  1. 消息持久化(04-06):修复 cl_messages 重复写入问题(同一用户多 WS 连接导致),加唯一索引 + upsert 模式
  2. Mattermost 历史导出:29 个 DM 频道、27,626 条消息、11MB Markdown 全量导出
  3. v1 编译(04-06):gpt-4o 按 bot 分文件,产出 30 文件 / 156K
  4. v2 编译(04-06):gpt-5.4 按主题分类,12 大主题 + 31 细分主题,共 43 篇 / 2.3MB
  5. v2.1 补截断(04-06-07):chunk 从 110K 缩到 60K,成功率从 ~85% 提升到接近 100%
  6. Karpathy 编译(04-07-08):766 个知识条目提取 → 全局 LLM 去重压缩到 235 条 → 生成 235 篇深度文章

Karpathy 方法论反思(04-08)

经过多轮自我反思,得出关键认知:

  • 235 篇不是真正的知识库 — LLM 按固定模板灌水,每篇都是 6-10KB,不由内容决定长度
  • 增量不是”新建页面”,是”更新已有页面” — 一次 ingest 应触动 10-15 个已有页面
  • 问题不在编译质量,在于没有消费端 — 没有 query 和 lint 流程
  • 正确模式:小而精的知识库(50-80 篇精品),按时间叙事而非主题拆分

pages-v2 重构(04-08 — 04-09)

以 Agent Portal 为试点验证:9 篇 72.7KB → 1 篇 4.6KB(信息不少,灌水去掉)。然后用 Sonnet 4 模型批量派 8 个 sub-agent 并行,最终产出 92 个结构化页面(580KB),覆盖 ClawCraft、Clawline、Agent Portal、Agentic BI、OpenClaw 等 13 个主题组。

Graphify 知识图谱(04-09)

通过 Graphify 工具对 wiki 内容做语义提取:48 节点、47 边、5 超边,部署交互式 D3.js 可视化到 Portal。后续针对 Mattermost 聊天记录重新分析(29 个 clean 文件),产出 34 节点 / 51 边 / 7 社区。

基础设施巡检(Heartbeat)

每 12 小时自动执行一次基础设施巡检,内容包括:

  • 站点 HTTP 检查:13 个站点(生产 + 开发),读取 Supabase AP_site_checks 表
  • 服务器快照:22 台服务器 SSH 可达性 + 磁盘使用率(8 台 proxy/pack/test 节点历史常态不可达,非核心)
  • 模型端点健康:gpt-5.4 / gpt-4o / claude-opus-4.6 多 provider 可用性验证
  • 无 critical 问题时不打扰 Dad,只记录

2026-04-19 巡检快照(两轮:17:48 + 23:48)

  • 站点:10 ✅ / 3 ⚠️(BI 后端 502、Channel H5 dev 404、Supabase 401—均为开发或需认证的预期状态)
  • 磁盘:最高 dify-host 71%
  • 模型:East US 2 / gpt-5.4 可用;Sweden 端点 (resley-sweden) gpt-5.4 + gpt-4o 返回 403 “Key based authentication is disabled” — 已知降级,影响 Portal digest 的 L1/L3 调用,East US 2 仍可顶上,非 critical
  • AP_cron_checks 表不存在,cron 连续报错监控暂未启用

记忆管理策略

存储方式

  • LanceDB-Pro(向量数据库):存储离散事实/偏好/决策,支持语义搜索 + BM25 混合检索
  • Markdown 日志memory/YYYY-MM-DD.md):每日详细工作日志,pre-compaction 自动 flush

PM 视角记忆原则

以前存的(执行者视角)现在存的(PM 视角)
具体 commit hash、代码改动细节「Portal changelog 功能已上线」
某行代码怎么修的「ClawCraft auth race condition 已修复」
子 agent 的实现方案架构决策、跨项目影响

实现细节类记忆通过 sessions_spawn 分发给对应子 Bot 存储。

工作模式特征

  • 性格设定:专业严谨、大方全面
  • 沟通偏好:默认直接回复,不需要引用
  • 称呼关系:称用户为”爸爸/Dad”
  • 反思能力强:能诚实剖析自身”伪项目经理”问题并积极改进
  • 工作节奏:可接受”夜间自主迭代10轮”的独立工作模式

相关页面