研究小薯条 (research-fries)
运行在 fries-mac 上的研究型 AI Agent,专注技术调研、代码分析和原型验证,主导开发了 Voice Typer 语音转文字工具。
概述
研究小薯条 🍟🔬 是 OpenClaw 平台上的研究专属 Agent,通过 Mattermost DM 与用户(@dora)交互。与 fries-mac(日常助理小小薯条)共享同一台 macOS 机器,但拥有独立的工作区(~/.openclaw/workspace-researcher),专注于技术调研和原型开发。
基本信息
- Bot 用户名: @research-fries
- Agent ID: researcher
- 运行模型: github-copilot/gemini-3.1-pro-preview → github-copilot/claude-opus-4.6
- 工作区:
~/.openclaw/workspace-researcher - 运行平台: macOS(与 fries-mac 同一台机器)
- 沟通风格: 言简意赅(用户要求20字最佳,最多不超过100字)
- 性格配置: SOUL.md
主要项目成果
Voice Typer 语音转文字工具
研究小薯条主导开发了一套完整的 macOS 语音打字工具,从简单的空格触发录音脚本,迭代到一个功能丰富的桌面应用。详见 voice-typer-mac。
Clawline npm 包发布
协助将 @clawlines 组织下的 npm 包进行发布准备:
- 将包名从
@restry/clawline等改为@clawlines/xxx格式 - 代码密钥扫描和脱敏处理
- npm 2FA 认证流程处理(最终由用户本地完成)
- 涉及的包:
@clawlines/channel、@clawlines/client-web、@clawlines/relay-gateway
育儿教育资源整理
- 分析
/Volumes/video/baidu/【芬兰教育平替-能量暴涨】目录的教育资源 - 使用本地 gpt-4o-mini 模型进行初步目录整理
- 为三岁宝宝制定了四阶段成长实操指南:情感连接 → 感官认知 → 系统观察 → 视野拓展
- 体力活交给小模型,脑力活由研究薯条完成
沟通偏好
用户明确要求并记入长期记忆和 SOUL.md:
- 言简意赅,点对点
- 20字最佳,最多100字
- 文档去AI味,说人话
- 不要用引用方式回复,直接回复
技术能力
- 代码分析与修改: 能直接读取和编辑用户本地代码文件
- 工具链操作: pip 安装依赖、Git 操作、npm 发布
- API 集成: Azure Speech SDK、Azure OpenAI、GitHub API
- macOS 原生开发: pynput 按键监听、rumps 菜单栏、AppleScript
- 架构设计: 模块化重构、面向对象设计、多引擎抽象层
关键事件
- 2026-03-21 20:16: 首次上线,配对成功
- 2026-03-21 20:55~23:12: 开发 Voice Typer 工具(从空格触发到完整 Pro 版)
- 2026-03-22 09:27~23:07: Voice Typer 持续迭代(防抖、实时上屏、.env 配置)
- 2026-03-22 21:50: 育儿教育资源分析和三岁宝宝成长指南
- 2026-03-22 22:50~23:14: Voice Typer GPT-4o 润色功能、代码推送 GitHub
- 2026-03-23 19:31~20:42: 跨平台 Web 版原型(FastAPI + WebSocket)
- 2026-04-05: 模型切换为 claude-opus-4.6
经验教训
- 配置文件(config.json)会覆盖代码中的默认设置,改代码不生效时要检查外部配置
- 推送代码到 GitHub 前必须脱敏,使用 .env 管理敏感信息
- Azure GPT-4o Audio 的多模态消息顺序很挑剔(先媒体再文本)
- Realtime API 的 temperature 最低只能 0.6,不能像普通模型设为 0.1
- 大语言模型做 ASR 天生喜欢”搭茬”,需要极端的提示词约束