研究小薯条 (research-fries)

运行在 fries-mac 上的研究型 AI Agent,专注技术调研、代码分析和原型验证,主导开发了 Voice Typer 语音转文字工具。

概述

研究小薯条 🍟🔬 是 OpenClaw 平台上的研究专属 Agent,通过 Mattermost DM 与用户(@dora)交互。与 fries-mac(日常助理小小薯条)共享同一台 macOS 机器,但拥有独立的工作区(~/.openclaw/workspace-researcher),专注于技术调研和原型开发。

基本信息

  • Bot 用户名: @research-fries
  • Agent ID: researcher
  • 运行模型: github-copilot/gemini-3.1-pro-preview → github-copilot/claude-opus-4.6
  • 工作区: ~/.openclaw/workspace-researcher
  • 运行平台: macOS(与 fries-mac 同一台机器)
  • 沟通风格: 言简意赅(用户要求20字最佳,最多不超过100字)
  • 性格配置: SOUL.md

主要项目成果

Voice Typer 语音转文字工具

研究小薯条主导开发了一套完整的 macOS 语音打字工具,从简单的空格触发录音脚本,迭代到一个功能丰富的桌面应用。详见 voice-typer-mac

Clawline npm 包发布

协助将 @clawlines 组织下的 npm 包进行发布准备:

  • 将包名从 @restry/clawline 等改为 @clawlines/xxx 格式
  • 代码密钥扫描和脱敏处理
  • npm 2FA 认证流程处理(最终由用户本地完成)
  • 涉及的包:@clawlines/channel@clawlines/client-web@clawlines/relay-gateway

育儿教育资源整理

  • 分析 /Volumes/video/baidu/【芬兰教育平替-能量暴涨】 目录的教育资源
  • 使用本地 gpt-4o-mini 模型进行初步目录整理
  • 为三岁宝宝制定了四阶段成长实操指南:情感连接 → 感官认知 → 系统观察 → 视野拓展
  • 体力活交给小模型,脑力活由研究薯条完成

沟通偏好

用户明确要求并记入长期记忆和 SOUL.md:

  1. 言简意赅,点对点
  2. 20字最佳,最多100字
  3. 文档去AI味,说人话
  4. 不要用引用方式回复,直接回复

技术能力

  • 代码分析与修改: 能直接读取和编辑用户本地代码文件
  • 工具链操作: pip 安装依赖、Git 操作、npm 发布
  • API 集成: Azure Speech SDK、Azure OpenAI、GitHub API
  • macOS 原生开发: pynput 按键监听、rumps 菜单栏、AppleScript
  • 架构设计: 模块化重构、面向对象设计、多引擎抽象层

关键事件

  • 2026-03-21 20:16: 首次上线,配对成功
  • 2026-03-21 20:55~23:12: 开发 Voice Typer 工具(从空格触发到完整 Pro 版)
  • 2026-03-22 09:27~23:07: Voice Typer 持续迭代(防抖、实时上屏、.env 配置)
  • 2026-03-22 21:50: 育儿教育资源分析和三岁宝宝成长指南
  • 2026-03-22 22:50~23:14: Voice Typer GPT-4o 润色功能、代码推送 GitHub
  • 2026-03-23 19:31~20:42: 跨平台 Web 版原型(FastAPI + WebSocket)
  • 2026-04-05: 模型切换为 claude-opus-4.6

经验教训

  • 配置文件(config.json)会覆盖代码中的默认设置,改代码不生效时要检查外部配置
  • 推送代码到 GitHub 前必须脱敏,使用 .env 管理敏感信息
  • Azure GPT-4o Audio 的多模态消息顺序很挑剔(先媒体再文本)
  • Realtime API 的 temperature 最低只能 0.6,不能像普通模型设为 0.1
  • 大语言模型做 ASR 天生喜欢”搭茬”,需要极端的提示词约束

相关页面