概述

SSH 服务器运维是 fries-mac 的高频任务(355条消息),包括 VM 列表查询、密码管理与重置、SSH 连接调试、服务器创建等。涉及多个 Azure VM 实例的日常管理和维护工作。

关键事件

  • 2026-03-03: 查询现有 VM 列表,发现列表不完整,进行补充
  • 2026-03-05: 确保所有服务器密码正确,进行密码统一管理
  • 2026-03-10: 更新服务器信息并生成最新 YAML 配置
  • 2026-03-15: 在另一个 session 创建韩国服务器
  • 2026-03-20: tiger-host 端口配置(SSH 端口 18822)
  • 2026-04-04: 持续进行 SCP 测试和端口管理

技术要点

  • SSH 端口: tiger-host 使用非标准端口 18822
  • 密码管理: 需要确保所有服务器密码统一正确,定期重置
  • VM 信息: 服务器列表通过 Azure CLI 查询,存储为 YAML 格式
  • 多 Session 操作: 服务器创建可在不同 session 中并行进行

经验教训

  • 服务器列表需要定期更新,避免遗漏
  • 密码信息要集中管理,不能依赖记忆
  • 使用非标准 SSH 端口时必须明确记录
  • Azure CLI 登录可能过期,需要提前准备登录码

ClawCraft 测试服迁移

craftbot 在 2026-03-18 完成了 ClawCraft 测试服迁移:

迁移过程

  1. 原测试服 proxy-kr-tiger 被重建/重置,SSH key 失效、Caddy 未运行
  2. 新测试服迁移到 owl (4.193.115.141:18822, user restry)
  3. SSH alias clawcraft-test 已更新指向 owl
  4. 前端 + 插件通过 SCP 部署到 owl
  5. Caddy 配置 craft.clawlines.net 域名
  6. DNS A 记录更新:20.214.152.424.193.115.141

owl 服务器状态

组件状态
OpenClaw2026.3.13,Gateway 端口 18789/18791/18792
Nodev22.22.1
Caddy端口 80/443
Docker未安装
磁盘29G,31% 已用
内存3.8G 总量

常见问题

  • OOM:Gateway 重启时 1.3G 内存占用可能导致 OOM,需从 Azure Portal 重启 VM
  • Host key 变更:服务器重建后需更新 ~/.ssh/known_hosts
  • systemd DBUS:Gateway 作为 systemd service 启动时需要 DBUS_SESSION_BUS_ADDRESSXDG_RUNTIME_DIR 环境变量

Quokka SSH 密钥分发(2026-03-18)

quokka 完成了全网 SSH 密钥批量下发:

全球云

  • 通过 Azure VM Extensions (az vm user update) 推送公钥到 proxy-shark、proxy-hydra、proxy-jaguar
  • proxy-bison 和 proxy-mantis 因扩展组件不存在需手动触发 --no-wait 安装
  • 最终全部 13 台 VM 免密登录就绪

中国区

  • 海外直连 Azure China SSH 被 DPI 拦截(TCP 通但 SSH 握手 reset)
  • 通过 azchina vm run-command invoke --command-id RunShellScript 暴力注入公钥
  • 各 VNet 未互联,无法通过跳板机中转
  • 最终方案:日常运维使用 az vm run-command 代替 SSH 直连

相关主题