Nexora ERP 开发环境故障恢复

超级 ERP 前端开发服务器因 OOM Kill 导致不可访问的故障排查与恢复过程。

故障现象

超级 ERP 前端开发服务器(erp-dev.nexora.restry.cn/merp/)无法打开,页面完全不可访问。该服务运行在 Nexora Platform 的 claw-bot 服务器上。

根因分析

Vue 2 dev server(webpack)进程因服务器内存不足被 Linux OOM Killer 终止。该进程属于非常驻服务(非 Docker 容器),服务器重启后不会自动拉起,需手动启动。

修复过程

Main agent 重新启动 Vue dev server 后恢复服务。恢复过程中遇到 webpack 端口冲突

问题说明
僵尸进程旧进程(端口 7441)被 Kill 但未完全退出
端口 +1新启动的 webpack 自动使用 7442 端口
修复清理僵尸进程后恢复到正确端口

环境架构

  • 前端:Vue 2 dev server,端口 7441,通过 Caddy 反代 + FRP 穿透到公网
  • 后端:PHP Docker 容器(18080 端口),域名 pyerp.nexora.restry.cn

预防建议

  • 考虑将 Vue dev server 容器化(Docker)或注册为 systemd 服务,实现 OOM 后自动重启
  • 监控 claw-bot 服务器内存使用,提前预警内存不足

相关页面