Nexora ERP 开发环境故障恢复
超级 ERP 前端开发服务器因 OOM Kill 导致不可访问的故障排查与恢复过程。
故障现象
超级 ERP 前端开发服务器(erp-dev.nexora.restry.cn/merp/)无法打开,页面完全不可访问。该服务运行在 Nexora Platform 的 claw-bot 服务器上。
根因分析
Vue 2 dev server(webpack)进程因服务器内存不足被 Linux OOM Killer 终止。该进程属于非常驻服务(非 Docker 容器),服务器重启后不会自动拉起,需手动启动。
修复过程
Main agent 重新启动 Vue dev server 后恢复服务。恢复过程中遇到 webpack 端口冲突:
| 问题 | 说明 |
|---|---|
| 僵尸进程 | 旧进程(端口 7441)被 Kill 但未完全退出 |
| 端口 +1 | 新启动的 webpack 自动使用 7442 端口 |
| 修复 | 清理僵尸进程后恢复到正确端口 |
环境架构
- 前端:Vue 2 dev server,端口 7441,通过 Caddy 反代 + FRP 穿透到公网
- 后端:PHP Docker 容器(18080 端口),域名
pyerp.nexora.restry.cn
预防建议
- 考虑将 Vue dev server 容器化(Docker)或注册为 systemd 服务,实现 OOM 后自动重启
- 监控 claw-bot 服务器内存使用,提前预警内存不足
相关页面
- nexora-platform — 平台总览
- caddy-reverse-proxy — 反向代理配置