Agentic BI研究项目

基于多智能体架构的”Talk to Data”企业级 BI 助手,实现自然语言驱动的数据查询与智能分析,集成 Power BI 和 Databricks。

概述

Agentic BI 是一个由 Research 代理自主执行的研究项目,旨在构建企业级”Talk to Data”解决方案。项目背景源于传统 BI 报表的三大痛点:固定报表无法满足即席钻取、依赖”需求-开发-上线”的冗长链路导致决策滞后、深度挖掘高度依赖 SQL/BI 技能造成数据价值难以释放。

解决方案采用多智能体编排架构(Router/Executor/Reviewer),配合预置的业务技能库(Skills Library)确保计算口径100%准确,通过 DuckDB-WASM 实现浏览器端12万行数据毫秒级响应,并严格遵循 Power BI RLS 权限体系。

该项目是 Research 代理创建后的第一个正式研究课题,在实施过程中也暴露了 sessions_spawn 工作区继承的技术问题。

关键点

  • 三智能体架构:调度 Agent (Router) 负责意图识别、执行 Agent (Executor) 生成 SQL、校验 Agent (Reviewer) 闭环验证
  • Skills Library:预置同比、环比、TopN 等原子函数,通过 Function Calling 消除计算幻觉
  • DuckDB-WASM:浏览器端零后端 SQL 引擎,支持12万行数据本地毫秒级响应
  • Power BI 集成:通过自定义视觉对象挂载 Databricks 处理后的数据集
  • RAG 增强:融合报表数据与企业政策文档,实现制度视角的趋势解读
  • 非侵入式设计:弹窗界面,一键嵌入现有门户

技术细节

核心架构

用户自然语言提问
    ↓
[Router Agent] → 意图识别 + 任务分发
    ↓
[Executor Agent] → Skills Library / SQL 生成
    ↓
[Reviewer Agent] → 代码审计 + 逻辑闭环验证
    ↓
结果返回 + 可视化

核心功能

  • 即时问答洞察:自然语言提问,自动调用技能生成叙述性结论
  • 复杂计算免 DAX:通过预定义 Skills 处理各类占比计算
  • 多维联动分析:基于上下文的连续追问,全局到细节钻取
  • 逻辑透明诊断:自动展示 SQL 逻辑与 Agent 推理链
  • 启发式探索:根据报表上下文自动推荐潜在问题
  • 反馈闭环调优:收集点赞与反馈,持续微调 Prompt 策略

文献调研关键发现

  • 多智能体 Text-to-SQL 架构已成熟,Router/Executor/Reviewer 与业界方向一致
  • DuckDB-WASM 完全可行:零后端、毫秒级、浏览器端隐私保护
  • Power BI Copilot 不支持 Embedded,自建 AI 助手是唯一可行路径
  • RAG 增强 schema linking 是提升准确性的关键技术

项目目录结构

workspace-research/projects/agentic-bi/
├── README.md
├── tasks.json
├── notes/
│   └── literature-review.md
├── poc/
└── output/

时间线

  • 2026-03-11: 研究课题发送给 Research 代理
  • 2026-03-11: Research 代理完成项目初始化:创建 projects/agentic-bi/ 目录
  • 2026-03-11: 第一个任务(文献调研)完成,产出 literature-review.md
  • 2026-03-11: 发现 sessions_spawn 工作区继承问题,文件搬迁到正确工作区
  • 2026-03-11: Research 代理开始自主推进后续任务

Prism-Docs Bot

Prism-Docs 是 Prism 五人 Bot 团队中的文档/策略角色(@prism-docs),于 2026-03-13 上线。根据聊天记录:

  • 工作区路径/home/restry/.openclaw/workspace
  • 默认模型github-copilot/claude-opus-4.6,也测试过 gpt-5.4gpt-5.2
  • 角色定位:Prism 中枢的文档与策略助手,专注 Best Practice Guide、Impact Estimate、架构图与演示 PPT/冲奖材料
  • 交互风格:开场以”🔮“标识,主动提供任务排期、站会同步、风险梳理等选项
  • B2P Hackathon:在 gpt-5.4 模型下自称协助推进 B2P Hackathon 的节奏、协同和交付

BiBot 运维记录

以下信息来源于 bibot 的 Mattermost DM 聊天记录(2026-03-17 ~ 2026-03-30)。

部署架构

开发环境 bi.dev.dora.restry.cn 通过 Caddy 反向代理分流:

  • /api/* → 后端 uvicorn (port 8899, PM2 进程: bi-backend)
  • /* → 前端静态文件 (port 3016, PM2 进程: dev-bi)

生产环境 bi.dora.restry.cnbi.clawlines.net 未部署(项目已归档)。

自定义分析技能(9 个)

位于 poc/v1-simple/backend/skills/ 目录,由 Router Agent 按需调用:

技能名用途
general_query通用 SQL 查询(兜底技能)
year_over_year同比分析(保费/理赔同比增长)
top_nTopN 排名(地区/险种/渠道排名)
trend时间趋势分析(月/季/年粒度)
loss_ratio赔付率分析(各维度 JOIN 计算)
claim_analysis理赔深度分析(时效/拒赔率/金额分布)
customer_profile客户画像(年龄/性别/交叉分析)
product_mix产品结构(险种占比/新单率/续保率)
channel_performance渠道绩效(佣金率/代理人产能/排名)

工作区维护状态

sync.mjs 定期同步显示:

  • 工作区:workspace-research-bi,状态健康
  • CONTEXT.md:88 行,归档后标记为 stale(正常)
  • 任务:6/6 全部完成
  • Portal API:返回 404(slug “agentic” 不存在,Portal 服务 localhost:18820 未运行)

修复记录

  • 前端 require 报错(2026-03-20):旧构建(3月18日)包含 require("@logto/react") CommonJS 调用,浏览器不支持。重新 npm run build 修复
  • 后端未运行(2026-03-20):uvicorn 未启动导致 /api/system-config 等接口 502。通过 PM2 托管启动
  • Caddy 路由错误(2026-03-19):配置指向错误端口 5173(实际前端 3016、后端 3017)
  • API 代理缺失(2026-03-20):pm2 serve 不处理 /api 代理,修改 Caddy 配置分流 API 和静态文件
  • bi-backend 消失(2026-03-30):重启后消失,重新通过 PM2 启动

BNEF Bot 视角的 Prism PM 运营

以下信息来源于 bnef 的 Mattermost DM 聊天记录(2026-03-13 ~ 2026-03-15)。

Prism PM 任务规划

BNEF Bot 作为 prism-pm 中枢,完成了 Hackathon 两周冲刺的任务规划:

  • 21 项任务分 4 阶段:W1-设计(Day 1-2) → W1-开发(Day 3-7) → W2-集成(Day 8-11) → W2-交付(Day 12-14)
  • PM 不做具体执行,只做调度追踪和风险预警
  • 任务集中在 tasks/active.json,每项有 assignee/due/phase/status
  • 配置了 3 个 Cron Job:晨会(09:00)、进度检查(16:00)、日报(21:00)

风险管控机制

风险类型检测方式应对
逾期due < 今天且 ≠ done通知负责人 + PM
阻塞status = blocked协调解决方案
里程碑滑坡阶段完成率 <50% 且距结束 ≤1天高风险告警
前端空缺prism-ui 无人绑定W2 前需确认

时间线调整

Day 1 从最初的 3/13 调整为 3/16(周一),新时间线:

3/16(一) ── 3/18(三) ── 3/22(日) ── 3/26(四) ── 3/29(日)
  W1-设计      W1-开发      W2-集成      W2-交付

相关页面

Hackathon Bot 团队补充信息

以下信息来源于 prism-arch、prism-data、prism-ui 的 Mattermost DM 聊天记录(2026-03-13)。

项目别名

该项目在 Hackathon 中被称为 B2P Hackathon(prism-ui Bot 自我介绍中提及)。

技术选型演进

Bot 的实际自我介绍中反映的技术栈与早期文献调研阶段存在差异,可能代表了 Hackathon 过程中的选型演进:

层面文献调研方案Bot 实际使用
前端框架StreamlitReact + Vite
图表库PlotlyECharts
数据引擎DuckDB-WASM (浏览器端)DuckDB(未明确 WASM)
编排框架Router/Executor/ReviewerLangGraph 多智能体编排

多 Agent 分工

5个 Prism Bot 组成完整的虚拟开发团队:

  • prism-pm: 项目中枢,任务管理与进度协调(唯一支持 pm 前缀触发)
  • prism-arch: LangGraph 多智能体编排、系统架构设计、Azure OpenAI 对接
  • prism-data: DuckDB 建模、SQL 技能实现
  • prism-ui: React + Vite 前端框架、ECharts 图表、对话式分析界面
  • prism-docs: 文档/策略/PPT

所有 Bot 共享 agent:prism-pm:main 会话,由 prism-pm 中枢统一协调。默认使用 github-copilot/claude-opus-4.6 模型,上下文窗口 128k;切换到 gpt-5.4 时上下文扩展到 400k。

B2P Hackathon 整体规划

以下信息来源于 work_assistant 的 Mattermost DM 聊天记录(2026-03-13)。

活动信息

  • 活动: 公司内部 Hackathon(GCR ISD)
  • 时长: 2 周
  • 团队: B2P(Build to Perfection),14 人分 3 支小队

三支小队

小队赛道名称Slogan
队 1Track C: Dev & TestB2P · 造物者 (Forge)“人类出想法,AI 出代码”
队 2Track B: Planning & PMB2P · 掌舵人 (Helm)“项目不需要被管理,它需要被驱动”
队 3Track D: App ModernizationB2P · Prism(棱镜)“用人话问数据,让数据说人话”

Prism 四大交付物

  1. Working Demo: 10 分钟演示,保险行业数据分析场景
  2. Running Code: ADO 仓库 b2p-prism,clone-and-run
  3. Best Practice Guide: 工具选型、Prompt 规范、质量检查清单
  4. Impact Estimate: 传统方式 vs AI 方式量化对比(95% 效率提升)

冲奖目标

  • Best Practice Sharing: 可复制的 Playbook + Prompt 模板
  • Best AI Tools: 多智能体架构创新 + DuckDB 零部署 + 可量化效率

OpenClaw 团队基础设施

为 Prism 项目在 Eagle 服务器(eagle-sg.southeastasia.cloudapp.azure.com)部署了独立 OpenClaw 实例:

  • 5 个 Bot + 5 个 Agent,各使用不同 AI 模型
  • 独立 Mattermost 服务器:mattermost-server.chinanorth3.cloudapp.chinacloudapi.cn
  • Standup 频道用于每日站会和活动通知

相关页面