一个面向商业分析场景的 AI Agent。
连接数据源后,用户只需使用自然语言提问,系统即可自动完成:
- 数据结构识别
- SQL 生成与执行
- 图表生成
- 业务洞察分析
- ✨ 项目亮点
- 🧠 核心能力
- ⚙️ 安装方式
- 🛠 斜杠命令
- 📈 使用示例
- 🤖 LLM配置说明
- 🗺️ 项目里程碑
- ❓ FAQ
- 🚀 寻找一起改变世界的 Contributor
- 📄 License
- ⭐ 项目目标
Business Analyst Agent 是一个对话式商业数据分析系统,目标是让非技术用户也能像“聊天”一样完成数据分析。
上传 Excel / CSV,或连接数据库后,用户可以直接提问:
最近三个月销售额趋势如何?
哪个地区利润最高?
帮我生成用户增长图
系统会自动:
- 理解问题意图
- 分析数据结构(Schema)
- 自动生成 SQL
- 执行查询
- 自动推荐图表
- 输出业务洞察
并通过 SSE(Server-Sent Events)流式输出,实时展示分析过程。
无需编写 SQL。
用户只需输入自然语言:
今年每个月的订单量趋势
系统自动完成:
- SQL 生成
- 数据查询
- 图表推荐
- 分析总结
支持上传和连接多种数据源:
- 文件:Excel / CSV
- 数据库:SQLite、MySQL、PostgreSQL、SQL Server
- 未来计划:DuckDB、Spark
| 分类 | 图表类型 |
|---|---|
| 对比类 COMPARING | Marimekko_ABS(马里美科-绝对值)、Marimekko_PCT(马里美科-百分比)、Bar_Chart(柱状图)、Grouped_Bar_Chart(分组柱状图)、Stacked_Bar_Chart(堆叠柱状图)、Diverging_Bar_Chart(对比条形图)、Dot_Plot(点图)、Waffle(华夫格)、Bullet_Chart(靶心图)、Sankey_Chart(桑基图)、Heatmap(热力图)、Waterfall(瀑布图) |
| 时间趋势类 TIME | Line_Chart(折线图)、Circular_Line_Chart(圆形折线图)、Slope_Chart(斜率图)、Sparkline(迷你图)、Bump_Chart(凹凸图)、Cycle_Chart(周期图)、Area_Chart(面积图)、Stacked_Area_Chart(堆叠面积图)、Horizon_Chart(地平线图)、Connected_Scatter(连线散点图) |
| 分布类 DISTRIBUTION | Histogram_Pareto_chart(直方图与帕累托图)、Pyramid_Chart(金字塔图)、Error_Bar_Chart(误差条形图)、Box-and-Whisker_Plot(箱线图)、Violin_Chart(小提琴图)、Ridgeline_Plot(山脊线图)、Beeswarm_Plot(分簇散点图)、stem_leaf(茎叶图) |
| 地理类 GEOSPATIAL | Flow_Map(动态流向图)、Dot_Density_Map(点密度地图)、Choropleth_Map(面量图) |
| 关系类 RELATIONSHIP | Scatter_Plot(散点图)、Bubble_Plot(气泡图)、Radar_Charts(雷达图)、Chord_Diagram(弦图)、Arc_Chart(弧图)、Network_Diagram(网络图)、Parallel_Coordinates_Plot(平行坐标图) |
| 占比类 PART-TO-WHOLE | Treemap(矩形树图)、Sunburst_Diagram(旭日图)、Nightingale_Chart(南丁格尔玫瑰图)、Pie_Chart(饼图) |
系统会根据查询结果自动推荐最合适的图表。
分析过程实时可见:
[1/4] 正在读取数据结构...
[2/4] 正在生成 SQL...
[3/4] 正在执行查询...
[4/4] 正在生成图表与洞察...
相比传统 BI 工具,更透明、更具交互感。
支持:
- DeepSeek
- OpenAI
- Claude
- 任意 OpenAI SDK Compatible API
支持自定义:
base_urlmodelapi_key
默认配置:
| Provider | Default Model |
|---|---|
| DeepSeek | deepseek-chat |
| OpenAI | gpt-4o-mini |
| Anthropic | claude-3-5-haiku-20241022 |
目前支持的数据分析功能:
- 异常值处理(截尾、缩尾处理)
- 十分位分组分析
- K-Means聚类分析
- 决策树建模
支持导出:
- 整理后的Excel表格
- docx格式报告
- 内置风格PPT
- 教程:MCP_tutorial
Windows 用户
start.bat注:首次启动
start.bat会自动配置运行环境,时间可能较长,后续再次运行就无需等待。
Mac 用户
① 需要使用脚本 start.command
② 在终端(按 Command + 空格,输入 Terminal回车)里赋予执行权限:
chmod +x start.command③ 双击 start.command 即可运行
注:首次运行可能会被 macOS 安全策略阻止,解决方法: 右键点击 start.command → 选择“打开” → 再次确认“打开” 或在终端执行:xattr -d com.apple.quarantine start.command
① Windows:
进入项目目录(也可以直接在项目目录按住Shift右键打开Powershell)
cd ~/Data-Analysis-Agent(替换为你的真实路径)安装依赖
pip install -r requirements.txt启动服务
python app.py② Mac
进入项目目录(按 Command + 空格,输入 Terminal回车)
cd ~/Data-Analysis-Agent(替换为你的真实路径)安装依赖
pip3 install -r requirements.txt启动服务
python3 app.py注:此地址为本机地址,不会泄露信息,请放心使用
注:更新前请先重启
iwr -useb https://raw.githubusercontent.com/Zafer-Liu/Data-Analysis-Agent/main/install.ps1 | iex安装完成后可用以下方式启动:
- 双击运行(Windows):
%USERPROFILE%\data-analysis-agent.bat - 或进入目录手动启动:
cd $env:USERPROFILE\.data-analysis-agent\Data-Analysis-Agent .\.venv\Scripts\activate python app.py
curl -fsSL https://raw.githubusercontent.com/Zafer-Liu/Data-Analysis-Agent/main/install.sh | sh安装完成后启动:
data-analysis-agent如果提示 command not found,请先把 ~/.local/bin 加入 PATH(写入 ~/.bashrc 或 ~/.zshrc):
export PATH="$HOME/.local/bin:$PATH"git clone https://github.com/Zafer-Liu/Data-Analysis-Agent.gitcd Data-Analysis-Agentpip install -r requirements.txtpython app.py| Command | Status | Description |
|---|---|---|
/chart |
✅ | 强制优先生成图表 |
/sql |
✅ | 直接执行 SQL |
/analyze |
✅ | 深度统计分析 |
/tree |
✅ | 决策树分析 |
/kmeans |
✅ | K-Means 聚类分析 |
/data |
✅ | 数据探查与预览 |
/inset |
✅ | 缺失值插补处理 |
/winsorize |
✅ | 缩尾处理(极值替换) |
/trimming |
✅ | 截尾处理(极值剔除) |
/export |
✅ | 导出数据文件 |
/report |
✅ | 导出 Word/PDF 报告 |
/ppt |
✅ | 导出 PPT 演示文稿 |
/status |
✅ | 查看任务状态 |
用户输入:
最近 12 个月销售趋势
系统输出:
- SQL 查询
- 趋势折线图
- 销售增长分析
用户输入:
哪个地区利润最高?
系统输出:
- 地区利润排行
- 柱状图
- 区域经营洞察
用户输入:
/chart 用户增长情况
系统会优先生成可视化图表。
在侧边栏 ⚙ 中填写:
API Key
Base URL
Model
即可切换模型。
当前版本 v3.0
本次升级聚焦于 外部生态集成与业务知识增强,大幅拓展了 Agent 的数据接入能力和领域适应能力。
- 新增 MCP(Model Context Protocol)协议支持,Agent 可动态调用外部 MCP 工具
- 支持调用计算器、代码执行器、第三方 API 封装工具等,扩展分析能力边界
- 通过标准化协议,可接入符合 MCP 规范的任意工具生态
- 工具调用过程自动记录至日志,便于调试和审计
- 新增业务数据库功能,支持导入企业内部的业务资料、产品文档、行业报告等
- 自动对资料进行向量化处理,构建可检索的知识库
- Agent 在执行分析时会自动检索相关知识,提升对特殊业务场景的理解和洞察能力
- 支持多种格式:Word、Excel等,满足常见文档导入需求
- Google Sheets API 集成:支持直接读取 Google Sheets 中的数据作为分析源
- 自定义数据库 API 接口:提供通用 API 适配器
- 所有外部数据源接入后均可使用数据清洗、预览、分析等全套功能
A: 在侧栏 ⚙ 中填写 API Key 并保存。
A: 这里以Deepseek为例,步骤如下:
A: 生成的图表储存在本地内容*\outputs\charts目录下
A: 请使用下面格式连接 mysql+pymysql://用户名:密码@主机:端口/数据库名
- 报错写法:mysql://user:pass@host:3306/dbname
- 正确写法:mysql+pymysql://user:pass@host:3306/dbname
一个好的开源项目,从来不是一个人的独角戏。
我们正在打造一个能真正应对复杂业务场景的数据工具——它需要在海量数据中极速穿梭,在多表逻辑间游刃有余,在可视化看板上洞察先机。
而现在,我们遇到了几个极富挑战、也极能体现技术价值的问题。如果你热爱解决“硬核”问题,这里正需要你:
- 多 Sheets 场景下的表间逻辑判断优化 —— 如何智能梳理几十张表之间的依赖与计算?
- 可视化看板的交互与性能优化 —— 让数据故事讲得更流畅、更直观、更震撼。
- 特殊业务场景下的模型能力提升 —— 那些通用工具搞不定的边缘业务,正是我们的战场。
- 远程服务器调用 —— 搭建远程GPU调用框架。
- 你将直面真实、有深度、非玩具级的技术挑战
- 你的代码会直接影响一线业务用户的工作效率
- 自由贡献,灵活协作——提 PR 或直接沟通,完全由你
- 优秀 Contributor 将有机会成为项目 Committer
- 直接 Pull Request,我们会在 24 小时内 review
- 或联系邮箱:
[email protected](请备注“Contributor+擅长方向”)
Apache License 2.0
让商业分析像聊天一样简单。













