全部技能
数据分析报告 Agent
接收 Excel/CSV → 自动清洗 → 多维交叉分析 → 生成结论+图表描述+PPT 大纲
适用:Claude CodeCursorCopilot
💡 使用提示:把 Excel/CSV 拖到项目目录,告诉 Agent 文件名和分析目标,它会自动完成剩下的事。数据量超过 10 万行时 Agent 会提示采样分析——全量分析的边际收益通常很低,但耗时增长是非线性的。
name: data-report
description: 自动清洗并分析 Excel/CSV 数据,生成结论先行的分析报告。当用户说「分析数据」「数据报告」时激活。
allowed-tools: Read, Write, Bash(python:*)
数据分析报告 Agent
输入要求
- 一个或多个 Excel/CSV 文件(放在项目目录中)
- 用户描述的分析目标(如「分析 Q2 各渠道转化率」「找出销售额下降的原因」)
- 可选:对比周期、维度偏好、特殊关注指标
工作流程(5 步)
Step 1:数据质量诊断
Agent 自动运行以下检查并输出诊断报告:
| 检查项 | 方法 | 输出 |
|---|---|---|
| 缺失值 | 每列缺失率统计 | >15% 的列标记为「需人工确认」 |
| 异常值 | IQR 方法(Q1-1.5×IQR, Q3+1.5×IQR) | 列出异常行+值 |
| 重复行 | 全字段精确匹配 | 计数+去重建议 |
| 格式问题 | 日期/货币/百分比 格式检测 | 不一致的统一为 ISO 标准 |
| 数据量 | 行数/列数/内存占用 | >10 万行提示采样分析 |
Step 2:分析框架选择
根据用户的分析目标,Agent 自动匹配最适合的框架:
| 目标类型 | 适用框架 | 核心问题 |
|---|---|---|
| 趋势分析 | 同比环比 | 「比上个月/去年同期好了还是差了?」 |
| 归因分析 | 杜邦分解 | 「哪个因素贡献/拖累了总指标?」 |
| 结构分析 | 帕累托/二八 | 「80% 的结果来自哪 20% 的原因?」 |
| 对比分析 | 分层因子 | 「不同维度(渠道/地区/客群)差异多大?」 |
| 相关性 | 关联矩阵 | 「哪些指标在同步变化?」 |
| 预测 | 移动平均+趋势线 | 「按目前趋势,下个周期会是什么样?」 |
Step 3:多维交叉分析
Agent 自动执行以下交叉分析:
- 时间维度:日/周/月 趋势,识别周期性规律
- 类别维度:按产品/渠道/地区/客群分拆核心指标
- 漏斗维度:如果有转化数据,自动构建漏斗并识别瓶颈
- 对比维度:与目标值/去年同期/行业基准对比
Step 4:结论生成(金字塔原理——结论先行)
每个发现按以下结构呈现:
### 发现 1:[一句话结论]
- **数据支撑**:[关键数字+来源]
- **与预期/历史对比**:[高了/低了 XX%]
- **可能原因**:[按可能性排序,标注确定性]
- **业务建议**:[具体可执行的行动]
Step 5:报告输出
# [分析主题] — 数据分析报告
**数据范围**:YYYY/MM/DD - YYYY/MM/DD | **分析日期**:YYYY/MM/DD
## 执行摘要(30 秒读完版)
- 最重要的 3 个发现
- 建议的 2 个行动
## 一、核心指标总览
| 指标 | 本期值 | 环比 | 同比 | 目标达成率 | 信号 |
|------|--------|------|------|-----------|------|
## 二、关键发现(每个发现按金字塔结构展开)
## 三、数据质量问题说明(如有)
## 四、附录:分析框架说明 & 数据来源
---
## PPT 大纲
1. 封面页:[标题]
2. 执行摘要页:3 发现 + 2 行动
3. 核心指标仪表盘页:一张表看懂全局
4-6. 关键发现详情页(每页一个发现 + 一张图表描述 + 一句核心洞察)
7. 行动建议页:优先级矩阵
8. 下一步页:需要谁来做什么决策
质量门禁
- 每个结论是否有明确的数据支撑?(不允许出现「可能」「似乎」「大概」后面没有数字)
- 是否区分了「相关性」和「因果性」?(「A 和 B 同涨同跌」→「A 导致 B」中间隔着鸿沟)
- 异常数据是否在报告中得到了解释而非忽略?
- PPT 大纲中的每一页是否有一句核心洞察(不只是图表标题)?