HuggingFace镜像/CoPaw-Flash-9B-DataAnalyst-LoRA

CoPaw-Flash-9B-DataAnalyst-LoRA

具备自主探索、分析和可视化数据集能力的智能数据分析代理。

数据分析演示

功能介绍

该模型可作为自主数据分析代理，具备以下能力：

📂 加载和探索数据集（CSV、Excel、JSON格式）
🔍 执行统计分析和数据概要分析
📊 创建数据可视化（matplotlib、seaborn、plotly）
🐍 编写并执行Python分析脚本
📝 生成总结报告和分析见解
🔄 迭代执行多步骤分析工作流
🎯 90%的任务可自主完成（无需人工干预）

模型详情

属性	值
基础模型	agentscope-ai/CoPaw-Flash-9B（Qwen3.5-9B架构）
任务类型	数据分析代理
LoRA 秩	64
LoRA Alpha	128
精度	bfloat16
PEFT 版本	0.18.1

性能基准测试

基于 Data Analyst 框架，在29个真实Kaggle数据集上进行测试（max_turns=50，上下文长度=128K）：

指标	Qwen3.5-9B 基础模型	DataAnalyst-LoRA	提升幅度
平均迭代次数	1.2	26.0	21.7倍
生成Python文件数	0	100+	∞
生成图表数	0	290+	∞
总tokens消耗	~5K	18.5M	3700倍
自然完成率*	0%	89.7%	+89.7个百分点
达到回合限制	不适用	10.3%	-
可用输出	0/29（0%）	26/29（90%）	+90个百分点
用户干预需求	每步均需	完全自主	自主化

*自然完成 = 模型在50个回合内自主输出最终总结报告

性能基准测试：基础模型 vs DataAnalyst-LoRA

关键发现

基础模型（Qwen3.5-9B）：

❌ 能够理解工具调用格式，但无法自主执行
❌ 在1-2轮迭代后停止运行
❌ 需要用户持续输入“继续”提示
❌ 无法生成任何分析结果
❌ 不适用于实际数据分析任务

CoPaw-Flash-9B-DataAnalyst-LoRA：

✅ 完全自主执行（平均26轮迭代）
✅ 生成完整的分析流程
✅ 创建可视化图表和报告
✅ 在真实世界数据集上达到90%的成功率
✅ 可直接用于数据分析工作流的生产环境

结论： LoRA训练是必需的，而非可选。尽管基础模型能够理解工具调用格式，但其缺乏自主数据分析能力。此LoRA将基础模型转变为可独立处理真实世界数据集的生产级AI数据分析师。

快速开始

步骤1：使用vLLM部署

export HF_TOKEN=your_huggingface_token

CUDA_VISIBLE_DEVICES=0,1 vllm serve agentscope-ai/QwenPaw-Flash-9B \
  --enable-lora \
  --lora-modules agent-lora=jason1966/CoPaw-Flash-9B-DataAnalyst-LoRA \
  --max-lora-rank 64 \
  --tensor-parallel-size 2 \
  --gpu-memory-utilization 0.85 \
  --max-model-len 131072 \
  --gdn-prefill-backend triton \
  --trust-remote-code \
  --reasoning-parser qwen3 \
  --enable-auto-tool-choice \
  --tool-call-parser qwen3_xml \
  --port 8000

步骤 2：设置数据分析框架

git clone https://github.com/IIIIQIIII/data-analyst.git
cd data-analyst
bun install

配置 .env：

CLAUDE_CODE_USE_OPENAI=1
OPENAI_BASE_URL=http://localhost:8000/v1
OPENAI_API_KEY=unused
OPENAI_MODEL=agent-lora

步骤 3：开始分析

bun run start

然后输入您的分析任务：

Analyze sales_2024.csv and identify trends

该模型将自动加载数据、执行分析、创建可视化并生成报告——全程无需手动输入“继续”提示。

vLLM 参数

参数	描述
`--enable-lora`	启用 LoRA 适配器支持
`--lora-modules agent-lora=...`	加载 DataAnalyst-LoRA 适配器
`--max-lora-rank 64`	LoRA 秩（必须与适配器匹配）
`--reasoning-parser qwen3`	启用推理过程可见性
`--enable-auto-tool-choice`	自动工具选择
`--tool-call-parser qwen3_xml`	解析 XML 格式工具调用
`--gdn-prefill-backend triton`	使用 Triton 优化预填充

硬件要求

配置	所需显存
双 GPU（bf16，TP=2）	每块 GPU ~11GB
单 GPU（bf16）	~22GB
8 位量化	~12GB
4 位量化	~6GB

已测试环境： 2x NVIDIA H200，vLLM 0.19.1，CUDA 13.0，Python 3.12

故障排除

问题	解决方案
FlashInfer 错误	添加 `--gdn-prefill-backend triton`
内存不足	降低 `--max-model-len` 或 `--gpu-memory-utilization`
连接被拒绝	检查 `netstat -tlnp \| grep 8000`

致谢

CoPaw-Flash-9B — AgentScope AI 提供的基础模型
Brev.dev — NVIDIA 提供的 GPU 云基础设施
LocoreMind — 研究与开发支持

许可证

Apache 2.0