具备自主探索、分析和可视化数据集能力的智能数据分析代理。
该模型可作为自主数据分析代理,具备以下能力:
| 属性 | 值 |
|---|---|
| 基础模型 | agentscope-ai/CoPaw-Flash-9B(Qwen3.5-9B架构) |
| 任务类型 | 数据分析代理 |
| LoRA 秩 | 64 |
| LoRA Alpha | 128 |
| 精度 | bfloat16 |
| PEFT 版本 | 0.18.1 |
基于 Data Analyst 框架,在29个真实Kaggle数据集上进行测试(max_turns=50,上下文长度=128K):
| 指标 | Qwen3.5-9B 基础模型 | DataAnalyst-LoRA | 提升幅度 |
|---|---|---|---|
| 平均迭代次数 | 1.2 | 26.0 | 21.7倍 |
| 生成Python文件数 | 0 | 100+ | ∞ |
| 生成图表数 | 0 | 290+ | ∞ |
| 总tokens消耗 | ~5K | 18.5M | 3700倍 |
| 自然完成率* | 0% | 89.7% | +89.7个百分点 |
| 达到回合限制 | 不适用 | 10.3% | - |
| 可用输出 | 0/29(0%) | 26/29(90%) | +90个百分点 |
| 用户干预需求 | 每步均需 | 完全自主 | 自主化 |
*自然完成 = 模型在50个回合内自主输出最终总结报告
基础模型(Qwen3.5-9B):
CoPaw-Flash-9B-DataAnalyst-LoRA:
结论: LoRA训练是必需的,而非可选。尽管基础模型能够理解工具调用格式,但其缺乏自主数据分析能力。此LoRA将基础模型转变为可独立处理真实世界数据集的生产级AI数据分析师。
export HF_TOKEN=your_huggingface_token
CUDA_VISIBLE_DEVICES=0,1 vllm serve agentscope-ai/QwenPaw-Flash-9B \
--enable-lora \
--lora-modules agent-lora=jason1966/CoPaw-Flash-9B-DataAnalyst-LoRA \
--max-lora-rank 64 \
--tensor-parallel-size 2 \
--gpu-memory-utilization 0.85 \
--max-model-len 131072 \
--gdn-prefill-backend triton \
--trust-remote-code \
--reasoning-parser qwen3 \
--enable-auto-tool-choice \
--tool-call-parser qwen3_xml \
--port 8000git clone https://github.com/IIIIQIIII/data-analyst.git
cd data-analyst
bun install配置 .env:
CLAUDE_CODE_USE_OPENAI=1
OPENAI_BASE_URL=http://localhost:8000/v1
OPENAI_API_KEY=unused
OPENAI_MODEL=agent-lorabun run start然后输入您的分析任务:
Analyze sales_2024.csv and identify trends该模型将自动加载数据、执行分析、创建可视化并生成报告——全程无需手动输入“继续”提示。
| 参数 | 描述 |
|---|---|
--enable-lora | 启用 LoRA 适配器支持 |
--lora-modules agent-lora=... | 加载 DataAnalyst-LoRA 适配器 |
--max-lora-rank 64 | LoRA 秩(必须与适配器匹配) |
--reasoning-parser qwen3 | 启用推理过程可见性 |
--enable-auto-tool-choice | 自动工具选择 |
--tool-call-parser qwen3_xml | 解析 XML 格式工具调用 |
--gdn-prefill-backend triton | 使用 Triton 优化预填充 |
| 配置 | 所需显存 |
|---|---|
| 双 GPU(bf16,TP=2) | 每块 GPU ~11GB |
| 单 GPU(bf16) | ~22GB |
| 8 位量化 | ~12GB |
| 4 位量化 | ~6GB |
已测试环境: 2x NVIDIA H200,vLLM 0.19.1,CUDA 13.0,Python 3.12
| 问题 | 解决方案 |
|---|---|
| FlashInfer 错误 | 添加 --gdn-prefill-backend triton |
| 内存不足 | 降低 --max-model-len 或 --gpu-memory-utilization |
| 连接被拒绝 | 检查 netstat -tlnp | grep 8000 |
Apache 2.0