HuggingFace镜像/CoPaw-Flash-9B-DataAnalyst-LoRA
模型介绍文件和版本分析
下载使用量0

CoPaw-Flash-9B-DataAnalyst-LoRA

演示视频 展示案例 框架 vLLM

具备自主探索、分析和可视化数据集能力的智能数据分析代理。

数据分析演示

功能介绍

该模型可作为自主数据分析代理,具备以下能力:

  • 📂 加载和探索数据集(CSV、Excel、JSON格式)
  • 🔍 执行统计分析和数据概要分析
  • 📊 创建数据可视化(matplotlib、seaborn、plotly)
  • 🐍 编写并执行Python分析脚本
  • 📝 生成总结报告和分析见解
  • 🔄 迭代执行多步骤分析工作流
  • 🎯 90%的任务可自主完成(无需人工干预)

模型详情

属性值
基础模型agentscope-ai/CoPaw-Flash-9B(Qwen3.5-9B架构)
任务类型数据分析代理
LoRA 秩64
LoRA Alpha128
精度bfloat16
PEFT 版本0.18.1

性能基准测试

基于 Data Analyst 框架,在29个真实Kaggle数据集上进行测试(max_turns=50,上下文长度=128K):

指标Qwen3.5-9B 基础模型DataAnalyst-LoRA提升幅度
平均迭代次数1.226.021.7倍
生成Python文件数0100+∞
生成图表数0290+∞
总tokens消耗~5K18.5M3700倍
自然完成率*0%89.7%+89.7个百分点
达到回合限制不适用10.3%-
可用输出0/29(0%)26/29(90%)+90个百分点
用户干预需求每步均需完全自主自主化

*自然完成 = 模型在50个回合内自主输出最终总结报告

性能基准测试:基础模型 vs DataAnalyst-LoRA

关键发现

基础模型(Qwen3.5-9B):

  • ❌ 能够理解工具调用格式,但无法自主执行
  • ❌ 在1-2轮迭代后停止运行
  • ❌ 需要用户持续输入“继续”提示
  • ❌ 无法生成任何分析结果
  • ❌ 不适用于实际数据分析任务

CoPaw-Flash-9B-DataAnalyst-LoRA:

  • ✅ 完全自主执行(平均26轮迭代)
  • ✅ 生成完整的分析流程
  • ✅ 创建可视化图表和报告
  • ✅ 在真实世界数据集上达到90%的成功率
  • ✅ 可直接用于数据分析工作流的生产环境

结论: LoRA训练是必需的,而非可选。尽管基础模型能够理解工具调用格式,但其缺乏自主数据分析能力。此LoRA将基础模型转变为可独立处理真实世界数据集的生产级AI数据分析师。

快速开始

步骤1:使用vLLM部署

export HF_TOKEN=your_huggingface_token

CUDA_VISIBLE_DEVICES=0,1 vllm serve agentscope-ai/QwenPaw-Flash-9B \
  --enable-lora \
  --lora-modules agent-lora=jason1966/CoPaw-Flash-9B-DataAnalyst-LoRA \
  --max-lora-rank 64 \
  --tensor-parallel-size 2 \
  --gpu-memory-utilization 0.85 \
  --max-model-len 131072 \
  --gdn-prefill-backend triton \
  --trust-remote-code \
  --reasoning-parser qwen3 \
  --enable-auto-tool-choice \
  --tool-call-parser qwen3_xml \
  --port 8000

步骤 2:设置数据分析框架

git clone https://github.com/IIIIQIIII/data-analyst.git
cd data-analyst
bun install

配置 .env:

CLAUDE_CODE_USE_OPENAI=1
OPENAI_BASE_URL=http://localhost:8000/v1
OPENAI_API_KEY=unused
OPENAI_MODEL=agent-lora

步骤 3:开始分析

bun run start

然后输入您的分析任务:

Analyze sales_2024.csv and identify trends

该模型将自动加载数据、执行分析、创建可视化并生成报告——全程无需手动输入“继续”提示。

vLLM 参数

参数描述
--enable-lora启用 LoRA 适配器支持
--lora-modules agent-lora=...加载 DataAnalyst-LoRA 适配器
--max-lora-rank 64LoRA 秩(必须与适配器匹配)
--reasoning-parser qwen3启用推理过程可见性
--enable-auto-tool-choice自动工具选择
--tool-call-parser qwen3_xml解析 XML 格式工具调用
--gdn-prefill-backend triton使用 Triton 优化预填充

硬件要求

配置所需显存
双 GPU(bf16,TP=2)每块 GPU ~11GB
单 GPU(bf16)~22GB
8 位量化~12GB
4 位量化~6GB

已测试环境: 2x NVIDIA H200,vLLM 0.19.1,CUDA 13.0,Python 3.12

故障排除

问题解决方案
FlashInfer 错误添加 --gdn-prefill-backend triton
内存不足降低 --max-model-len 或 --gpu-memory-utilization
连接被拒绝检查 netstat -tlnp | grep 8000

致谢

  • CoPaw-Flash-9B — AgentScope AI 提供的基础模型
  • Brev.dev — NVIDIA 提供的 GPU 云基础设施
  • LocoreMind — 研究与开发支持

许可证

Apache 2.0