weixin_72661020/newwork
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

newwork — NPU 模型批量适配工作流

ModelScope → GitCode 批量迁移,支持昇腾 NPU(Ascend 910B)适配。

文件结构

newwork/
├── batch_adapter.py        # 核心适配脚本(下载→验证→发布)
├── batch_loop.py           # 批次循环脚本(读xlsx→分类→批量适配)
├── WORKFLOW.md             # V6 工作流提示词
├── loop_progress.json.example  # 进度文件模板
├── install.sh              # 一键安装脚本
├── README.md
└── skills/                 # Claude Code 技能(SKILL.md)
    ├── text-understanding-npu/
    ├── text-gen-npu/
    ├── audio-npu/
    ├── multi-modal-npu/
    ├── img-classify-npu/
    └── gitcode-publish/

前置条件

  • Python 3.10+
  • 昇腾 NPU 环境(torch + torch_npu)
  • pip install transformers torch modelscope sentence-transformers openpyxl
  • GitCode token 保存在 ~/.atomgit/config.json

安装

# 1. 克隆仓库
git clone https://gitcode.com/weixin_72661020/newwork ~/newwork

# 2. 运行安装脚本
bash ~/newwork/install.sh

# 3. 把 xlsx 文件放到 /tmp/modelscope_all_subcategories.xlsx
# 4. 修改 loop_progress.json 中的 xlsx_path(如需)

安装脚本会自动:

  • 复制 batch_adapter.py 和 batch_loop.py 到 ~/
  • 复制技能文件到 .claude/skills/
  • 初始化 loop_progress.json

使用

手动运行一批

python3 ~/batch_loop.py

自动循环(/loop 模式)

在 Claude Code 中输入:

/loop

然后输入:

检查 ~/loop_progress.json,如果有剩余模型就跑 python3 ~/batch_loop.py,跑完继续下一批直到全部完成

配置

编辑 ~/loop_progress.json:

{
  "next_row": 0,
  "batch_size": 30,
  "total_rows": 3225,
  "xlsx_path": "/tmp/modelscope_all_subcategories.xlsx",
  "is_running": false,
  "batches_completed": 0
}

路由规则

xlsx 子分类路由到
文本分类、情感分析、NER、句子相似度、特征抽取、嵌入等text-understanding-npu
文本生成、聊天机器人、翻译、摘要等text-gen-npu
语音识别、语音合成、音频分类等audio-npu
视觉多模态、VQA、文生图、图生图等multi-modal-npu
图片分类、图像分类img-classify-npu

精度标准

  • 分类任务:Top-1 100%,max logits 相对误差 < 1%
  • 嵌入模型:cosine similarity > 0.9999
  • 通过 publish 6 个文件:README.md + inference.py + eval/run_accuracy.py + eval/run_performance.py + eval/accuracy.json + eval/performance.json