xujiashuai/ursa-0.6b-fsq320
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

BAAI/URSA-0.6B-FSQ320 - 昇腾NPU适配

模型信息

  • 模型:BAAI/URSA-0.6B-FSQ320
  • 类型:文本转视频(扩散模型)
  • 架构:基于Qwen2的Transformer(0.6B参数)
  • 硬件:昇腾910B4 NPU
  • 分辨率:512x320

精度

指标数值
余弦相似度1.000143
最大绝对误差0.000124
状态通过

性能

指标数值
平均延迟30.45 ms
测试次数10

推理输出

Model: BAAI/URSA-0.6B-FSQ320 (transformer)
Device: npu:0
Dtype: float32
------------------------------------------------------------
Loaded 142/311 weights from transformer
Parameters: 794,127,360

--- CPU Inference ---
Output shape: [1, 16, 215669]
Logits[:5]: [2.6239, 2.1649, 6.9669, 1.5164, -6.7225]
Has NaN: False

--- NPU Inference (npu:0) ---
Output shape: [1, 16, 215669]
Logits[:5]: [2.6239, 2.1648, 6.9669, 1.5165, -6.7225]
Has NaN: False

--- Comparison ---
Cosine Similarity: 1.000143
Max Abs Error: 0.000124

--- Latency ---
Avg latency: 30.45 ms (10 runs)

Status: SUCCESS

注意事项

  • Transformer 组件已加载为 Qwen2ForCausalLM(142/311 权重匹配)
  • 完整流水线需要 diffnext 包(BAAI/URSA 仓库)
  • VAE 和调度器组件未经测试(需要 diffnext)

使用方法

/usr/local/python3.11.14/bin/python3 inference.py --model-dir ./models/BAAI/URSA-0.6B-FSQ320 --device npu:0