HuggingFace镜像/Ising-Calibration-1-35B-A3B
模型介绍文件和版本分析
下载使用量0

NVIDIA-Ising-Calibration-1-35B-A3B

Build API Paper Benchmark Dataset GitHub
Homepage License

模型摘要

总参数数量约350亿,每token 30亿激活参数(MoE稀疏激活)
架构混合专家视觉语言模型(MoE VLM)
基础模型Qwen3.5-35B-A3B(256个专家,每token激活8个)
上下文长度262,144 tokens
精度BF16
输入图像(PNG、JPEG)+ 文本
输出文本(技术分析、结论、参数提取)
训练两阶段顺序监督微调(72.5K条目)
最低GPU要求2× NVIDIA L40S(48GB)或1× H100(80GB)
发布日期2026年4月14日
许可证NVIDIA开放模型许可证,Qwen3.5-35B-A3B:Apache许可证2.0版

描述

NVIDIA-Ising-Calibration-1 可分析量子计算校准实验图表,并针对六个分析问题类别生成结构化技术文本。NVIDIA-Ising-Calibration-1 由 NVIDIA 开发,是一款基于 Qwen3.5-35B-A3B 构建的量子校准视觉语言模型。该模型已准备好用于商业/非商业用途。

管理条款

Ising-Calibration-1-35B-A3B 模型受 NVIDIA 开放模型许可协议 约束。
补充信息:Qwen3.5-35B-A3B 遵循 Apache License, Version 2.0。

部署地域:全球

快速开始

本模型是 Qwen3.5-35B-A3B 的微调衍生模型。请遵循 Qwen3.5-35B-A3B 服务指南 使用 vLLM 进行部署,将模型路径替换为 nvidia/NVIDIA-Ising-Calibration-1-35B-A3B。建议的推理设置:temperature=0.2,max_tokens=16384。

用例

量子计算研究人员、校准工程师和开发人员可使用此模型分析实验图表图像,并生成技术描述、实验结论、显著性评估、拟合质量评价、参数提取以及实验成功分类。在根据实验结论采取行动之前,模型输出应由领域专家进行验证。

发布日期

2026 年 4 月 14 日通过 Hugging Face 发布,链接:https://huggingface.co/nvidia/NVIDIA-Ising-Calibration-1-35B-A3B

参考文献

  • Qwen3.5
  • QCalEval 基准

基准测试

问题类型Ising Cal 1Qwen3.5-35B base
Q1 技术描述87.886.8
Q2 实验结论67.139.9
Q3 实验显著性64.745.7
Q4 拟合质量评估90.552.7
Q5 参数提取62.557.8
Q6 实验成功性75.350.6
总体74.755.5

在 QCalEval 基准 上进行评估:涵盖 22 个实验系列的 87 种场景类型,共 243 个条目,涉及超导量子比特和中性原子。分数为 GPT-5.4 和 Gemini-3.1-Pro 评判结果的平均值。

模型架构

架构类型: 混合专家视觉语言模型(MoE VLM)

网络架构: 集成视觉编码器用于处理实验图表图像,结合 Qwen3.5-35B-A3B MoE 语言模型进行自回归文本生成。

本模型基于以下开发: Qwen3.5-35B-A3B

模型参数数量: 总参数约 350 亿,每 token 活跃参数约 30 亿(256 个专家,8 个活跃)

训练方法

阶段 1 — ICL 格式的 SFT

  • 23.8K 条上下文学习格式数据
  • 教授模型处理多图像演示
  • 学习率:1e-5,1 个 epoch

阶段 2 — 零样本 SFT

  • 48.7K 条零样本数据,通过 Qwen3.5-397B-A17B 进行 LLM 增强
  • 强化对所有问题类型的单图表理解能力
  • 学习率:5e-6,1 个 epoch

总训练数据: 72.5K 条数据

输入

输入类型: 图像、文本

输入格式:

  • 图像:PNG、JPEG
  • 文本:字符串

输入参数:

  • 图像:二维(2D)
  • 文本:一维(1D)

与输入相关的其他属性: 通过 OpenAI 兼容 API 提供的单图像或多图像量子校准实验图表及文本提示。建议推理设置:temperature=0.2 和 max_tokens=16384。上下文长度:262,144 个 token。

输出

输出类型: 文本

输出格式:

  • 文本:字符串

输出参数:

  • 文本:一维(1D)

与输出相关的其他属性: 自然语言技术分析、实验结论、显著性评估、拟合质量评价、参数提取以及实验成功分类。

我们的 AI 模型设计和/或优化为在 NVIDIA GPU 加速系统上运行。通过利用 NVIDIA 硬件和软件框架,该模型比纯 CPU 解决方案实现了更快的推理时间。

软件集成

运行时引擎:

  • vLLM 搭配 FlashAttention,BF16 服务精度

支持的硬件微架构兼容性:

  • NVIDIA Blackwell(sm100,B200/B300/GB200)
  • NVIDIA Hopper(sm90,H100/H200/GH200)

支持的操作系统:

  • Linux(Ubuntu 22.04+)

将基础模型和微调模型集成到 AI 系统中,需要使用特定用例数据进行额外测试,以确保安全有效的部署。遵循 V 模型方法,在单元和系统层面进行迭代测试和验证,对于在部署前降低风险至关重要。

模型版本

v1.0.0

训练与评估数据集

训练

数据模态

  • 图像
  • 文本

训练数据规模

共72.5K条数据(第一阶段:23.8K条ICL格式数据;第二阶段:48.7K条零样本数据)。

按数据集划分的数据收集方法

  • 合成(通过Qwen3.5-397B-A17B进行LLM增强)

按数据集划分的标注方法

  • 合成

特性:合成生成的量子校准实验图表及配对的分析文本。

评估数据集

基准分数:QCalEval基准零样本分数。

描述:QCalEval是一个用于量子校准图表的VLM基准:包含来自22个实验系列的87种场景类型的243条数据,涵盖超导量子比特和中性原子。它评估六种问题类型:技术描述(Q1)、实验结论(Q2)、实验意义(Q3)、拟合质量评估(Q4)、参数提取(Q5)和实验成功分类(Q6)。

按数据集划分的数据收集方法:

  • 合成

按数据集划分的标注方法:

  • 合成

特性:精选的量子校准实验,带有源自模拟参数的真实标签。

推理

加速引擎:采用FlashAttention的vLLM,BF16精度
测试硬件:

  • 2x NVIDIA L40S(48GB)

伦理考量

NVIDIA认为可信AI是一项共同责任,开发人员在部署前应确保此模型满足其用例要求,并解决可预见的滥用问题。

有关此模型伦理考量的更多详细信息,请参见模型卡片++的偏见、可解释性、安全与安保和隐私子卡片。

请在此链接报告模型质量、风险、安全漏洞或NVIDIA AI相关问题。

引用

@misc{cao2026qcaleval,
  title  = {QCalEval: Benchmarking Vision-Language Models for Quantum Calibration Plot Understanding},
  author = {Cao, Shuxiang and Zhang, Zijian and others},
  year   = {2026},
  url    = {https://research.nvidia.com/publication/2026-04_qcaleval-benchmarking-vision-language-models-quantum-calibration-plot},
}