HuggingFace镜像/Ising-Calibration-1-35B-A3B

Ising-Calibration-1-35B-A3B:量子计算研究人员和工程师可分析实验 plot 图像，生成技术描述、结论等结构化文本。该项目是基于 Qwen3.5-35B-A3B 的 MoE 视觉语言模型，支持多类型分析，需专家验证输出。【此简介由AI生成】 - AtomGit AI社区

NVIDIA-Ising-Calibration-1-35B-A3B

模型摘要


总参数数量	约350亿，每token 30亿激活参数（MoE稀疏激活）
架构	混合专家视觉语言模型（MoE VLM）
基础模型	Qwen3.5-35B-A3B（256个专家，每token激活8个）
上下文长度	262,144 tokens
精度	BF16
输入	图像（PNG、JPEG）+ 文本
输出	文本（技术分析、结论、参数提取）
训练	两阶段顺序监督微调（72.5K条目）
最低GPU要求	2× NVIDIA L40S（48GB）或1× H100（80GB）
发布日期	2026年4月14日
许可证	NVIDIA开放模型许可证，Qwen3.5-35B-A3B：Apache许可证2.0版

描述

NVIDIA-Ising-Calibration-1 可分析量子计算校准实验图表，并针对六个分析问题类别生成结构化技术文本。NVIDIA-Ising-Calibration-1 由 NVIDIA 开发，是一款基于 Qwen3.5-35B-A3B 构建的量子校准视觉语言模型。该模型已准备好用于商业/非商业用途。

管理条款

Ising-Calibration-1-35B-A3B 模型受 NVIDIA 开放模型许可协议约束。
补充信息：Qwen3.5-35B-A3B 遵循 Apache License, Version 2.0。

部署地域：全球

快速开始

本模型是 Qwen3.5-35B-A3B 的微调衍生模型。请遵循 Qwen3.5-35B-A3B 服务指南使用 vLLM 进行部署，将模型路径替换为 nvidia/NVIDIA-Ising-Calibration-1-35B-A3B。建议的推理设置：temperature=0.2，max_tokens=16384。

用例

量子计算研究人员、校准工程师和开发人员可使用此模型分析实验图表图像，并生成技术描述、实验结论、显著性评估、拟合质量评价、参数提取以及实验成功分类。在根据实验结论采取行动之前，模型输出应由领域专家进行验证。

发布日期

2026 年 4 月 14 日通过 Hugging Face 发布，链接：https://huggingface.co/nvidia/NVIDIA-Ising-Calibration-1-35B-A3B

参考文献

基准测试

问题类型	Ising Cal 1	Qwen3.5-35B base
Q1 技术描述	87.8	86.8
Q2 实验结论	67.1	39.9
Q3 实验显著性	64.7	45.7
Q4 拟合质量评估	90.5	52.7
Q5 参数提取	62.5	57.8
Q6 实验成功性	75.3	50.6
总体	74.7	55.5

在 QCalEval 基准上进行评估：涵盖 22 个实验系列的 87 种场景类型，共 243 个条目，涉及超导量子比特和中性原子。分数为 GPT-5.4 和 Gemini-3.1-Pro 评判结果的平均值。

模型架构

架构类型： 混合专家视觉语言模型（MoE VLM）

网络架构： 集成视觉编码器用于处理实验图表图像，结合 Qwen3.5-35B-A3B MoE 语言模型进行自回归文本生成。

本模型基于以下开发： Qwen3.5-35B-A3B

模型参数数量： 总参数约 350 亿，每 token 活跃参数约 30 亿（256 个专家，8 个活跃）

训练方法

阶段 1 — ICL 格式的 SFT

23.8K 条上下文学习格式数据
教授模型处理多图像演示
学习率：1e-5，1 个 epoch

阶段 2 — 零样本 SFT

48.7K 条零样本数据，通过 Qwen3.5-397B-A17B 进行 LLM 增强
强化对所有问题类型的单图表理解能力
学习率：5e-6，1 个 epoch

总训练数据： 72.5K 条数据

输入

输入类型： 图像、文本

输入格式：

图像：PNG、JPEG
文本：字符串

输入参数：

图像：二维（2D）
文本：一维（1D）

与输入相关的其他属性： 通过 OpenAI 兼容 API 提供的单图像或多图像量子校准实验图表及文本提示。建议推理设置：temperature=0.2 和 max_tokens=16384。上下文长度：262,144 个 token。

输出

输出类型： 文本

输出格式：

文本：字符串

输出参数：

文本：一维（1D）

与输出相关的其他属性： 自然语言技术分析、实验结论、显著性评估、拟合质量评价、参数提取以及实验成功分类。

我们的 AI 模型设计和/或优化为在 NVIDIA GPU 加速系统上运行。通过利用 NVIDIA 硬件和软件框架，该模型比纯 CPU 解决方案实现了更快的推理时间。

软件集成

运行时引擎：

vLLM 搭配 FlashAttention，BF16 服务精度

支持的硬件微架构兼容性：

NVIDIA Blackwell（sm100，B200/B300/GB200）
NVIDIA Hopper（sm90，H100/H200/GH200）

支持的操作系统：

Linux（Ubuntu 22.04+）

将基础模型和微调模型集成到 AI 系统中，需要使用特定用例数据进行额外测试，以确保安全有效的部署。遵循 V 模型方法，在单元和系统层面进行迭代测试和验证，对于在部署前降低风险至关重要。

模型版本

v1.0.0

训练与评估数据集

训练

数据模态

图像
文本

训练数据规模

共72.5K条数据（第一阶段：23.8K条ICL格式数据；第二阶段：48.7K条零样本数据）。

按数据集划分的数据收集方法

合成（通过Qwen3.5-397B-A17B进行LLM增强）

按数据集划分的标注方法

合成

特性：合成生成的量子校准实验图表及配对的分析文本。

评估数据集

基准分数：QCalEval基准零样本分数。

描述：QCalEval是一个用于量子校准图表的VLM基准：包含来自22个实验系列的87种场景类型的243条数据，涵盖超导量子比特和中性原子。它评估六种问题类型：技术描述（Q1）、实验结论（Q2）、实验意义（Q3）、拟合质量评估（Q4）、参数提取（Q5）和实验成功分类（Q6）。

按数据集划分的数据收集方法：

合成

按数据集划分的标注方法：

合成

特性：精选的量子校准实验，带有源自模拟参数的真实标签。

推理

加速引擎：采用FlashAttention的vLLM，BF16精度
测试硬件：

2x NVIDIA L40S（48GB）

伦理考量

NVIDIA认为可信AI是一项共同责任，开发人员在部署前应确保此模型满足其用例要求，并解决可预见的滥用问题。

有关此模型伦理考量的更多详细信息，请参见模型卡片++的偏见、可解释性、安全与安保和隐私子卡片。

请在此链接报告模型质量、风险、安全漏洞或NVIDIA AI相关问题。

引用

@misc{cao2026qcaleval,
  title  = {QCalEval: Benchmarking Vision-Language Models for Quantum Calibration Plot Understanding},
  author = {Cao, Shuxiang and Zhang, Zijian and others},
  year   = {2026},
  url    = {https://research.nvidia.com/publication/2026-04_qcaleval-benchmarking-vision-language-models-quantum-calibration-plot},
}