DeepSeek-R1-Distill-Qwen-1.5B:可用于数学、代码及推理任务,提升小模型性能。基于DeepSeek-R1生成的数据蒸馏而来,继承强大推理模式,在MATH-500等 benchmarks表现优异,支持vLLM和SGLang部署。【此简介由AI生成】 - AtomGit AI社区