2502_90723166
/
Qwen3-Next-80B-A3B-Instruct
like
0
添加到合集
文本生成
Transformers
Safetensors
Apache License 2.0
conversational
model-agent-tagged
eval-results
deploy:azure
endpoints_compatible
license:apache-2.0
qwen3_next
region:us
arxiv:4 papers
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
已开启
0
已关闭
0
已合并
0
全部
0
创建者
合并人
排序
暂无数据
合并请求 - Qwen3-Next-80B-A3B-Instruct:用户可用于高效处理超长篇文本、实现智能对话及代码生成等任务。该项目采用混合注意力机制和高稀疏混合专家架构,支持256K原生上下文长度,兼顾性能与推理速度。【此简介由AI生成】 - AtomGit AI社区