讨论列表 - DeepSeek-V4-Flash-A2:可在昇腾A2算力上部署DeepSeek-V4-Flash模型,实现1M上下文能力。项目提供单机、双机及多P1D分离部署方案,采用W8A8量化权重,支持非思考与思考模式,优化长上下文计算与显存需求。【此简介由AI生成】 - AtomGit AI社区