HuggingFace镜像/ESFT-vanilla-lite
模型介绍文件和版本分析

本文所使用的香草模型,即我们在《Expert-Specialized Fine-Tuning(ESFT)》研究论文中所述的模型:https://arxiv.org/abs/2407.01906。

若要使用此模型及专门的专家集,请参考位于 https://github.com/deepseek-ai/ESFT 的脚本。

关于本文中使用的定制模型,请访问 https://huggingface.co/deepseek-ai/ESFT-{gate, token}-{task_name}-lite。

下载使用量0