此代码生成模型是在一个通用的多语言代码生成模型基础上,针对 Python 代码进行微调得到的。随后,借助 Yurt 内部技术,该模型在不损失性能的前提下被压缩至 30% 稀疏度。在本模型中,网络的类表示形式仍然是密集的。该特定模型拥有 3.5 亿个可训练参数。
本模型的训练数据来源于 BigQuery 开源 Github 数据集 中的部分 Python 数据。
该模型擅长根据部分生成的函数签名和类签名进行自动补全。它在基于带有注释的自然语言提示生成代码方面也表现不俗。如果您发现了该模型的有趣用法,欢迎与我们分享!
查看我们的 colab 笔记本,了解如何调用模型并进行试用。
有任何问题或反馈吗?请通过 Discord 与我们联系。