HuggingFace镜像/deepseek-coder-7b-base-v1.5
模型介绍文件和版本分析
下载使用量0

DeepSeek 编码器

[🏠 主页] | [🤖 与 DeepSeek 编码器聊天] | [Discord] | [微信]


1. DeepSeek-Coder-7B-Base-v1.5 简介

DeepSeek-Coder-7B-Base-v1.5 是在 Deepseek-LLM 7B 的基础上,使用 2T 记号通过 4K 窗口大小和下一个记号预测目标继续预训练而成。

  • 主页: DeepSeek
  • 仓库: deepseek-ai/deepseek-coder
  • 与 DeepSeek 编码器聊天: DeepSeek-Coder

2. 评估结果

DeepSeek 编码器

3. 使用方法

以下为如何使用我们模型的示例。

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-coder-7b-base-v1.5", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/deepseek-coder-7b-base-v1.5", trust_remote_code=True).cuda()
input_text = "#write a quick sort algorithm"
inputs = tokenizer(input_text, return_tensors="pt").cuda()
outputs = model.generate(**inputs, max_length=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

4. 许可

本代码库遵循 MIT 许可证。DeepSeek Coder 模型的使用需遵守模型许可。DeepSeek Coder 允许商业用途。

更多详情请参阅 LICENSE-MODEL。

5. 联系方式

如果您有任何问题,请提出一个 issue 或通过 service@deepseek.com 与我们联系。