deepseek-coder-7b-base-v1.5:Deepseek-Coder-7B-Base-v1.5，基于Deepseek-LLM 7B的深度优化模型，2T token训练成就更精准的语言理解与生成能力。适用于各类文本任务，轻松打造聊天机器人、智能写作助手。开源共享，助力AI创新。

DeepSeek 编码器

[🏠 主页] | [🤖 与 DeepSeek 编码器聊天] | [Discord] | [微信]

1. DeepSeek-Coder-7B-Base-v1.5 简介

DeepSeek-Coder-7B-Base-v1.5 是在 Deepseek-LLM 7B 的基础上，使用 2T 记号通过 4K 窗口大小和下一个记号预测目标继续预训练而成。

主页： DeepSeek
仓库： deepseek-ai/deepseek-coder
与 DeepSeek 编码器聊天： DeepSeek-Coder

2. 评估结果

3. 使用方法

以下为如何使用我们模型的示例。

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-coder-7b-base-v1.5", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/deepseek-coder-7b-base-v1.5", trust_remote_code=True).cuda()
input_text = "#write a quick sort algorithm"
inputs = tokenizer(input_text, return_tensors="pt").cuda()
outputs = model.generate(**inputs, max_length=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

4. 许可

本代码库遵循 MIT 许可证。DeepSeek Coder 模型的使用需遵守模型许可。DeepSeek Coder 允许商业用途。

更多详情请参阅 LICENSE-MODEL。

5. 联系方式

如果您有任何问题，请提出一个 issue 或通过 service@deepseek.com 与我们联系。