MoonshotAI/Kimi-Dev-72B
模型介绍文件和版本Pull Requests讨论分析
下载使用量0
Kimi Logo

引入Kimi-Dev:
一款强大且开源的编码LLM,致力于问题解决

Kimi-Dev团队
📄 技术报告(即将到来...)  |  📄 GitHub  


我们介绍了Kimi-Dev-72B,这是我们新推出的开源编码LLM,用于软件工程任务。Kimi-Dev-72B在SWE-bench验证中,开源模型中取得了新的最佳成果。

  • Kimi-Dev-72B在SWE-bench验证中取得了60.4%的性能表现。它超越了亚军,并在开源模型中设立了一个新的最佳结果。

  • Kimi-Dev-72B通过大规模强化学习进行了优化。它自主地对Docker中的真实仓库进行修补,并且只有在整个测试套件通过时才能获得奖励。这确保了正确且健壮的解决方案,符合实际开发的行业标准。

  • Kimi-Dev-72B可在Hugging Face和GitHub上下载和部署。我们欢迎开发者和研究人员探索其功能并贡献于其开发。

Kimi Logo

开源模型在SWE-bench验证中的性能。

快速入门

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "moonshotai/Kimi-Dev-72B"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "Give me a short introduction to large language model."
messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

引用

@misc{kimi_dev_72b_2025,
  title        = {Introducing Kimi-Dev: A Strong and Open-source Coding LLM for Issue Resolution},
  author       = {{Kimi-Dev Team}},
  year         = {2025},
  month        = {June},
  url          = {\url{https://www.moonshot.cn/Kimi-Dev}}
}

当然,我会根据您的要求进行翻译。不过,您似乎忘记提供需要翻译的文本了。请您提供原文,我将会按照您的要求进行翻译。