tencent_hunyuan/HY-MT1.5-1.8B
模型介绍文件和版本Pull Requests讨论分析
下载使用量0


🤗 Hugging Face  |   🕹️ Demo     🤖 ModelScope  |  

🖥️ Official Website  |   Github

模型介绍

混元翻译模型1.5版本包含1.8B翻译模型HY-MT1.5-1.8B和7B翻译模型HY-MT1.5-7B。两款模型均专注于支持33种语言的互译,并涵盖5种民族语言及方言变体。其中,HY-MT1.5-7B是我们WMT25冠军模型的升级版,针对阐释性翻译和混合语言场景进行了优化,新增支持术语干预、语境翻译和格式翻译功能。HY-MT1.5-1.8B的参数量虽不足HY-MT1.5-7B的三分之一,却能达到与其相近的翻译性能,实现了高速与高质量的平衡。经过量化处理后,1.8B模型可部署于边缘设备,支持实时翻译场景,适用性广泛。

核心特性与优势

  • HY-MT1.5-1.8B在同规模模型中实现了行业领先性能,超越多数商业翻译API。
  • HY-MT1.5-1.8B支持边缘设备部署及实时翻译场景,适用性广泛。
  • 与9月开源版本相比,HY-MT1.5-7B针对标注场景和混合语言场景进行了优化。
  • 两款模型均支持术语干预、语境翻译和格式翻译功能。

相关动态

  • 2025年12月30日,我们在Hugging Face开源了HY-MT1.5-1.8B和HY-MT1.5-7B。
  • 2025年9月1日,我们在Hugging Face开源了Hunyuan-MT-7B、Hunyuan-MT-Chimera-7B。

性能表现

更多实验结果与分析可参考我们的技术报告。

技术报告

 

模型链接

模型名称说明下载
HY-MT1.5-1.8B混元1.8B翻译模型🤗 模型
HY-MT1.5-1.8B-FP8混元1.8B翻译模型,fp8量化版本🤗 模型
HY-MT1.5-1.8B-GPTQ-Int4混元1.8B翻译模型,int4量化版本🤗 模型
HY-MT1.5-7B混元7B翻译模型🤗 模型
HY-MT1.5-7B-FP8混元7B翻译模型,fp8量化版本🤗 模型
HY-MT1.5-7B-GPTQ-Int4混元7B翻译模型,int4量化版本🤗 模型

提示词

中<=>外翻译提示词模板


将以下文本翻译为{target_language},注意只需要输出翻译后的结果,不要额外解释:

{source_text}

XX<=>XX翻译的提示词模板(不含ZH<=>XX)


Translate the following segment into {target_language}, without additional explanation.

{source_text}

术语干预提示词模板


参考下面的翻译:
{source_term} 翻译成 {target_term}

将以下文本翻译为{target_language},注意只需要输出翻译后的结果,不要额外解释:
{source_text}

上下文翻译提示词模板


{context}
参考上面的信息,把下面的文本翻译成{target_language},注意不需要翻译上文,也不要额外解释:
{source_text}

格式化翻译提示词模板


将以下<source></source>之间的文本翻译为中文,注意只需要输出翻译后的结果,不要额外解释,原文中的<sn></sn>标签表示标签内文本包含格式信息,需要在译文中相应的位置尽量保留该标签。输出格式为:<target>str</target>

<source>{src_text_with_format}</source>

 

与 transformers 结合使用

首先,请安装 transformers,推荐使用 v4.56.0 版本。

pip install transformers==4.56.0

!!! 若要使用 transformers 加载 fp8 模型,需将 config.json 中的名称“ignored_layers”更改为“ignore”,并将 compressed-tensors 升级至 compressed-tensors-0.11.0 版本。

以下代码片段展示了如何使用 transformers 库加载和应用模型。

我们以 tencent/HY-MT1.5-1.8B 为例

from transformers import AutoModelForCausalLM, AutoTokenizer
import os

model_name_or_path = "tencent/HY-MT1.5-1.8B"

tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, device_map="auto")  # You may want to use bfloat16 and/or move to GPU here
messages = [
    {"role": "user", "content": "Translate the following segment into Chinese, without additional explanation.\n\nIt’s on the house."},
]
tokenized_chat = tokenizer.apply_chat_template(
    messages,
    tokenize=True,
    add_generation_prompt=False,
    return_tensors="pt"
)

outputs = model.generate(tokenized_chat.to(model.device), max_new_tokens=2048)
output_text = tokenizer.decode(outputs[0])

我们建议在推理时使用以下参数集。请注意,我们的模型没有默认的 system_prompt。

{
  "top_k": 20,
  "top_p": 0.6,
  "repetition_penalty": 1.05,
  "temperature": 0.7
}

支持语言:

语言缩写中文名称
Chinesezh中文
Englishen英语
Frenchfr法语
Portuguesept葡萄牙语
Spanishes西班牙语
Japaneseja日语
Turkishtr土耳其语
Russianru俄语
Arabicar阿拉伯语
Koreanko韩语
Thaith泰语
Italianit意大利语
Germande德语
Vietnamesevi越南语
Malayms马来语
Indonesianid印尼语
Filipinotl菲律宾语
Hindihi印地语
Traditional Chinesezh-Hant繁体中文
Polishpl波兰语
Czechcs捷克语
Dutchnl荷兰语
Khmerkm高棉语
Burmesemy缅甸语
Persianfa波斯语
Gujaratigu古吉拉特语
Urduur乌尔都语
Telugute泰卢固语
Marathimr马拉地语
Hebrewhe希伯来语
Bengalibn孟加拉语
Tamilta泰米尔语
Ukrainianuk乌克兰语
Tibetanbo藏语
Kazakhkk哈萨克语
Mongolianmn蒙古语
Uyghurug维吾尔语
Cantoneseyue粤语

引用 HY-MT1.5:

@misc{hy-mt1.5,
      title={HY-MT1.5 Technical Report}, 
      author={Mao Zheng and Zheng Li and Tao Chen and Mingyang Song and Di Wang},
      year={2025},
      eprint={2512.24092},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2512.24092}, 
}