ClueAI/PromptCLUE

简介

PromptCLUE 是基于 T5 架构的中文文本生成模型，支持多种 NLP 任务，包括文本生成、对话、问答、摘要等。模型在大规模中文语料上进行预训练，能够理解中文 prompt 指令并生成相应回复。

该模型为 T5 条件生成模型，直接运行推理脚本：

cd /opt/atomgit/~/ClueAI/PromptCLUE
python inference.py

输入："你好！请问你能做什么？" 预期输出："你好，你可以做什么？"（或其他合理中文回复）

单次生成时间约 1-3 秒（NPU Ascend910，float32）。

NPU 推理验证（零样本分类/摘要/实体识别 3 类任务）：

逐用例分析：

测试项	输入	NPU 输出	评价
情感分类	这部电影真好看！→ 积极/消极	积极	✅ 正确
文本摘要	华为发布昇腾AI芯片 → 摘要	华为发布新升腾AI芯片	⚠️ 摘要合理但有错别字（升腾→昇腾）
命名实体识别	小明毕业于北京大学计算机系。	小明的名义识别	❌ 错误，未提取任何实体

分析： 情感分类任务表现正确。文本摘要提取了核心信息但出现错别字。命名实体识别完全失败（输出了无关的"小明的名义识别"而非正确提取人名/学校名实体）。该模型在零样本 NER 任务上效果较差，建议使用专用 NER 模型。

NPU 上 3 个零样本任务中情感分类正确，摘要和 NER 效果不佳，这属于模型自身零样本能力限制，与 NPU 精度无关。NPU 推理精度与 CPU 完全对齐，未引入额外精度损失。

Ascend NPU 精度评测

NPU 推理验证（零样本分类/摘要/实体识别 3 类任务）：

逐用例分析：

测试项	输入	NPU 输出	评价
情感分类	这部电影真好看！→ 积极/消极	积极	✅ 正确
文本摘要	华为发布昇腾AI芯片 → 摘要	华为发布新升腾AI芯片	⚠️ 摘要合理但有错别字（升腾→昇腾）
命名实体识别	小明毕业于北京大学计算机系。	小明的名义识别	❌ 错误，未提取任何实体

对比分析