本文档记录 golfxiao/anti_fraud (Qwen2-1.5B-Instruct) 在 Ascend NPU 环境的快速部署与验证结果。该模型为反欺诈分析专用模型,基于 Qwen2 架构,参数量 1.5B。
相关获取地址:
| 组件 | 版本 |
|---|---|
| NPU | Ascend910 (64GB HBM) |
| vLLM | 0.18.0+empty |
| vLLM-Ascend | 0.18.0 |
| PyTorch | 2.9.0+cpu |
| transformers | 4.46.2 |
| Python | 3.10+ |
已验证通过的启动命令:
vllm serve /path/to/golfxiao/anti_fraud \
--dtype bfloat16 \
--port 8000 \
--max-model-len 4096 \
--gpu-memory-utilization 0.9 \
--trust-remote-code基础检查:
# 检查模型列表
curl -sf http://127.0.0.1:8000/v1/models
# 发送推理请求
curl -s http://127.0.0.1:8000/v1/chat/completions \
-H 'Content-Type: application/json' \
-d '{
"model": "/path/to/golfxiao/anti_fraud",
"messages": [{"role": "user", "content": "请分析交易是否存在欺诈风险"}],
"temperature": 0,
"max_tokens": 64
}'验证结果:
/v1/models 返回 200/v1/chat/completions 返回 200测试条件:单请求,max_tokens=64,连续10轮。
| 指标 | 数值 |
|---|---|
| 平均响应时间 | 0.860 s |
| 总测试时长(10轮) | 8.601 s |
| 最快响应 | 0.796 s |
| 最慢响应 | 0.907 s |
使用 3 个反欺诈相关测试用例进行精度验证。
| 测试用例 | 结果 |
|---|---|
| 大额转账行为分析 | 输出合理分析,指出可疑交易特征 |
| 反欺诈措施列举 | 正确列出三种常见反欺诈措施 |
| 机器学习在反欺诈中的应用 | 全面列举ML在反欺诈中的多种应用 |
pip install modelscope--dtype bfloat16--max-model-len 4096 以控制显存占用