golfxiao/anti_fraud on Ascend NPU

1. 简介

本文档记录 golfxiao/anti_fraud (Qwen2-1.5B-Instruct) 在 Ascend NPU 环境的快速部署与验证结果。该模型为反欺诈分析专用模型，基于 Qwen2 架构，参数量 1.5B。

2. 验证环境

组件	版本
NPU	Ascend910 (64GB HBM)
vLLM	0.18.0+empty
vLLM-Ascend	0.18.0
PyTorch	2.9.0+cpu
transformers	4.46.2
Python	3.10+

NPU：2 逻辑卡 (Chip 0, Chip 1)
模型路径：/opt/atomgit/golfxiao/anti_fraud/model/golfxiao/anti_fraud
服务端口：8000

3. 服务启动

已验证通过的启动命令：

vllm serve /path/to/golfxiao/anti_fraud \
  --dtype bfloat16 \
  --port 8000 \
  --max-model-len 4096 \
  --gpu-memory-utilization 0.9 \
  --trust-remote-code

4. Smoke 验证

基础检查：

# 检查模型列表
curl -sf http://127.0.0.1:8000/v1/models

# 发送推理请求
curl -s http://127.0.0.1:8000/v1/chat/completions \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "/path/to/golfxiao/anti_fraud",
    "messages": [{"role": "user", "content": "请分析交易是否存在欺诈风险"}],
    "temperature": 0,
    "max_tokens": 64
  }'

验证结果：

/v1/models 返回 200
/v1/chat/completions 返回 200
模型可正常生成反欺诈分析结果

5. 性能参考

测试条件：单请求，max_tokens=64，连续10轮。

指标	数值
平均响应时间	0.860 s
总测试时长(10轮)	8.601 s
最快响应	0.796 s
最慢响应	0.907 s

6. 精度评测

使用 3 个反欺诈相关测试用例进行精度验证。

测试用例	结果
大额转账行为分析	输出合理分析，指出可疑交易特征
反欺诈措施列举	正确列出三种常见反欺诈措施
机器学习在反欺诈中的应用	全面列举ML在反欺诈中的多种应用

7. 注意事项

使用 ModelScope SDK 下载模型：pip install modelscope
模型为 bfloat16 精度，启动时需指定 --dtype bfloat16
建议设置 --max-model-len 4096 以控制显存占用
本模型为 1.5B 参数规模，单卡 Ascend910 可流畅运行

1. 简介

本文档记录 golfxiao/anti_fraud (Qwen2-1.5B-Instruct) 在 Ascend NPU 环境的快速部署与验证结果。该模型为反欺诈分析专用模型，基于 Qwen2 架构，参数量 1.5B。

相关获取地址：

权重下载地址（ModelScope）：https://modelscope.cn/models/golfxiao/anti_fraud

推理框架：vLLM 0.18.0 + Ascend

组件

版本

NPU

Ascend910 (64GB HBM)

vLLM

0.18.0+empty

vLLM-Ascend

0.18.0

PyTorch

2.9.0+cpu

transformers

4.46.2

Python

3.10+

4. Smoke 验证

基础检查：

# 检查模型列表
curl -sf http://127.0.0.1:8000/v1/models

# 发送推理请求
curl -s http://127.0.0.1:8000/v1/chat/completions \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "/path/to/golfxiao/anti_fraud",
    "messages": [{"role": "user", "content": "请分析交易是否存在欺诈风险"}],
    "temperature": 0,
    "max_tokens": 64
  }'

验证结果：

/v1/models 返回 200

/v1/chat/completions 返回 200

模型可正常生成反欺诈分析结果

指标

数值

平均响应时间

0.860 s

总测试时长(10轮)

8.601 s

最快响应

0.796 s

最慢响应

0.907 s

测试用例

结果

大额转账行为分析

输出合理分析，指出可疑交易特征

反欺诈措施列举

正确列出三种常见反欺诈措施

机器学习在反欺诈中的应用

全面列举ML在反欺诈中的多种应用