HuggingFace镜像/deberta-v3-base-injection
模型介绍文件和版本分析
下载使用量0

deberta-v3-base-injection

该模型是 microsoft/deberta-v3-base 在 [promp-injection] 数据集上的微调版本。 其在评估集上取得了以下结果:

  • 损失:0.0673
  • 准确率:0.9914

模型说明

本模型用于检测提示词注入尝试,并将其分类为“INJECTION”。合法请求则被分类为“LEGIT”。该数据集假设合法请求包括各类问题或关键词搜索。

预期用途与局限性

如果您使用此模型来保护系统安全,而模型过于“敏感”,将过多请求误判为注入,建议收集合法请求示例,并结合 [promp-injection] 数据集重新训练模型。

推理

import argparse
import torch
from openmind import pipeline, is_torch_npu_available

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--model_name_or_path",
        default=None,
        type=str,
        help="Path to model",
        required=False,
    )

    args = parser.parse_args()

    return args

if __name__=="__main__":

    args = parse_args()

    if is_torch_npu_available():
        device = "npu:0"
    else:
        device = "cpu"

    #推理
    classifier = pipeline('text-classification', model=args.model_name_or_path, device=device)
    
    print(classifier('The camera quality of this phone is amazing.'))

训练和评估数据

基于 [promp-injection] 数据集。

训练过程

训练超参数

训练过程中使用了以下超参数:

  • learning_rate: 2e-05
  • train_batch_size: 8
  • eval_batch_size: 8
  • seed: 42
  • optimizer: Adam,betas=(0.9,0.999),epsilon=1e-08
  • lr_scheduler_type: linear
  • num_epochs: 3

训练结果

训练损失轮次步数验证损失准确率
无日志1.0690.23530.9741
无日志2.01380.08940.9741
无日志3.02070.06730.9914

框架版本

  • Transformers 4.29.1
  • Pytorch 2.0.0+cu118
  • Datasets 2.12.0
  • Tokenizers 0.13.3

关于我们

deepset 是生产级开源 AI 框架 Haystack 的开发公司。

我们的其他部分成果:

  • [Distilled roberta-base-squad2 (aka "tinyroberta-squad2")]
  • German BERT、GermanQuAD and GermanDPR、[German embedding model]
  • deepset Cloud、deepset Studio

联系我们并加入 Haystack 社区

如需了解更多关于 Haystack 的信息,请访问我们的 GitHub 仓库和 文档。

我们还有一个 向所有人开放的 Discord 社区!

Twitter | LinkedIn | Discord | GitHub Discussions | Website | YouTube

顺便说一下:我们正在招聘!