HuggingFace镜像/videomae-small-finetuned-kinetics-xd-violence-binary
模型介绍文件和版本分析
下载使用量0

videomae-small-finetuned-kinetics-finetuned-xd-violence

该模型是 MCG-NJU/videomae-small-finetuned-kinetics 在一个未知数据集上的微调版本。 它在评估集上取得了以下结果:

  • 损失:0.3828
  • 准确率:0.8254

视频预处理配置: 调整大小为:(224, 224) 采样帧数:16 片段时长:2.1333333333333333秒

模型描述

需要更多信息

预期用途与局限性

需要更多信息

训练与评估数据

需要更多信息

训练过程

训练超参数

训练过程中使用了以下超参数:

  • learning_rate: 5e-05
  • train_batch_size: 2
  • eval_batch_size: 2
  • seed: 42
  • gradient_accumulation_steps: 4
  • total_train_batch_size: 8
  • optimizer: 使用 OptimizerNames.ADAMW_TORCH_FUSED,betas=(0.9, 0.999),epsilon=1e-08,optimizer_args=无额外优化器参数
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_ratio: 0.1
  • num_epochs: 3

训练结果

训练损失轮次步数验证损失准确率
0.35741.03940.51810.7738
0.44282.07880.43570.8119
0.0753.011820.41000.8183

测试结果

{'eval_loss': 0.3827999532222748,
 'eval_accuracy': 0.8253768844221105,
 'eval_runtime': 184.3164,
 'eval_samples_per_second': 4.319,
 'eval_steps_per_second': 2.159,
 'epoch': 3.0}
类别精确率召回率F1分数支持样本数
正常(0)0.740.830.78299
暴力(1)0.890.820.85497
准确率0.83796
宏平均0.810.830.82796
加权平均0.830.830.83796

框架版本

  • Transformers 4.57.1
  • Pytorch 2.8.0+cu126
  • Datasets 4.0.0
  • Tokenizers 0.22.1