HuggingFace镜像
/
deberta-v3-large-tasksource-rlhf-reward-model
like
0
添加到合集
文本分类
PyTorch
Transformers
英文
Anthropic/hh-rlhf
rlhf
arxiv:2204.05862
arxiv:2204.0586
模型介绍
文件和版本
分析
下载
Notebook 快速开发