HuggingFace镜像
/
reward-model-deberta-v3-large
like
0
添加到合集
PyTorch
Transformers
英文
MIT
openai/summarize_from_feedback
openai/webgpt_comparisons
Dahoas/instruct-synthetic-prompt-responses
RLHF
reward-model
reward_model
模型介绍
文件和版本
分析
下载
Notebook 快速开发