bert-large-uncased:可用于掩码语言建模、下一句预测,或在序列分类、标记分类、问答等下游任务上进行微调。项目是基于BERT-large架构的无大小写英文预训练模型,采用MLM和NSP双目标训练,具备24层、1024隐藏维度、16个注意力头和336M参数。【此简介由AI生成】 - AtomGit AI社区