HuggingFace镜像/japanese-reranker-cross-encoder-small-v1
模型介绍文件和版本分析
下载使用量0

japanese-reranker-cross-encoder-small-v1

这是一系列使用日语训练的重排序模型(CrossEncoder)。

模型名称层数隐藏层大小
hotchpotch/japanese-reranker-cross-encoder-xsmall-v16384
hotchpotch/japanese-reranker-cross-encoder-small-v112384
hotchpotch/japanese-reranker-cross-encoder-base-v112768
[hotchpotch/japanese-reranker-cross-encoder-large-v1]241024
[hotchpotch/japanese-bge-reranker-v2-m3-v1]241024

关于重排序模型(Reranker)的技术报告、评估等内容,请参考以下链接。

  • 发布日语最高性能重排序模型 / 重排序模型究竟是什么?
  • 日语重排序模型构建技术报告

使用方法

推理

import argparse
import torch
from sentence_transformers import CrossEncoder
from openmind import is_torch_npu_available

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--model_name_or_path",
        type=str,
        help="Path to model",
        default=None,
    )
    args = parser.parse_args()
    return args

def main():
    args = parse_args()
    MODEL_NAME = args.model_name_or_path
    if is_torch_npu_available():
        device = "npu:0"
    else:
        device = "cpu"
    model = CrossEncoder(MODEL_NAME, max_length=512, device=device)
    model.model.half()
    query = "感動的な映画について"
    passages = [
        "深いテーマを持ちながらも、観る人の心を揺さぶる名作。登場人物の心情描写が秀逸で、ラストは涙なしでは見られない。",
        "重要なメッセージ性は評価できるが、暗い話が続くので気分が落ち込んでしまった。もう少し明るい要素があればよかった。",
        "どうにもリアリティに欠ける展開が気になった。もっと深みのある人間ドラマが見たかった。",
        "アクションシーンが楽しすぎる。見ていて飽きない。ストーリーはシンプルだが、それが逆に良い。",
    ]
    scores = model.predict([(query, passage) for passage in passages])
    print(scores)
    
if __name__ == "__main__":
    main()


评估结果

Model Name[JQaRA][JaCWIR][MIRACL][JSQuAD]
japanese-reranker-cross-encoder-xsmall-v10.61360.93760.74110.9602
japanese-reranker-cross-encoder-small-v10.62470.9390.77760.9604
japanese-reranker-cross-encoder-base-v10.67110.93370.8180.9708
[japanese-reranker-cross-encoder-large-v1]0.70990.93640.84060.9773
[japanese-bge-reranker-v2-m3-v1]0.69180.93720.84230.9624
[bge-reranker-v2-m3]0.6730.93430.83740.9599
[bge-reranker-large]0.47180.73320.76660.7081
[bge-reranker-base]0.24450.49050.67920.5757
[cross-encoder-mmarco-mMiniLMv2-L12-H384-v1]0.55880.92110.71580.932
[shioriha-large-reranker]0.57750.84580.80840.9262
[bge-m3+all]0.5760.9040.79260.9226
[bge-m3+dense]0.5390.86420.77530.8815
[bge-m3+colbert]0.56560.90640.79020.9297
[bge-m3+sparse]0.50880.89440.69410.9184
[JaColBERTv2]0.58470.91850.68610.9247
[multilingual-e5-large]0.5540.87590.77220.8892
[multilingual-e5-small]0.49170.8690.70250.8565
bm250.4580.84080.43870.9002

许可证

MIT 许可证