HuggingFace镜像/bffm-xgb
模型介绍文件和版本分析

IPIP-BFFM 稀疏分位数模型

适用于包含50个题项的IPIP大五人格量表(BFFM)人格评估的XGBoost分位数回归模型,已导出为ONNX格式,以便进行跨平台推理。

这些模型的功能

每个模型接收最多50个题项的作答(Likert 1--5分制),并预测大五人格维度分数(外向性、宜人性、尽责性、情绪稳定性、智力)。导出的校准机制适用于完整的50题作答情况以及主要的领域平衡20题稀疏作答机制。

核心能力:稀疏输入。 即使大多数题项未作答(NaN),模型仍能产生准确的预测。这使得无需重新训练或切换模型,即可进行适应性和简版评估(最少20个题项)。

工作原理

  • 一个图中包含15个模型——5个维度×3个分位数(q05、q50、q95),合并为单个ONNX文件
  • 稀疏性增强——在训练期间,完整的作答会被随机屏蔽以模拟缺失题项,使模型学会处理任意的缺失题项模式
  • 分位数回归——tau = 0.05、0.50、0.95时的pinball损失提供了中位数预测以及不确定性边界,这些边界针对full_50和sparse_20_balanced运行机制进行了明确校准
  • 基于常模的百分位数——原始预测通过z分数常模转换为总体百分位数,该常模源自约60.3万名受访者

变体

变体描述
ablation_focused研究控制变量变体
ablation_none研究控制变量变体
ablation_stratified研究控制变量变体
reference主要已发表模型

主要模型为**reference**。其他变体是研究控制变量,用于分离每种稀疏性增强策略的贡献。

每个变体目录包含:

  • model.onnx——合并的ONNX模型(5个维度×3个分位数)
  • config.json——运行时配置、特征名称和常模
  • README.md——包含性能表的变体特定模型卡片
  • provenance.json——完整的审计追踪(git哈希、数据快照、训练配置)

源代码

训练流程、评估脚本及推理包(Python + TypeScript):github.com/sprice/bffm-xgb

许可证

CC0 1.0 通用版——公共领域贡献

下载使用量0