IPIP-BFFM 稀疏分位数模型

适用于包含50个题项的IPIP大五人格量表（BFFM）人格评估的XGBoost分位数回归模型，已导出为ONNX格式，以便进行跨平台推理。

这些模型的功能

每个模型接收最多50个题项的作答（Likert 1--5分制），并预测大五人格维度分数（外向性、宜人性、尽责性、情绪稳定性、智力）。导出的校准机制适用于完整的50题作答情况以及主要的领域平衡20题稀疏作答机制。

核心能力：稀疏输入。 即使大多数题项未作答（NaN），模型仍能产生准确的预测。这使得无需重新训练或切换模型，即可进行适应性和简版评估（最少20个题项）。

一个图中包含15个模型——5个维度×3个分位数（q05、q50、q95），合并为单个ONNX文件
稀疏性增强——在训练期间，完整的作答会被随机屏蔽以模拟缺失题项，使模型学会处理任意的缺失题项模式
分位数回归——tau = 0.05、0.50、0.95时的pinball损失提供了中位数预测以及不确定性边界，这些边界针对full_50和sparse_20_balanced运行机制进行了明确校准
基于常模的百分位数——原始预测通过z分数常模转换为总体百分位数，该常模源自约60.3万名受访者

主要模型为**reference**。其他变体是研究控制变量，用于分离每种稀疏性增强策略的贡献。

每个变体目录包含：

训练流程、评估脚本及推理包（Python + TypeScript）：github.com/sprice/bffm-xgb

CC0 1.0 通用版——公共领域贡献

这些模型的功能

工作原理

一个图中包含15个模型——5个维度×3个分位数（q05、q50、q95），合并为单个ONNX文件

稀疏性增强——在训练期间，完整的作答会被随机屏蔽以模拟缺失题项，使模型学会处理任意的缺失题项模式

分位数回归——tau = 0.05、0.50、0.95时的pinball损失提供了中位数预测以及不确定性边界，这些边界针对full_50和sparse_20_balanced运行机制进行了明确校准

基于常模的百分位数——原始预测通过z分数常模转换为总体百分位数，该常模源自约60.3万名受访者

变体

主要模型为**reference**。其他变体是研究控制变量，用于分离每种稀疏性增强策略的贡献。

每个变体目录包含：

model.onnx——合并的ONNX模型（5个维度×3个分位数）

config.json——运行时配置、特征名称和常模

README.md——包含性能表的变体特定模型卡片

provenance.json——完整的审计追踪（git哈希、数据快照、训练配置）