TRIBE v2 皮层下头部（Lahner）

该模型为 TRIBE v2 架构提供皮层下 fMRI 预测权重。
它通过多模态输入（视频、音频、文本）预测皮层下脑区（如海马体、杏仁核、苍白球）的 BOLD 活动。

模型详情

开发人员： Logan Fernandez
模型类型： 多模态 fMRI 编码模型（回归）
基础模型： TRIBE v2
许可证： CC BY-NC 4.0

用途

通过自然刺激预测深部脑活动
研究刺激→大脑反应关系
分析对刺激的情绪反应
让大脑“观看短视频”（详见 Github 仓库）

局限性

针对 Lahner 类型受试者的特定行为，且针对短视频媒体进行了调优
仅反映相关性，而非因果关系

训练

数据集：Lahner2024Bold（BOLD Moments）
特征：视频（V-JEPA）、音频（Wac2Vert）、文本（Qwen3B）
投影：皮层下掩膜

评估

指标： 皮尔逊相关系数
结果： r = 0.165（测试集）

这反映了预测皮层下活动的难度，其信号比皮层信号更嘈杂且分辨率更低。

仓库

https://github.com/Enzyme0/homunculus

联系方式

Logan Fernandez
loganfe@outlook.com

致谢

本模型基于 TRIBE-V2 构建，旨在作为该工作的下游或衍生组件。

引用

相关研究请同时引用本模型和 TRIBE-V2：

@article{dAscoli2026TribeV2,
  title={A foundation model of vision, audition, and language for in-silico neuroscience},
  author={d'Ascoli, St{\'e}phane and Rapin, J{\'e}r{\'e}my and Benchetrit, Yohann and Brookes, Teon and Begany, Katelyn and Raugel, Jos{\'e}phine and Banville, Hubert and King, Jean-R{\'e}mi},
  year={2026}
}

TRIBE v2 皮层下头部（Lahner）

模型详情

开发人员： Logan Fernandez
模型类型： 多模态 fMRI 编码模型（回归）
基础模型： TRIBE v2
许可证： CC BY-NC 4.0

用途

通过自然刺激预测深部脑活动
研究刺激→大脑反应关系
分析对刺激的情绪反应
让大脑“观看短视频”（详见 Github 仓库）

局限性

针对 Lahner 类型受试者的特定行为，且针对短视频媒体进行了调优
仅反映相关性，而非因果关系

训练

数据集：Lahner2024Bold（BOLD Moments）
特征：视频（V-JEPA）、音频（Wac2Vert）、文本（Qwen3B）
投影：皮层下掩膜

评估

指标： 皮尔逊相关系数
结果： r = 0.165（测试集）

这反映了预测皮层下活动的难度，其信号比皮层信号更嘈杂且分辨率更低。

仓库

https://github.com/Enzyme0/homunculus

联系方式

Logan Fernandez
loganfe@outlook.com

致谢

本模型基于 TRIBE-V2 构建，旨在作为该工作的下游或衍生组件。

引用

相关研究请同时引用本模型和 TRIBE-V2：

@article{dAscoli2026TribeV2,
  title={A foundation model of vision, audition, and language for in-silico neuroscience},
  author={d'Ascoli, St{\'e}phane and Rapin, J{\'e}r{\'e}my and Benchetrit, Yohann and Brookes, Teon and Begany, Katelyn and Raugel, Jos{\'e}phine and Banville, Hubert and King, Jean-R{\'e}mi},
  year={2026}
}