l
loganf26/tribev2-subcortical
模型介绍文件和版本分析
下载使用量0

TRIBE v2 皮层下头部(Lahner)

该模型为 TRIBE v2 架构提供皮层下 fMRI 预测权重。
它通过多模态输入(视频、音频、文本)预测皮层下脑区(如海马体、杏仁核、苍白球)的 BOLD 活动。

image


模型详情

  • 开发人员: Logan Fernandez
  • 模型类型: 多模态 fMRI 编码模型(回归)
  • 基础模型: TRIBE v2
  • 许可证: CC BY-NC 4.0

用途

  • 通过自然刺激预测深部脑活动
  • 研究刺激→大脑反应关系
  • 分析对刺激的情绪反应
  • 让大脑“观看短视频”(详见 Github 仓库)

局限性

  • 针对 Lahner 类型受试者的特定行为,且针对短视频媒体进行了调优
  • 仅反映相关性,而非因果关系

训练

  • 数据集:Lahner2024Bold(BOLD Moments)
  • 特征:视频(V-JEPA)、音频(Wac2Vert)、文本(Qwen3B)
  • 投影:皮层下掩膜

评估

  • 指标: 皮尔逊相关系数
  • 结果: r = 0.165(测试集)

这反映了预测皮层下活动的难度,其信号比皮层信号更嘈杂且分辨率更低。


仓库

https://github.com/Enzyme0/homunculus


联系方式

Logan Fernandez
loganfe@outlook.com

致谢

本模型基于 TRIBE-V2 构建,旨在作为该工作的下游或衍生组件。

引用

相关研究请同时引用本模型和 TRIBE-V2:

@article{dAscoli2026TribeV2,
  title={A foundation model of vision, audition, and language for in-silico neuroscience},
  author={d'Ascoli, St{\'e}phane and Rapin, J{\'e}r{\'e}my and Benchetrit, Yohann and Brookes, Teon and Begany, Katelyn and Raugel, Jos{\'e}phine and Banville, Hubert and King, Jean-R{\'e}mi},
  year={2026}
}