HuggingFace镜像/context-1
模型介绍文件和版本分析
下载使用量0

Chroma Context-1

Context-1 是一个拥有 200 亿参数的智能体搜索模型,其训练目标是为复杂的多跳查询检索支持文档。它旨在作为检索子智能体与前沿推理模型协同工作:给定一个查询,Context-1 将其分解为子查询,迭代搜索语料库,并选择性地编辑自身上下文以释放容量,以便进一步探索。

Context-1 的检索性能可与前沿大型语言模型(LLMs)相媲美,但其成本仅为前者的一小部分,推理速度却高达前者的 10 倍。

技术报告: Chroma Context-1:训练一个自编辑搜索智能体

模型详情

  • 基础模型: gpt-oss-20b
  • 参数规模: 200 亿(混合专家模型)
  • 训练方式: 监督微调(SFT)+ 强化学习(CISPO),采用分阶段课程学习
  • 精度: BF16(MXFP4 量化检查点即将推出)

核心能力

  • 查询分解: 将复杂的多约束问题分解为有针对性的子查询。
  • 并行工具调用: 平均每轮 2.56 次工具调用,减少总轮次和端到端延迟。
  • 自编辑上下文: 在搜索过程中选择性地修剪无关文档,以在有限的上下文窗口内长期维持检索质量(修剪准确率达 0.94)。
  • 跨领域泛化: 针对网络、法律和金融任务进行训练;能够泛化到未见过的领域和公开基准测试(BrowseComp-Plus、SealQA、FRAMES、HLE)。

重要提示:需要智能体工具包

Context-1 经过训练,旨在在特定的智能体工具包内运行,该工具包负责管理工具执行、令牌预算、上下文修剪和去重。该工具包尚未公开。 没有它运行模型将无法复现技术报告中所述的结果。

我们计划很快发布完整的智能体工具包和评估代码。在此期间,技术报告详细描述了该工具包的设计。

引用

@techreport{bashir2026context1,
  title = {Chroma Context-1: Training a Self-Editing Search Agent},
  author = {Bashir, Hammad and Hong, Kelly and Jiang, Patrick and Shi, Zhiyi},
  year = {2026},
  month = {March},
  institution = {Chroma},
  url = {https://trychroma.com/research/context-1},
}

许可协议

Apache 2.0