Chroma Context-1

Context-1 是一个拥有 200 亿参数的智能体搜索模型，其训练目标是为复杂的多跳查询检索支持文档。它旨在作为检索子智能体与前沿推理模型协同工作：给定一个查询，Context-1 将其分解为子查询，迭代搜索语料库，并选择性地编辑自身上下文以释放容量，以便进一步探索。

Context-1 的检索性能可与前沿大型语言模型（LLMs）相媲美，但其成本仅为前者的一小部分，推理速度却高达前者的 10 倍。

技术报告： Chroma Context-1：训练一个自编辑搜索智能体

模型详情

基础模型： gpt-oss-20b
参数规模： 200 亿（混合专家模型）
训练方式： 监督微调（SFT）+ 强化学习（CISPO），采用分阶段课程学习
精度： BF16（MXFP4 量化检查点即将推出）

核心能力

查询分解： 将复杂的多约束问题分解为有针对性的子查询。
并行工具调用： 平均每轮 2.56 次工具调用，减少总轮次和端到端延迟。
自编辑上下文： 在搜索过程中选择性地修剪无关文档，以在有限的上下文窗口内长期维持检索质量（修剪准确率达 0.94）。
跨领域泛化： 针对网络、法律和金融任务进行训练；能够泛化到未见过的领域和公开基准测试（BrowseComp-Plus、SealQA、FRAMES、HLE）。

重要提示：需要智能体工具包

Context-1 经过训练，旨在在特定的智能体工具包内运行，该工具包负责管理工具执行、令牌预算、上下文修剪和去重。该工具包尚未公开。 没有它运行模型将无法复现技术报告中所述的结果。

我们计划很快发布完整的智能体工具包和评估代码。在此期间，技术报告详细描述了该工具包的设计。

引用

@techreport{bashir2026context1,
  title = {Chroma Context-1: Training a Self-Editing Search Agent},
  author = {Bashir, Hammad and Hong, Kelly and Jiang, Patrick and Shi, Zhiyi},
  year = {2026},
  month = {March},
  institution = {Chroma},
  url = {https://trychroma.com/research/context-1},
}

许可协议

Apache 2.0

Chroma Context-1

Context-1 的检索性能可与前沿大型语言模型（LLMs）相媲美，但其成本仅为前者的一小部分，推理速度却高达前者的 10 倍。

核心能力

查询分解： 将复杂的多约束问题分解为有针对性的子查询。

并行工具调用： 平均每轮 2.56 次工具调用，减少总轮次和端到端延迟。

自编辑上下文： 在搜索过程中选择性地修剪无关文档，以在有限的上下文窗口内长期维持检索质量（修剪准确率达 0.94）。

跨领域泛化： 针对网络、法律和金融任务进行训练；能够泛化到未见过的领域和公开基准测试（BrowseComp-Plus、SealQA、FRAMES、HLE）。

重要提示：需要智能体工具包

我们计划很快发布完整的智能体工具包和评估代码。在此期间，技术报告详细描述了该工具包的设计。

@techreport{bashir2026context1, title = {Chroma Context-1: Training a Self-Editing Search Agent}, author = {Bashir, Hammad and Hong, Kelly and Jiang, Patrick and Shi, Zhiyi}, year = {2026}, month = {March}, institution = {Chroma}, url = {https://trychroma.com/research/context-1}, }