
我们提出了 GIFT-Eval,这是一个旨在推动零样本时间序列预测的基准,它通过在多样化数据集上进行评估来实现这一目标。GIFT-Eval 包含 23 个数据集,涵盖 144,000 个时间序列和 1.77 亿个数据点,数据跨越七个领域、十种频率,并包含多种预测长度。该基准旨在树立新的标准,为时间序列基础模型的未来创新提供指导。
为了促进基础模型的有效预训练和评估,我们还提供了一个无泄漏的预训练数据集 --> GiftEvalPretrain。
如果您想将自己的结果提交到我们的排行榜,请按照 GitHub 仓库 中的详细说明进行操作。
本版本仅用于支持学术论文的研究目的。我们的模型、数据集和代码并非专门为所有下游用途设计或评估。我们强烈建议用户在部署此模型之前,评估并解决与准确性、安全性和公平性相关的潜在问题。我们鼓励用户考虑人工智能的常见局限性,遵守适用法律,并在选择用例时采用最佳实践,特别是在高风险场景中,错误或滥用可能会对人们的生活、权利或安全产生重大影响。有关用例的进一步指导,请参考我们的 AUP 和 AI AUP。
如果您发现此基准有用,请考虑引用:
@article{aksu2024giftevalbenchmarkgeneraltime,
title={GIFT-Eval: A Benchmark For General Time Series Forecasting Model Evaluation},
author={Taha Aksu and Gerald Woo and Juncheng Liu and Xu Liu and Chenghao Liu and Silvio Savarese and Caiming Xiong and Doyen Sahoo},
journal = {arxiv preprint arxiv:2410.10393},
year={2024},
}