DAG革新时间序列预测，代码、数据、排行榜全开源

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

7218点击 2026-05-18 15:28

DAG框架利用时间与通道双重相关网络，有效整合历史与未来外生变量信息，提升时间序列预测准确性。通过发现并注入相关关系，充分利用未来协变量，显著优于现有方法。

时间序列预测在经济学、交通、智能运维等多个领域具有关键作用。然而在实际应用中，仅关注内生变量（即目标变量）往往难以保证预测精度。引入外生变量（即协变量）能够提供额外的预测信息，从而提升预测准确性。

但现有外生变量时间序列预测方法（TSFX）存在两个主要缺陷：

1）未能充分利用未来外生变量；

2）忽略内生变量与外生变量间的相关关系，导致预测性能未达最优。

为了更好地利用外生变量（特别是未来外生变量），华东师范大学的研究人员提出通用框架 DAG，通过双相关网络在时间维度和通道维度上实现外生变量时间序列预测。

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

论文链接：https://arxiv.org/pdf/2509.14933

代码链接：https://github.com/decisionintelligence/DAG

开源数据集链接：https://drive.google.com/file/d/1K2AvogpOpSz1PiQ53dPchzGv_PqlCWAK/view

协变量预测排行榜以及测评结果链接：https://decisionintelligence.github.io/OpenTS/leaderboards/#covariate_forecasting

具体来说，该研究首先提出时间相关模块，其包含相关发现模块（用于捕捉历史外生变量如何影响未来外生变量）和相关注入模块（将发现的相关关系融入基于历史内生变量的未来内生变量预测过程）。

随后提出通道相关模块，采用类似设计原理：通过相关发现模块建模历史外生变量对历史内生变量的影响，并借助相关注入模块将发现的相关关系用于增强基于未来外生变量的未来内生变量预测。

在多组数据集上的大量实验表明，DAG框架实现了最先进的预测性能。

研究背景

当前基于深度学习的时间序列预测方法大多聚焦于单变量或多变量，并依赖于学习单个内生变量（即预测目标）内部的时间依赖关系，或多个内生变量之间的依赖关系。

然而，除了内生变量本身外，许多实际场景还涉及另一类对预测精度有显著影响的信息——外生变量（即协变量）。特别是在未来外生变量可用的情况下，有效利用这类辅助信息有可能显著提升预测性能。

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

从时间角度看，协变量可以分为两类：

历史外生变量：在历史阶段中观测到的外生信息；
未来外生变量：在预测时刻即可获得的未来时间步的外生信息。

尽管未来外生变量具有很高的预测价值，但现有深度学习方法仍未得到充分利用。如图 1 所示，现有的「外生变量感知」预测方法大致可以分为两类：

仅使用历史信息的方法（图 1b）：这些方法仅依赖历史内生和外生变量来预测未来的内生变量。代表性模型包括 TimeXer 和 CrossLinear 。由于完全忽略了未来协变量，这类方法在未来外生信息可用的场景下往往表现欠佳。
同时使用历史与未来外生变量的方法（图 1c）：例如，TiDE 和 TFT 在预测未来内生变量时，利用了历史信息和未来外生变量。然而，由于缺乏相关关系约束，这类方法容易受到虚假相关的影响。

进一步的分析（如图 2 所示）表明，利用已知的未来协变量进行预测涉及时间维度和通道维度上的相关依赖关系：

在时间维度上，历史外生变量对未来外生变量的影响结构性地类似于历史内生变量演化为未来内生变量的过程；
在通道维度上，历史外生变量与内生变量之间的交互模式，往往可以迁移到未来外生变量与内生变量之间。

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

这种「双重相关结构」仍是一个尚未得到充分研究但极其关键的特征，而现有方法对其关注不足。

对此，研究人员提出了一个通用框架DAG，其核心思想是利用时间维度和通道维度上的双重相关网络，在结合外生变量的时间序列预测任务中实现高质量的未来内生变量预测。

首先提出时间相关模块。由于历史外生变量对未来外生变量的影响在结构上类似于历史内生变量演化到未来内生变量的过程，该研究设计了一个相关发现模块来捕捉历史外生变量如何影响未来外生变量；接着构建了一个相关注入模块，将所发现的相关关系整合到基于历史内生变量的未来内生变量预测过程中。
随后提出通道相关模块。其设计原则类似，首先通过相关发现模块建模历史外生变量如何影响历史内生变量，然后通过相关注入模块，将所发现的相关关系整合到基于未来外生变量的未来内生变量预测过程中。
最后，将时间相关损失、通道相关损失以及未来内生变量的预测损失结合为总体损失函数，从而实现预测任务的端到端优化。

核心贡献

提出了一个通用框架 DAG，通过在时间和通道维度上发现并注入相关关系，充分利用外生变量，从而提升预测精度。
设计了一个相关发现模块，用于捕捉历史外生变量对未来外生变量的影响，以及它们对历史内生变量的影响。
设计了一个相关注入模块，将所发现的时间与通道相关关系融入未来内生变量的预测过程中。
研究人员开源了自建的TSF-X数据集，并在公共和新发布的数据集上进行了广泛实验，结果表明DAG优于当前最先进的方法。

模型方法

DAG框架的模型结构如下图所示：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

时间相关模块

历史外生变量对未来外生变量的影响，在结构上与历史内生变量演化为未来内生变量的过程具有相似性。因而，此模块设计了时间相关发现模块，用于揭示历史与未来外生变量之间的相关关系，并设计了时间相关注入模块将所发现的相关关系注入到基于历史内生变量预测未来内生变量的建模过程中以提升预测精度。

时间相关发现模块

时间相关发现模块采用了 分块表示策略提取历史外生变量与未来外生变量的相关关系。具体而言，将每个历史外生变量划分为多个patch，并将每个patch投影为一个时间token：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

接着，该模块采用标准Transformer Block 来建模不同 patch 对未来外生变量的影响权重：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

为增强鲁棒性，此模块并非直接将生成的注意力分数传递给时间相关注入模块，而是提取并传递MSA中生成注意力分数的可学习参数：查询矩阵Wq′和键矩阵Wk′。这些参数作为时间相关表示被注入。

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

未来外生变量的预测损失被用作训练过程中的时间相关损失：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

时间相关注入模块

与时间相关发现模块的处理方式一致，此模块首先对历史内生变量进行分块表示：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

引入可学习加权因子α融合两组注意力分数，得到最终融合注意力分数：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

门控计算α：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

通道相关模块

类似于时间维度上的处理，通道相关模块旨在建模并注入沿变量（通道）维度的相关关系。

该模块关注历史外生变量如何影响历史内生变量，以及如何将这种相关模式迁移以利用未来外生变量增强未来内生变量的预测。

通道相关发现模块

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

随后输入标准Transformer block：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

训练过程中，历史内生变量的预测损失用作通道相关损失：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

通道相关注入模块

该模块使用未来外生变量预测未来内生变量，同时注入先前提取的通道级相关表示。首先，未来外生变量采用同样的序列嵌入策略进行编码：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

随后使用类似的Correlation Transformer block来建模通道依赖，同时注入学习到的相关信息：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

引入门控机制计算可学习权重α:

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

融合注意力分数：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

融合后的token表示：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

损失函数与输出

DAG的训练目标由三部分组成：

时间相关损失Lt：衡量模型在预测未来外生变量时捕捉时间相关结构的能力。
通道相关损失Lc：衡量模型捕捉历史外生变量与内生变量之间相关关系的建模误差。
最终预测损失Lf：针对未来内生变量的预测精度计算，基于融合后的预测结果评估目标变量的最终预测准确性。

为了得到未来内生变量的最终预测，使用融合权重λ1对两种候选预测进行加权融合：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

最终，总损失函数将预测损失与相关建模损失结合：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

其中，λ2为相关权重，用于平衡训练过程中相关建模的贡献。

实验效果

整体性能

DAG模型主要在12个满足 TSFX 条件的真实世界数据集上进行了长短期预测实验，并与9个常用基线方法进行了对比，这些方法包括：支持未来外生变量的方法（如 GCGNet、TimeXer、TFT、TiDE）以及原本不支持未来外生变量的方法（如 DUET、CrossLinear、Amplifier、TimeKAN、PatchTST）。

对于不支持未来协变量的方法，研究通过MLP融合进行改造，以加入未来外生变量。为保证公平性，所有实验均使用相同的输入数据。

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

消融实验

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

观察到以下几点：

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

参数敏感性

对DAG的参数敏感性进行研究后有以下发现：

融合权重 λ1和相关权重λ2：下图a和图b表示，模型在较宽的参数范围内稳定，最佳取值一般在 0.3–0.7，说明适中的权重有助于提升性能。
模型维度：下图c表明，模型维度对性能有一定影响，但DAG在64–256维范围内表现稳定，同时也兼顾计算效率。
patch 长度：下图d显示，不同数据集最优 patch 长度不同，但一般在8–32之间效果最好。太小会增加计算量，太大则可能削弱对局部特征的捕捉能力。

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

不使用未来协变量情况

考虑到有些数据集无法获取未来外生变量，该研究对 DAG 进行了只使用历史外生变量的实验。

对DAG来说，采用Fθ1预测的外生变量替代原本用于预测内生变量的未来外生变量，从而避免未来信息不可用的问题。
对其他基线模型，也只使用历史外生变量。

实验结果显示，DAG依然表现出色。TimeXer、CrossLinear 等方法也表现良好；DUET表现不错，而PatchTST表现较差。

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

排行榜

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

协变量预测排行榜以及测评结果链接：https://decisionintelligence.github.io/OpenTS/leaderboards/#covariate_forecasting

总结

研究人员提出了一个通用框架DAG，该框架沿时间和通道维度利用双重相关网络进行含外生变量的时间序列预测，尤其充分利用未来外生变量信息。

框架引入了时间相关模块，包括一个时间相关发现模块，用于建模历史外生变量如何影响未来外生变量；

随后通过相关注入模块将这些关系整合进未来内生变量的预测中。

此外，还引入了通道相关模块，该模块通过通道相关发现模块建模历史外生变量对历史内生变量的影响，并通过注入这些关系提升基于未来外生变量的未来内生变量预测精度。

作者信息

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

论文第一作者邱翔飞，现为华东师范大学23级硕博连读生，师从胡吉林，杨彬教授，主要研究方向为时序分析与测评，时序大模型。在NeurIPS，ICML，VLDB，KDD等CCF A类会议及期刊发表录用论文22篇，其中以第一作者（含共同一作）身份发表14篇，截止目前谷歌学术引用1300+，H指数15。一作论文TFB获得VLDB 2024最佳论文奖提名，DUET荣登KDD 2025 Paper Digest最具影响力论文。入选中国科协青年科技人才培育工程博士生专项，荣获CCF优秀大学生学术秀（硕士组）冠军。

邱翔飞所在的决策智能实验室依托华东师范大学，数据科学与工程学院，具有一支国际化，高水平导师团队，一人入选国家级领军人才，两人入选国家级青年人才。主要研究方向涵盖人工智能、机器学习和数据管理。通过对复杂异构数据（例如时间序列、时空数据、图、图像和分子结构等）进行高精度、高效率、自动的、高鲁棒性、可解释的分析和管理，助力不同行业的数字化转型和不同应用领域的决策支持。

参考资料：

https://arxiv.org/pdf/2509.14933

文章来自于"新智元"，作者 "LRST"。

关键词: AI新闻 , 模型训练 , DAG , 人工智能