马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 yinda_peng 于 2026-5-29 11:56 编辑
论文标题:xPatch: Dual-Stream Time Series Forecasting with Exponential Seasonal-Trend Decomposition
核心内容:
- 提出新型双流架构 xPatch,基于指数分解思想
- 引入季节-趋势指数分解模块,受经典指数平滑启发
- 设计 MLP 线性流与 CNN 非线性流协同建模
- 在非 Transformer 模型中探索分块(patching)与通道独立(channel-independence)技术
- 构建鲁棒的反正切(arctangent)损失函数,缓解过拟合
- 采用 Sigmoid 形式的学习率调整策略,提升训练稳定性与预测性能
作者介绍:Artyom Stitsyuk (第一作者),韩国科学技术院 KAIST 统计人工智能实验室 SAIL 的核心成员,专注于时间序列预测、可解释AI等前沿领域
Jaesik Choi (通讯作者),在 KAIST 统计人工智能实验室 SAIL 有个人页面https://sail.kaist.ac.kr/members/jaesik/
一、研究背景
在Long-term time series forecasting (LTSF) 长时间序列预测方面,基于Transformer的模型(Vaswani等,2017)彻底改变了长期时间序列预测(LTSF)任务,使强大的人工智能系统得以实现当前最优性能。Transformer架构被认为在捕捉长序列中各元素间的语义关联方面极为有效。Transformer 中采用的自注意力机制具有排列不变性。尽管位置编码等技术能在一定程度上保留顺序信息,但如何有效保持时间信息仍是基于 Transformer 的模型所面临的一大挑战。这一局限性会对处理连续点集的长时序预测(LTSF)任务性能产生不利影响。因此,一种仅使用多层感知机(MLP)网络的简单线性方法(Zeng 等,2023)已对 Transformer 在 LTSF 任务中的有效性提出了质疑。令人惊讶的是,一个名为 DLinear 的简单线性模型已超越此前所有基于 Transformer 模型的最先进预测性能,由此引发了一个根本性问题:“Transformer 是否真正适用于长时序预测?”
二、分解方法
本研究引入了指数型季节-趋势分解技术。此外,我们提出了一种结合权重衰减的鲁棒反正切损失函数,以及一种可提升训练适应性的新型学习率调整策略。同时,我们设计了xPatch,一种全新的双流网络架构,该架构融合了卷积神经网络(CNN)、多层感知机(MLP)、分块处理、通道独立性、指数型季节-趋势分解以及双流预测机制。 2.1 简单移动平均(SMA)的缺陷 SMA是一种用于分解时间序列数据的方法,可以将一个时间序列分解为趋势性成分XT和季节性成分XS,趋势指的就是数据曲线的走向,上升下降,季节也很好理解,是一种周期性的特征,比如我们知道春天多雨,夏天热,秋天干燥,冬天冷。大多数情况下,季节性成分是非线性的且平稳的,而趋势成分则是线性的且非平稳的。图中给出了SMA的计算方法,就是一个简单的滑动窗口,窗口长度为k,默认步长取1,对窗口内的数据进行求平均值的操作得到XT的数据点st。熟悉滑动窗口的小伙伴都知道,对一列数据进行滑窗分解之后,得到的数据点很可能少于原始数据个数。为了解决数据个数不一致的问题,SMA使用的是Padding操作,即重复第一个数据点以及最后一个数据点以达到分解后仍保留足够的数据点个数,这样季节性成分就可以用原始数据点减去st一一对应得到。
但SMA有这样的缺陷: 1.会丢失重要的趋势特征,从Figure1可以看出来上面的蓝色趋势性成分曲线很明显在反映上升的过程时丢失了原数据迅速爬升的特征
2.对齐操作需在序列两端填充,易扭曲首尾部分
3.简单移动平均(SMA)生成的趋势过于简单、特征贫乏 4.SMA 导致季节性模式复杂难解,故需探索替代分解方法
2.2 指数移动平均EMA 指数移动平均不需要进行填充操作,很大程度上避免了特征丢失和扭曲的问题。图中的计算公式可以看到,分解的第一个点等于第一个数据点x0,随后的分解点基于前一个分解点和当前的原始数据点计算得来,其中α是一个参数,介于0和1之间,分解点依旧是趋势性成分,季节性成分的计算与SMA一致。容易想到的是,α越大,趋势性成分越接近于原始数据,而季节性成分就越趋于零。从Figure2可知,对于这个序列数据,α取0.3就可以达到很好的效果。
指数法能更精准地调控趋势成分和季节性成分的行为。由于数据可能呈现多种模式,包括具有不同周期和行为特征的平稳与非平稳特性,因此指数分解方法在特征提取方面更具适应性。与简单移动平均法相比,指数移动平均法在分解过程中展现出更高的灵活性,其权重分配机制基于数据点的指数衰减规律。这种适应性使指数移动平均法能更有效地捕捉趋势变化,因而特别适用于具有动态性和演化性模式的时间序列。
|