Box-Cox变换时间系列

图片由克里斯托弗·比尔Unsplash

介绍

让时间序列静止的当进行任何重要组成部分时间序列分析或预测。平稳性可以确保我们的数据没有统计学上通过时间改变,因此可以更准确地像一个概率分布呈现模型变得更加容易。

时间序列平稳性的要求之一是,需要一个持续的方差。换句话说,应该始终在同一尺度波动。实现这一目标的一个方法是取自然对数的系列,然而这个假定原始系列遵循一个指数的趋势。因此,自然对数变换可能并不总是最好的选择。

在这篇文章中我想介绍Box-Cox的变换,这是一个generalistion自然对数变换。确实Box-Cox允许以确定自然对数是最好的变换或其他功率变换是更优的。

如果你想了解更多关于平稳性的背景和要求,检验我的上一篇文章:

Box-Cox变换是什么?

从根本上讲,Box-Cox转换非正态数据正态分布像数据。

现在你可能想知道为什么我们需要时间序列数据像正态分布?当拟合某些模型,如华宇电脑,他们使用最大似然估计(标定)确定它们的参数。程序通过定义必须符合某种分布,这对大多数包是正态分布。

parameterised Box-Cox转换的λ(这需要真实值55)和转换时间序列,y,为:

方程由作者在乳胶。

我们看到,在λ= 0自然对数变换,然而有许多人根据价值λ。例如,如果λ= 0这是平方根变换λ= 1没有转换和λ= 3是立方变换。

的值λ最好选择由看到valye近似转换后的数据正态分布。幸运的是,在计算包这是很容易为我们做了!

Box-Cox是一种功率变换我们一直在提高我们的原始系列一些权力,这是λ

应用Box-Cox变换

让我们进行一个例子展示如何在Python中使用Box-Cox变换。下面是一个经典的情节我们航空客运卷之间1948 - 1960数据集:

数据来自KaggleCC0执照。

代码作者的主旨。
情节由作者在Python中生成的。

数据显然不是静止的均值和方差都是随时间增加。稳定方差,我们可以用Box-Cox变换就像我们上面所讨论的。Scipy函数boxcox发现的最优值λ并使用相应变换我们的数据:

代码作者的主旨。
情节由作者在Python中生成的。

现在我们的方差是稳定和波动是一致的水平!最优λ值是0.148附近,这是一个完美的自然对数变换但不完全是。这表明对数变换并不总是最好的方法,可以使用一个更彻底的方法通过Box-Cox变换。

完整代码,用于生成情节和转换可以在GitHub上找到:

结论

一个稳定的方差是一个时间序列平稳性要求。所需的稳定性是很重要的,因为它通常是大多数预测模型。达到一个稳定的方差的一般方法是应用Box-Cox变换,parametrisedλ,你的系列。自动转换,在Python中,符合最优值λ并相应地转换你的系列。

引用和进一步阅读

  • 预测:原则和实践:https://otexts.com/fpp2/
  • 盒子,考克斯乔治·e·P·d·r . (1964)。“转换”的分析。皇家统计学会杂志》的系列B26(2):211 - 252

联系我!

- - -

- - -

得到了媒介的应用betway娱乐官网

一个按钮“App Store下载”说,如果点击它会使你的iOS应用程序商店
说一个按钮上,谷歌玩,如果点击它会使你的谷歌商店
Baidu