统计套利分析技术

统计套利模型依赖于使用统计和数学模型在数据中寻找模式。

分析师通常会使用 Matlab、R 或 Python 来分析这些模型的数据。虽然其他选项是极好的选择,但您只能在Analyzing Alpha 上找到Python代码中的代码。

虽然我建议您 在开始实时交易之前了解基本的统计概念 ,但所有三种语言都可以让您在不了解基本数学的情况下使用统计模型。

假设您是一名算法交易员,并计划创建统计套利策略。在这种情况下,第一步是执行数据操作以删除不正确的值,检查异常数据,并以有用的方式对位和字节进行排序。

例如,如果您不考虑拆分、股息和其他公司行为,您可能会意外地假设一对交易是协整的,而实际上并非如此。

所以假设你有你想要的数据,你有什么选择?好吧,有很多,所以让我们介绍一些最常见的:

时间序列分析
主成分分析
自回归
波动率建模

时间序列分析

开发提供样本数据可能描述的数学模型是时间序列分析的主要目的。我们想知道时间序列背后的“原因”,我们通过 将时间序列分解为其组成部分来做到这一点。

例如,价格数据是否具有季节性、趋势等?时间序列分析使我们能够回答这些问题。请参阅下面对苹果价格历史的分解,我们可以看到它处于上升趋势并且也是季节性的。

主成分分析

主成分分析 (PCA) 降低了数据集维数,提高了可解释性,并最大限度地减少了信息丢失。它通过创建新的不相关变量来连续最大化方差来做到这一点。

换句话说,数据通常可以具有许多特征,一些重要而一些不重要。这个想法是 将数据提炼 成基本项目并从那里进行分析。

自回归

自回归是一种时间序列模型,它使用历史观察作为回归方程的输入来预测下一步的值。这就是它被称为自回归的原因——它 “对自身进行回归” ,因为它使用来自先前时间步的相同输入的数据。

y t = b + c_1 * x t1 + c_2 * x_t2

其中 b 是偏差,c 是系数,x 是滞后时间序列步长。

波动率建模

波动率建模试图预测波动率以预测未来回报。通常,波动率模型试图预测分位数或绝对回报。

随机波动率 (SV) 和 GARCH 是用于预测金融时间序列波动率的两个著名模型。



   微信关注公众号:



   点击获取QQ、微信群聊