1.5 研究特色与创新点

本书的研究特色在于:

(1)本研究属于一项深度融合金融投资、信号处理、机器学习和强化学习等学科领域理论与方法的交叉研究课题,有利于推动信号处理、人工智能与机器学习前沿模型及算法在金融投资领域的深度应用,进而提升金融市场的资源配置效率。

(2)本书面向股票量化投资实践中的实际需求,深入研究股票价格与交易量分布高精度预测、股票行业互动关系量化建模、择时策略构建以及实时在线投资组合构建等量化投资理论与实务中的关键问题,获得了一系列基于机器学习等多学科知识、有一定理论意义的模型和方法,并将所取得的研究结论从样本内推广至样本外,进行仿真交易及回测评估,进一步验证所提出的模型、方法和策略的有效性与实用性。

本书的创新点在于:

(1)本书将具有自适应分解能力的EMD、EEMD和CEEMDAN方法引入股市指数序列的预测建模过程中,从而获得波动特征相对简单且相互独立的本征模函数(IMF),或者高频、低频分量和趋势项三个子序列,为进一步进行各子序列的高精度预测建模创造了有利条件,避免了现有主流建模方法中直接从复杂的原始时序数据提取波动模式的技术难题,显著降低了指数时序预测建模的难度。进一步,针对指数CEEMDAN分解所产生的子序列,本书运用LSTM构建各子序列的预测模型,将CEEMDAN的自适应分解功能与LSTM的长期依赖关系提取能力进行结合,不仅克服了传统统计建模方法对适用数据的分布假设过于严格的局限性,而且能高效提取股价序列中蕴含的长期动态依赖关系,显著提升了所构建的指数预测模型的预测精度,进而提升了策略所产生择时信号的准确度与有效性,为股价预测建模与量化择时策略设计提供了新的研究思路。

(2)MEMD方法主要应用于信号识别与图像处理等自然科学领域,本书率先将其引入金融投资建模研究中。在本书提出的指数日内交易量分布预测方法M-LSTM中,针对交易量数据所具有的高度非线性、极低信噪比等复杂特征,首先,运用MEMD将区间交易量多元时间序列分解为若干个独立的IMF和一个趋势项;其次,对各维度中高频IMF进行去噪和重构处理,获得降噪后的日内交易量区间分布,进而改善日内交易量分布预测建模的效果。

(3)针对MEMD去噪后的金融时序数据,本书并没有采用回归模型对股价进行预测,或对行业之间的互动关系进行宏观描述性统计。充分考虑行业之间互相影响且在不同期间影响不同,本书将行业指数的轮动建模转化成一个机器学习分类问题,运用SVC构建行业指数间的涨跌分类模型。

(4)目前,深度强化学习很少应用于金融投资领域,而少数基于深度强化学习的金融投资研究则采用基于价值迭代的DQN(Deep Q-Learning)算法或基于策略迭代的PG(Policy Gradient)算法。本书选取沪深300指数近期的开盘价、收盘价、最高价、最低价和成交量等数据,经过标准化处理后将这些数据作为状态向量(state)输入基于DDPG算法构建的交易智能体(agent)中,再根据智能体的策略函数做出交易判断,并输出未来一个交易日的交易动作(action),从而获得在线最优股票投资组合,且将动作的即期收益作为奖赏(reward)对策略函数进行优化。本书将深度强化学习DDPG方法应用于金融投资,深化了深度学习和强化学习在金融领域的应用层次,增强了量化策略的大数据处理能力,提升了用于生成量化交易信号的特征信息提取能力,推动了量化交易策略构造方法的智能化,丰富了股票量化投资的工具。