深度学习在股票投资中的应用

2022-06-07 08:16
关键词:深度预测模型

左 川 王 宇 李 振

(1.上海立信会计金融学院 财税与公共管理学院,上海 201620;2.澳门城市大学 金融学院,澳门 999078;3.复旦大学 大数据学院,上海200433;4.珠海复旦创新研究院 金融创新发展中心,广东 珠海519000)

一、引言

深度学习是人工智能领域的一个分支,是基于多层神经网络的一种机器学习方法,其能够从原始数据中学习出易于分类识别的特征,并且能够使用较少参数描述各种特征而不依赖先验数据或知识。近年来深度学习在金融市场中得到广泛应用,与股票市场直接相关的领域包括文本及图像信息识别、股票价格预测、投资组合管理、投资交易等,几乎涵盖了股票投资的各个环节。在股票投资领域可利用深度学习在文本处理上的优势,广泛挖掘新闻、微博以及论坛上的留言信息,并将数字和文本数据进行整合,打造出可量化的舆情数据。在股价预测上,虽然仍可以借鉴传统金融时间序列思路使用LSTM模型进行分析,但也可以针对金融市场分形、易变的结构,创新性地将一维时间序列数据转化为二维平稳的图像数据,并利用CNN模型进行分析。

本文在借鉴国内外研究的基础上,从投资信息获取、股票价格预测、投资策略完善及交易系统改进四个方面来分析深度学习在股票投资中的应用领域及其未来发展方向。

二、深度学习在股票投资中的应用领域

(一)投资信息获取

传统股票投资信息的获取多来自结构化数据,如市场交易数据、财务报表数据等。即使有投资者关注政府政策和公司公告等,也仅作为辅助工具。人工智能技术的进步,使利用计算机分析新闻媒体、社交网络等自然语言的多样化非结构化数据成为可能。目前关于非结构化信息的获取主要有两类,一类是文本信息挖掘,另一类是图像信息识别。

1.文本信息挖掘。利用深度学习进行文本信息挖掘,按其对象可分为财经媒体和社交网络文本挖掘、公司公告和财务信息等。

第一类是财经媒体和社交网络文本挖掘。最早进行这一工作主要是根据财经媒体报道和社交网络留言的态度倾向进行分析,以此判断其对股票市场的影响。例如,利用RNN-RBM模型以媒体报道词汇作为输入变量预测次日股票价格,方法是先将媒体报道分类,然后将其用标准词袋模型代表,将结果词汇向量作为本文输入变量。其中,词汇向量元素为1或0,代表一个单词是否存在于文本中。接下来,根据模型输出的相应结果,即价格上涨或下跌。以y代表输出结果,有:

y=f(σ(Woh2+bo))

(1-1-1)

(1-1-2)

其中,h2代表DBN(Deep Belief Network)即深度信念网络的顶层输出,Wo和bo是隐藏层的参数。输出结果“1”和“0”代表上升或下降趋势。

较有代表性的是Yoshihara et al.(2014)的做法[1],他们以《日经早报》1999-2008年的报道为样本,设定训练集为1999-2006年的834882篇文章,验证集为2007年的98667篇文章,测试集为2008年的99728篇文章,验证对象为日经指数和10家最常出现的日本上市公司。结果显示,该方法与SVM和DBN预测相比,误差率从42.60%和47.30%降到40.05%,且结果统计性显著(p<0.01)。该方法还能够考虑重大事件的影响,如以雷曼破产为例,如果验证区间包含该事件,则RNN-RBM方法较DBN模型有较大改善,表明该模型能充分考虑过去重大事件对股价的长期影响。

相较媒体报道,社交网络信息能够更好地捕捉大众情绪。如Frank and Sanati(2018)使用标普500企业的综合新闻集[2],结合Google Trends作为个人投资者情绪代理变量,验证冲击事件对股票价格的影响,并进一步考察个人投资者和套利机构对新闻事件的反应,取得了一些创新性发现:(1)市场对于正面和负面新闻冲击的反应有显著差异。对于特定股票的新闻发布日,市场通常对好消息反应过度,而对坏消息反应不足。这在一定程度上解释了此前研究认为投资者对新闻事件反应各异的现象。(2)股价冲击对市场的影响基于市场自身特征而非信息内容,这意味着对市场结构和投资者行为的研究相比信息内容可能更加重要。(3)个人交易行为存在明显的反应过度,导致市场对正面信息和负面信息存在非对称反应,且只有在套利资本稀缺的情况下才会出现对正面消息反应过度和负面消息反应不足。这表明套利者会基于所有冲击进行交易,但其消除错误定价的能力依赖于套利资本的稀缺程度。总体来看,基于舆情信息构建投资者情绪指数,将非结构化的文本信息转化为结构化数据,能够更好地将自然语言信息用于分析股票价格走势。

第二类是公司公告和财务信息。传统财务信息研究主要聚焦于可量化的财务信息,如收入、盈利、分析师推荐等。与传统财务信息分析不同,深度学习能够对公司财务报告和公告文本中的非财务信息进行深入挖掘,如通过对上市公司业绩说明会的文本进行人工标注并构建语料库,利用LSTM模型读取语料库信息并分析管理层语意特征,可以用来识别管理层语意,其指标构建如下:

MEANINGpos=POSNUM/(POSNUM+NEGNUM)

(1-2-1)

MEANINGneg=-NEGNUM/(POSNUM+NEGNUM)

(1-2-2)

其中,当POSNUM>NEGNUM时使用MEANINGpos,代表上市公司管理层呈正向语意;当POSNUM

通过该方法,杨七中和马蓓丽(2019)获取并分析了2010-2014年上市公司年度业绩说明会上管理层和投资者的问答文本[3],发现投资者对管理层语意能够做出显著正向反应,但对好消息的反应存在一定滞后性,总预测准确率约为86.25%。

2.图像信息识别。传统股票技术分析通过寻找价格图表中的规律进行预测,深度学习则通过对股票价格和其他特征的图形模式进行分析,发现可以利用的规律。二者区别在于技术分析主要基于直观的经验总结,而深度学习基于对图像模式的统计识别。

Sezer and Ozbayoglu(2019)曾提出一种CNN-BI 模型通过股票图像信息来预测股票价格[4],主要包括以下几个步骤:

(1)图像构建。对每只股票,将30日收盘价和日期整理成为标准化的30×30时间序列图像,分别取1997-2006年约2500个日数据和1997-2012年约3750个日数据样本作为训练集,并取2007-2017年约2500个日数据和2012-2017年约1250个日数据作为训练集。

该阶段将每个图像斜率(即股票收益)作为标签,并分别标记为“买入”“卖出”和“持有”。将数据标签和对应的图像数据并入一个文件,并将其用于训练数据集。

(1-3-1)

(1-3-2)

(1-3-3)

(2)图像标记。通过比较图像远期斜率和平均斜率来给图像进行标记。该步骤可以通过多种不同方式实现,以增强CNN模型的学习能力。训练集中,第34日股价和第30日股价的差用于计算平均斜率(slopeRef)。所有相关的斜率在标记阶段分类储存于一个列表中([1..n]表明含有n个斜率数据)。训练集中的相关斜率服从高斯分布。将第45日价格和第30日价格作差求得即期斜率(slopeCurrent)。随后,将即期斜率(slopeCurrent)与平均斜率进行比较,并根据结果分别为数据标记对应的策略。

(3)模型训练。经过参数调教,开始训练模型,式(1-3-4)展示了对时间轴的卷积操作。而整个模型训练需要使用二维数据进行卷积操作,式(1-3-5)表示对二维图像的卷积操作,其中,I是输入图像,K是卷积核。式(1-3-6)解释了神经网络的结构,W代表权重,x代表输入,b代表偏差。最终根据式(1-3-7)softmax函数求得输出结果,y是输出。

(1-3-4)

(1-3-5)

(1-3-6)

y=softmax(e)

(1-3-7)

(4)股价预测。通过买入-卖出交易结果评估模型表现,根据模型训练结果,对每只股票进行买入、持有、卖出操作,式(1-3-8)是模型评估的依据,其中,S代表金融评估场景,tMoney代表总金额,NOfStocks代表股票数量。

(1-3-8)

如果模型预测为“买入”,则直接用所有可用资金在当前价格买入该股票。如果模型预测为“卖出”,则在当前价格卖出。如果预测为“持有”,则不进行操作。同时,在整个场景中如果连续出现相同标签,则只执行第一个标签的动作。初始资金为10000元,交易费用为每笔交易1元。

通过对道琼斯指数30只成分股不同时期(2007-2012和2012-2017)的训练,在前一时期,该策略能够实现约7.2%的年化收益(基准为5.8%),而在后一时期,该策略表现(5.8%)低于买入持有策略(13.3%)。这也许和牛市条件下缺少显著的卖出信号有关。

(二)股票价格预测

股票价格预测一直是股票投资研究中的核心问题。传统方法如ARIMA、GARCH模型等都属于线性回归模型,其优点是使股票预测能够在统一的框架内进行标准化分析,但依赖股价分布、预测精度不理想以及无法考虑变量间非线性特征等缺点也限制了线性模型的进一步应用。近年来CNN、RNN、LSTM等深度学习模型的发展与应用能够有效突破上述线性模型的局限,在不需要预设股价数据分布的前提下,较好地刻画了输入变量的非线性关系。

在股票价格预测上,根据其目标和问题性质可分为两类:一类是股价点预测,另一类是股价方向预测。

股价点预测的一个特殊领域是高频交易,其利用的数据频率可以达到分钟级甚至秒级。虽然从深度学习方法的运行原理来看,高频与低频交易并无显著区别,但二者的经济学含义完全不同。低频交易通常基于股票财务指标、经营状况等基本面变化(月频及以上),或是突然事件、政策变动等市场情绪变化(周频及以下),能够被多数人观察并反应,但高频交易的时间频率往往在5分钟以下,能够达到秒或毫秒级别,这类交易无法以传统金融学理论进行解释,受信息识别、网络带宽等因素的影响较大,其依据通常是短期价格运动的数学规律、市场结构及交易限制,如指令簿信息等。Borovkova and Tsiamas(2019)提出了一个LSTM神经网络整体框架以进行日内股票价格预测[6]。该框架基于一个稳健的、根据表现加权的多LSTM模型组合,通过将价格信息与大量技术指标相结合,用于分析股市高频数据。首先将股票逐笔信息加总为5分钟为单位的交易信息,并将所得数据进一步按行业进行分类。然后利用分类信息训练LSTM模型,并进一步将模型整合。对22只大盘股的价格分析表明,根据业绩加权的LSTM模型集表现优于等权重或只包括最优表现的模型集,也优于Lasso或脊回归模型。考虑到其运算复杂性和计算成本,与Lasso或脊回归相比,该方法目前仍不具备经济性。未来可以通过网格搜索或进化算法对参数进行优化,以实现更高效的预测。

股价方向预测也叫股价趋势预测,其输出结果并非精确的价格或收益率,而是上涨、下跌(也有些会加入持平)类别,这就将股价预测转换为分类问题。由于不再专注于股价精确预测,其结果精确度有所提升。如Sezer and Ozbayoglu(2018)利用CNN-TA模型分析股票价格运动趋势[7],通过将股票15种技术指标及15日量价及相应技术指标数据转换为15×15的二维图像,并通过数据标记、模型训练等过程预测股价上涨、持平和下跌趋势。对2007-2012年以及2012-2017年多只ETF和道琼斯30只成分股价格及对应技术指标的综合分析表明,对于ETF指数CNN-TA模型能够实现约13%的年化收益和71%的预测准确率,远超买入持有策略、RSI、SMA、LSTM和MLP模型,对于道琼斯30只成分股CNN-TA模型能够实现约12.6%的年化收益和71%的预测准确率,同样超过买入持有策略和其他策略和模型的预测表现。

(三)投资策略完善

投资策略是通过分配、调整投资组合中不同资产的比例和买卖时机来实现提高收益、控制风险。利用深度学习完善投资策略有两种基本思路:一是对现有投资策略进行优化和改善,二是构建新的投资策略。

传统金融理论在投资组合构建中已有许多应用,如均值-方差模型、CAPM模型及因子模型等。一个自然的思路是利用深度学习对已有模型进行优化,以取得更好的配置效果。如李斌等(2017)设计一套基于机器学习和技术指标的量化投资算法ML-TEA[8],利用技术指标作为输入信号,通过SVM、NN和Ada三种算法输出交易策略,均获得超过25%的年化收益率,且从夏普比率、特雷纳比率和詹森绩效三个角度评价,均优于大盘基准和买入持有策略。Almahdi and Yang(2019)提出一种结合循环强化学习和粒子群算法的基于Calmar比率的资产配置约束优化方法[9],将其应用于标普100成分股,发现基于Calmar比率的目标函数系统比基于夏普比率和均值-方差投资组合产生更好的有效边界,并以此为基础构建具有自适应特征的交易系统。Chen et al.(2019)根据无套利假设设置随机贴现因子[10],通过组合三种不同的深度神经网络分析驱动资产价格变动的关键因子,其方法能够实现2.1的夏普比率,并能够解释股票收益变动的8%及异常收益部分的90%。

由于深度学习在挖掘数据统计关联性方面的优势,也有研究者选择绕开传统投资理论,仅基于数据统计关系挖掘新的投资组合配置方法。如Tsang and Wong(2020)通过引入DNN模型来跨期配置多维资产[11]。该网络由代表决策步骤数量的K个子网构成,通过由网络参数决定的反馈控制函数将动态资产收益预测问题和多周期资产组合优化问题转化为DNN模型训练问题,并进行数值求解。通过对100只股票进行数值模拟和对24只股票进行实证分析,证明该模型能够在有头寸约束和多空限制的条件下实现有效的多维资产组合配置。Hirchoua et al.(2021)以504个风险数据集为对象训练代理,根据近端策略优化原理,针对状态不确定性调整行为选择,提高自身决策能力[12]。该方法以风险好奇心驱动的学习作为一种内在奖励函数,通过大量信号发现行为和市场间的显著关系,并能稳步提高行为质量。将该方法运用于8只真实股票上,验证了自学习规则的适用性和有效性,能够使用更少的交易实现更好的交易。

(四)交易系统改进

股票市场是一个高度复杂的动态系统,同时存在大量主体进行交易,并导致市场价格出现大量随机扰动。投资者最初开发自动化交易代替人工进行下单等操作,一方面是希望能够避免人的过度自信、冲动等情绪弱点,另一方面也期待机器能够捕捉人工无法捕捉的投资机会。从市场表现看,自动化交易是一把双刃剑,运用得当可以帮助人节约大量决策成本并获得超额收益,运用失误(尤其是在股灾等极端行情下)也可能造成巨额亏损。因此,如何提升自动化交易的适应性和稳定性以及开发新的有效交易系统成为投资者关注的核心议题。

目前股票交易系统设计的基本思路是考虑一个包括现金和风险资产的投资组合,通过DRL模型寻找适当的交易策略。给定初始资金和投资约束,则交易系统每一步行动都拥有有限的状态空间和行动空间,由此可以将整个交易系统转换为一个马尔可夫决策过程(MDP):

wt=(wt,0,wt,1,wt,2,…,wt,l)T

(1-4-1)

(1-4-2)

(1-4-3)

(1-4-4)

马尔可夫决策过程可以通过DQN算法求解,即一种基于值函数的深度强化学习方法,可以在代理缺少环境知识的情况下,通过重复实验进行学习。Park et al.(2020)曾在DQN模型中添加一个映射函数将最初不可行的动作转换为类似的可行动作[13],以模拟多资产投资组合中各标的的可行动作空间,进而推导出合适的多资产交易策略。利用该模型检验两个投资组合,分别包括标普500指数ETF、罗素1000指数ETF、罗素小盘指数ETF以及韩国KOSPI100指数、KOSPI中盘指数、KOSPI小盘指数,通过模型预测比较CR、SR、SterR和AT四项指标表现,结果表明,根据有映射函数的DQN模型进行交易,在美国投资组合中可以取得约12%收益,较基准策略高16%-114%,在韩国投资组合中可以取得约10%收益,较基准策略高13%-248%,且由于增加了映射函数,能够减少非必要交易,降低交易成本,进一步提高组合收益。虽然该研究仍存在一些缺陷,如只适用于少量资产,MDP模型收益只针对收益而不是风险进行优化,但其使用创新技术进行交易系统改进仍具有广泛前景。

三、深度学习在股票投资中的方法比较

(一)卷积神经网络

卷积神经网络(Convolutional Neural Networks, CNN)是一种独特的多层感知机模型,通过采用局部连接和权值共享模式,避免传统识别算法中复杂的特征提取和数据重建过程,并使其可以直接处理图像数据。因其在自然语言处理和图像识别领域的优势,在股票投资中CNN被广泛用于文本和图像投资信息的获取。

CNN的训练过程包括前向传播和后向传播两个阶段。前向传播是根据样本及初始参数经过逐级计算得到相应的实际输出。假设神经网络以xi表示输入层,以zi表示输出层,以li表示隐藏层,则一般通过对输入变量卷积和激活得到初步的输出:

(2-1-1)

其中,p*q是卷积核的大小,wi是卷积核的权重,vi是亮度值,b是偏置,h是激活函数。根据计算复杂程度,也可通过池化降低特征图的特征空间,从而降低参数,减小分辨率,降低计算难度。

后向传播是根据预期输出与目标函数的差通过求导反向更新权重wi。该阶段首先根据一定方法(如MSE或K-L散度法)求得目标函数,然后根据下式:

Δj(L)=h'(zj(L))[aj(L)-rj]

(2-1-2)

计算Δj(L),后向传播,并进一步根据:

(2-1-3)

计算其他所有层的Δj(l)。最后依次计算各权值调整量和阈值的调整量并进行调整。

从股票信息来源上看,传统分析主要依赖于价格、成交量等时间序列数据,这些数据通常包含大量噪音,从而难以识别真正的趋势。此外,这些时间序列数据高度依赖时间变量。为解决这些问题,一种思路是扩展数据分析的信息来源,图像信息的获取能够在一定程度上缓解上述问题。由于利用CNN模型能够直接识别股票二维图像,最终获得高度非线性的投资信息,并且通过越多层数的数据构建,所获得的非线性信息结构就越复杂,过滤掉的噪音也越多,这种转化有利于揭示股票价格变动的内在关联。

(二)长短期记忆网络

长短期记忆网络(Long Short-Term Memory networks, LSTM)是一种擅长处理时间序列数据的递归神经网络。与传统递归神经网络相比,LSTM通过引入门机制,能够有效分析和预测时间序列数据中间隔较长的重要事件的影响。在股票投资中,LSTM模型常用于股价预测和投资组合调整。

结构上,LSTM模型每个时刻的隐藏层都包含了若干记忆区块(Memory Blocks),每个区块包含若干记忆细胞(Memory Cells),而每个记忆细胞由一个细胞和三个门部件(输入门Input Gate、输出门Output Gate和遗忘门Forget Gate)构成。

(2-2-1)

(2-2-2)

遗忘门(φ)输出表示如下:

(2-2-3)

(2-2-4)

细胞接受两个输入:输入门和细胞输入的乘积,遗忘门和上一时刻细胞输出的乘积。因此细胞(c)输出表示为:

(2-2-5)

(2-2-6)

输出门(ι)的输出表示为:

(2-2-7)

(2-2-8)

应注意输出门接受的输入是“当前时刻细胞输出”而非“上一时刻细胞输出”。最终整个记忆细胞的输出为:

(2-2-9)

三个门部件的激活函数为f,细胞输入的激活函数为g,细胞输出的激活函数为h。

对于后向传播,利用损失函数和链式求导即可求解LSTM模型中每个权重的梯度,然后再利用梯度更新权重:

(2-2-10)

由于价格信息包含噪音导致对其进行趋势分析存在困难,LSTM采用了另一种思路克服这一困难。与CNN相比,LSTM仅使用时间序列信息,但通过对信息的全局化处理,并利用记忆细胞保留每一步信息动态调整下一步,避免丢失信息导致的建模失效,且能够胜任一些非因果系统下的数据预测。由于股价既非随机游走,也不能用单一趋势来进行概括,在某些极端情况下,投资者情绪的互相传染导致短期股价具有较强的记忆性,因此LSTM模型在股价预测上尤其是在预测精度、泛化能力及稳定性上均具有较好表现。

(三)自编码器

自编码器(Autoencoders,AE)是一种能够通过无监督学习学到输入数据高效表示的人工神经网络。由于该方法对输入数据降维得到的结果维度一般远小于输入数据本身,使得到的低维特征更具有代表性,可用于进一步分类或特征学习,因此自编码器常用于降维或特征提取。在股票投资中,自编码器在资产定价和投资组合管理中都有广泛应用。

通常,自编码器包括编码器(EC)和解码器(DC)两个组件。输入数据x∈[0,1]经sigmoid激活函数转换为编码h。与之对称,编码h会再经过一次解码过程转换为r。同时,定义均方根误差为损失函数。如下所示:

h=f(x)=σ1(W1x+b1)

(2-3-1)

r=g(h)=σ2(W2h+b2)

(2-3-2)

(2-3-3)

其中,W1和W2是权重矩阵,b1和b2是偏置向量,σ1和σ2是激活函数,f和g分别代表了编码和解码过程。自编码器中的函数映射f和g通过神经网络实现,模型网络层数越多,可探索的数据空间就越大,信息压缩和特征提取能力就越强。

此外,还有两种自编码器模型,一种是基于因子暴露的资产定价模型,它考虑线性Fama-French模型及IPCA模型中被忽略收益的非线性动力特征,从而学习一些不可观测因子的收益。该模型成功解释和预测了资产回报,并在应用到多空价差策略时得到十分具有吸引力的夏普比率值。一种是利用AE模型构建神经网络,根据某些特征将股票分为不同组,并不断将表现良好的股票纳入组合,以取得较高收益。

总之,自编码器的作用在于高效提取数据特征,进一步筛选出符合标准的股票标的并构建投资组合。与LSTM模型不同,自编码器的应用场景更偏向于横向分类,而非针对时间序列数据进行纵向分析,实际应用会综合采取各种方法进行股票筛选和组合构建,以取得最优的组合收益。

(四)深度强化学习

深度强化学习是深度学习和强化学习结合的一种算法,它将深度学习的信息收集分析能力赋予强化学习,从而实现更优的实时决策。强化学习理论很早就已经出现,直观上RL通过强化正反馈训练代理与环境进行互动,并随时间累积优化行为。与其他深度学习方法相比,RL特点包括:不依赖特定数据,只有特定奖励信号,且奖励信号不一定实时;主要研究时间序列数据,而非独立同分布数据;当前行为影响后续数据。传统强化学习动作空间和样本空间都很小,且主要应用于离散数据,因此在股票交易等实际任务中应用有限。深度强化学习模型出现后,实现了端到端学习,无需人工提取状态和特征,并整合了深度学习和强化学习,使得强化学习能够解决复杂环境下的决策问题。

强化学习主体称为代理,其基本结构是一个(A,S,R,P)四元模型。模型中A(Action)是代理的动作,S(State)是所处的状态,R(Reward)代表代理得到的奖励或惩罚,P(Perception)是交互空间。基于该模型有一些重要概念,政策函数(π)是指代理在某状态下做出选择的依据,可以是确定性的(π(s))或随机性的(π(a|s))。价值函数(Vπ(s)或Qπ(s,a))衡量了采取特定策略的长期期望收益。过程如下图所示:

图1 强化学习(RL)基本结构

由此,一个强化学习过程可以表示为求解Bellman方程:

(2-4-1)

(2-4-2)

其基本思路就是先评估每个动作的Q值,再根据Q值求解最优策略π(a|s)。传统强化学习在拟合Q函数时普遍采用人工特征和线性模型进行拟合,这就导致其适用的状态空间和动作空间非常小,实用性不强。2013年,Deepmind公司开发的DQN模型采取端到端学习,无需人工提取特状态和特征,而是通过不停执行动作动态生成训练样本,一旦训练出神经网络,便可以得到最优解。

在DQN基础上,又发展出一系列新的DRL模型,如DDQN。它利用两组不同参数分别评估最大Q值对应的动作和最优动作对应的Q值,通过将动作选择和策略评估分离,降低了过高估计Q值的风险,从而更准确地估计Q值。Hausknecht(2015)还提出了一种整合循环神经网络的DRQN算法[14],即在CNN卷积层之后加入LSTM单元,使模型具有长时间的记忆能力。

在交易层面,利用深度强化学习算法改进交易系统与人工学习股票交易的思路类似,都是通过不断试错实现更优的交易结果。虽然目前还没有证据证明机器自动化交易结果能够战胜人工交易,但从近年来深度学习在棋类游戏、电子竞技和无人驾驶领域取得的进展来看,未来这一领域仍具有相当大的发展空间。

四、总结和展望

深度学习为股票投资带来以下变化:第一,传统实证分析往往采用标准化、结构化的数据,而深度学习方法对实证数据来源有较大拓展,既能捕捉大量非结构化自然语言文本,如网络论坛、新闻媒体等,也能从全新视角利用已有数据,如股价图像数据等。第二,基于现有金融理论或投资经验的股价预测往往准确率较低,如随机游走理论认为股价是随机变化因而不具有可预测性,而基于机器学习和深度学习的股价预测模型往往能实现80%以上的预测准确性,如果能够证明这一预测结果具有普遍可靠性和稳定性,将改变现有投资策略,显著改善投资绩效。第三,深度学习能够改进现有交易系统,一是能够改善现有策略执行的准确性和稳定性,二是能够捕捉人工无法利用的微小、短暂价差,拓展股票投资盈利来源。第四,深度学习方法对人员要求进一步提高,需要相关人员不仅拥有丰富的金融理论及实践经验,更要能够把握各种深度学习模型的特点及适用性。

未来深度学习方法在股票投资中仍然具有广阔的应用空间:一是挖掘更丰富的数据来源。目前可以利用的数据主要还是结构化的价格、财务信息等,也有一些根据网络论坛和财经媒体信息编制的投资者情绪指数等,利用深度学习方法既可以利用现有数据构建综合指标,进行深入对比分析,也可以进一步挖掘书籍、档案、专利、卫星图像等非标准化数据,丰富股票投资可以利用的信息来源。二是与传统金融预测模型相结合,提升预测精度。虽然有效市场、随机游走等理论认为股票市场本质上不可预测,但因子模型、行为金融等新观点的出现也为股价预测提供了理论空间,将其与深度学习工具相结合进行股价预测,已逐渐成为目前的热点。三是改进现有交易系统。目前美国市场上大量基金公司已经采用计算机进行交易,以其高效精准的执行完成很多人工无法实现的交易,在此背景下,利用深度学习改进交易系统,优化交易执行将越来越受到关注。四是注重深度学习方法的理论解释。缺乏金融学理论基础的应用研究正如沙滩阁楼,其适用性和稳定性都存在疑问。随着对深度学习机制的挖掘,未来有望进一步夯实深度学习在股票投资应用上的理论基础。

猜你喜欢
深度预测模型
无可预测
适用于BDS-3 PPP的随机模型
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
四增四减 深度推进
自制空间站模型
深度思考之不等式
简约教学 深度学习
模型小览(二)