数据挖掘技术在股价分析中的应用

2017-10-23 06:35
福建质量管理 2017年17期
关键词:山西财经大学决策树股价

(山西财经大学 山西 太原 030000)

数据挖掘技术在股价分析中的应用

张梦娇童盼

(山西财经大学山西太原030000)

随着我国经济体制改革的不断深化,资产证券化的步伐不断的加快,股票市场在资本市场中的重要性日益的突出,社会投资的模式也日益的增多,例如基金投资等等,人们的投资理念日益增强。从荷兰诞生最早的股份有限公司开始,人们就没有停止过对股票市场的探究,而探究的最终目的都是在降低风险的同时保证可观的收益,因此股票数据的分析预测具有很大的现实意义。随着经济理论以及数理模型的不断改革,各种预测方式和分析模型应运而生,投资者可以有更多的选择去运用自己熟悉的分析手段。近年来,随着数据挖掘理论的发展,大数据时代的爆发,证券市场的交易行为开始逐渐被纳入了大数据挖掘研究的领域。

数据挖掘;股价分析;决策树

一、问题分析

我国的股票市场起步较晚,但是发展迅速,电子信息化程度与国际接轨,积累了大量的金融数据。目前,我国股票市场发展良好,在三十多年的探索中不断地成熟起来,不断地改革,不断地创新。为了解决高度发达的金融市场和滞后的数据处理能力,有必要把数据挖掘技术引入到证券市场上来,把证券市场做大做强,使金融结构更加合理,市场更加智能化。数据挖掘技术的飞速发展,能够给股价的发展趋势预测插上飞翔的翅膀,它足以应付不断发展,不断产生大量数据的股市,能够解决投资者在投资过程中所面临的两大问题:买卖什么股票以及何时买进何时卖出。

二、数据收集与整理

从同花顺炒股软件中随机选取20只股票,对它们从2015年11月19日到2015年12月30日这一段时间内的34个交易日的数据进行区间统计处理,作为样本,进行决策树算法分析。

各个属性取值为:成交总量为(大,小)、换手%为(高,低)、成交方向(买入,卖出)、净大单量(多,少);股票价格的涨跌情况分为两大类:上涨幅度大于10%(Up)、下跌幅度大于-10%(Dn),其余的涨跌幅介于[10%,-10%]的设置为震荡类(Zd);成交总量分为两类:成交总量资金占总股本市值大于20%的为成交量大,小于20%的为成交量小;换手%分为两类:换手率大于50%的为高,小于50%的为低;成交方向分两类:净买入大于净卖出的标记为买入和净卖出大于净买入标记为卖出;净大单量分为两类:净大单总额占总市值大于20%的为多,少于20%的为少。随机抽取的20只股票训练样本集见下表1:

表1 训练样本集

三、数据分析

所以各分类对应信息熵的值为:

I(Up,Dn,Zd)=I(4,3,13)=-(0.2×log20.2+0.15log20.15+0.65×log20.65)=1.279

如此递归下去,最终可以得到一棵决策树,如图1所示:

图1 得到的决策树

由生成的ID3决策树来看,在某段时间,如果某只股票换手%比较高,同时主力成交方向为“买入”的话,那么这只股票的价格会上涨;反之,如果在换手%比较高,主力成交方向为“卖出”,而且净大单量小的话,这只股票的价格会下跌或者震荡。

四、分析结论

随着经济的发展和人们投资意识的转变,资产证券化将是未来投资的趋势,现如今股票投资己成为大部分人投资的一种重要手段,因此,股价走势预测方法的研究具有重要价值和理论意义。证券市场是一个非常复杂的系统,股票价格趋势的分析是一个极具难度和挑战性的课题。随着信息技术和数据挖掘技术的发展,越来越多的新算法及模型被应用于股市数据的分析,这些方法对降低股票投资分析的难度和增加股票投资的收益具有一定的参考价值。

[1]孙文高,刘剑桥.证券投资组合的风险与收益权衡[J].中国经贸,2014(14):131-131.

[2]王静红,李笔.基于决策树的一种改进算法[J].电讯技术,2004,44(5):175-178.

[3]张璐璐.基于关联规则的离群挖掘的研究[D].安徽大学,2007.

[4]张胜权.基于数据挖掘的股价走势预测[D].华中科技大学,2009.

[5]封俊国,严蜻,刘洪生.“大金融”战略下的金融学科建设研究[J].金融教学与研究,2013(5):62-64.

张梦娇,女,汉族,内蒙古乌兰察布市,硕士研究生在读,山西财经大学,风险管理。

猜你喜欢
山西财经大学决策树股价
山西财经大学
盘中股价升跌引起持股者情绪变化
山西财经大学会计学院第二届博士论坛召开
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
我国金融机构股价和主要财务指标的相关性分析
2016年山西财经大学会计学院学术论坛召开
股价创股灾以来新低的股票
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用