2015年第8期 信息通信 2015 (总第152期) INF0RMATIoN&COM^仉 IICATIoNS (Sum.No 152) 基于支持向量机的股票预测 刘廷 (山西师范大学经济与管理学院,山西临汾041000) 摘要:支持向量机(supportvectormachineSVM)作为一种可训练的机器学习方法,目前已广泛应用于股票预测中。文章 利用matlab和支持向量机,结合股票前一段时间的走势数据,做出数据回归拟合,得到训练模型,然后根据训练模型对 未来的股票指数做出预测,对预测数据和原始数据做一些误差分析。 关键词:支持向量机;matlab;泛化误差率;VC 中图分类号:F832.51;TP18 文献标识码:A 文章编号:1673.1131(2015)08-0015-02 Stock Prediction Based on Support Vector Machine Abstract:Support vector machine(support vector machine SVM)has been widely used as a training machine learning methods, stock prediction.Using Matlab and support vector machine,combined with the rtend data of stock some time ago,to make hte data regression,tobetrainedmodel,andthenthetrainedmodeltopredictfuture stockindexforecastdata andlaw datato do some erroranalysis. Keywords:Support vector machine;Matlab;Genelalization error rate;VC 1股票预测模型设计 (2)选择适当的正数£和C,选择适当的核函数k(x,)【I); 相对于大盘指数,对于个股的研究如果能够取得一定的成 (3)构造并求解最优化问题: 果,将会对投资起到非常大的指导性作用。因此,本文的研究 噼 毫 ‘一 ‘一 )} , )+ l ’+ 卜 I 一 )(1) 对象是我国股市中的个别股票(个股)。一般来说,每只股票, 它的某一天的收盘价,都与前一天的收盘价、前两天的收盘价、 s..t∑ 一啦 .J=o 前若干天的收盘价相差不大(除非前一天有分红、送股、配股、 除权、停牌等重大交易行情)。因此,可以认为:股票当天的收 0 , ‘s詈, 1,2,…,, 盘价,应是它的前一天、前两天、前若干天的收盘价的函数。故 得到最优解 : , ‘,…,_, ‘) ; 有如下预测模型。 (4)构造决策函数: 算法I.I(£一支持向量回归机,£.SVR) (1)设已知训练集 = , , ・, ,)々))E  ̄ry,其 厂 )=窆 ’一 , )+ (2) 中 ∈ =R ,Yl∈Y=R,i=1,2,…,,; (2)式中 按下式计算:选择位于开区间【o, J中的 或 (5)通过设置可以使协议转换器提供两种输出方式,一种 提高变电站数据共享应用,如图8所示。 为直接通过另一个串口用IEC60870-5-101协议输出,另一种 方式为通过网络口用IEC60870—5-104协议输出,输出方式根 据现场实际情况而定。 3.4整体传输特点 整体传输特点如下: (1)变电站原综合自动化通信单元无需做任何修改,依旧 采取原来的一路通信串口和配置。 (2)增加多路通信协议转换器,将变电站CDT规约远动 数据转换成一路CDT规约和一路104规约数据,并分别从串 图8 AVC共享协议转换器图 口和以太网口传输。 参考文献: (3)原有和县调度通信的网络系统不需要做任何更改,只 [1】谭文恕.变电站自动化系统的结构和传输规约[J】.电网技 需按照原串口的通信波特率重新配置转换器对应串口。同时 术,1998,22(9):1-4 根据传输需要还可重新调节串口传输的速率,主要和主站匹 [2】黄益庄.变电站综合自动化技术[M】.北京:中国电力出版 配即可。 社,2000. (4)和地调通信的另外一路数据通过协议转换器转成104 [3】孙军平,盛万兴,王孙安,等.远动信息网络传输方法[J】.电网 规约后,即可方便地通过调度数据网进行传输。此时需要配 技术,2002,26(10):4-8 置好该路以太网口的通信站点地址及端口号,一般选2404。 (5)还可以利用协议转换原理将变电站CDT数据转换给 作者简介:郭勇(1976-),男,江西九江人,工程师,主要从事电 站内AVC等智能自动化装置,大大简化变电站的硬件布线, 网自动化工作。 15 信息通信 ’刘廷:基于支持向量机的股票预测 预测方法的主要思想:本方法的主要思想是利用SVM ,若选择的是 ’,则: b=Yl一∑t -.一 -, )+£ (3) 回归,将所要预测的属性列作为因变量,其余的数据列作 为白变量,然后使用SVM工具箱进行模型训练,然后在此 训练模型下进行已知属性列的预测,回归,这样可以在已 知某天的其他属性列的情况下,对所需属性列进行预测, 回归。 i=1 若选择的是 ’,则 = 一∑ ‘一 ).i} , )一 (4) t=l 假设股票价格 ,Xt. 一,Xt-,n分别表示第t天、第扣l天、… 、第t-m天的收盘价。对于参数m的确定,可以采用最终误差 预报准则评价模型的预测误差,以当误差最小时来确定m。经 过查阅资料,确定m=5。 令输入为x= _l, _2,… 一5 ;输出为y=x :取1个连续 的样本构成训练集T= , )’ , )’…, , )】∈ ×】ry,其 中 ∈X= , ∈Y=R,i=1,2,…,,需找到y=f( )的关系,以 便预测 Z+1,I+2,…, 时的Y,其中n是预测长度。易 知这是一个典型的非线性回归问题,可调用算法1.1求解。 注意到,算出,( )后,可把X= ,xl ,…,Xl一. 。代入,( ),求得 夕=, )=x1 ̄,,即此时的 就是第f+1天的预测值。同理,令 = 小 ,…,xt, ,代入,( ),可得夕=, )= 依此类 推,不难求得 +4, 5,…, 。 令l=120,n=20,算法1.1中的c=20,e=O.1,核函数取径向 基核函数,随机选取1只股票,对它们的收盘价进行了预测, 并绘制了股票价格曲线,如图1。 薹一, o O 图1申能股份股票预测图 图l中,实线是实际值,虚线是预测值。从图2看,申能 股份的预测效果较为理想,预测曲线清楚地指示该股短期内 正处于下跌状态。 总之,当所预测的个股在未来若干天的价格平稳上升或 下降时,本文的方法预测效果较好,表明该方法对于这一类 股票有很高的投资价值;而当个股的价格在某些天突然快速 上升或下降时,预测曲线往往不能跟上这个上升或下降的速 度,影响了其正确性。但是,该方法还是能够描绘出实际股 票价格的大体走势如果能够描绘出未来若干天股票价格的 走势或者说是股票价格曲线的大致形状,那么即使预测出的 股票价格与实际股票价格有一定的出入,对于投资者来说也 会有很大的指导意义。从这个意义上来说,本文的个股预测 方法是可行的。 2基于SVM工具箱的股票预测方法 本文利用SVM建立的回归训练模型对每日上证指数进 行回归拟合,然后利用此训练模型进行每日收盘数的回归预 测,使得在股票预测方面具有实用价值。 16 愿蚰数据和圊归预删蜮舞对比 I—日一藤蛐撤 1 ・. .1—・r一嚼I茸飘潮觳掘I |} 嘲 _ . ’ £ 誉 枣 缸 …  -奠・而日 毛I瞳C2O12Ol 04,.2012 052a) 图2原始数据与预测回归数据之间对比 图2表示训练模型原始数据与预测回归数据之间的对比, 所得结果如下表1所示: 表1原始数据与预测回归数据之间的对比 8vM’教 打印方式 C g h岱幢 打印粗略 选|摹鳍果 256 饥O弦5 O伽ll77378 打印糟细 选舞结集 16 o.176777 nol研85S 由表1可看出SVM回归的各个参数值,同时误差量error =0.00194137,相关系数R=98.968%,SVM回归效果很好。 测试模型的运行结果: 十露艚数据I . —・ 一翻归霸嗣教摄l k、~ —三 一  .。 \\ 文易H天数 图3预测结果和真实结果对比 其预测结果和真实结果对比如表2示: 表2真实值和预测值对比 戢 来来第一茏 泰来第_=最 泰襄|I三天 束采集网天 束来第五天 藏啦身式 嗣试冀赛值 箱霉!’J譬‘ 2蛐4 S7 72.3 2373.44 23憾55 蔫试穗蠢健 2393l8 2384.8 2375 瑚_6 ∞l2-2 由表2中的真实值和预测值可看出SVM的回归预测效 果好不错,其误差error=0.00188072,不到0.2%,相关系数R =98.960%,因此我们可以根据某些天的其他属性,很快地预 测到所需属性的值。