http://www.number168.com

股票融跌涨幅的实证研究

  对影响股票融资跌涨幅的主要因素的研究,及对跌涨幅预测精度的提高,是融资领域中的一个重要内容,故本文对此展开相关研究。首先运用具有特征选取作用的Lasso模型对国内融资数据进行因素影响性分析,结果显示影响跌涨幅的主要因素为融资买入额、融资偿还额及融资余额。接着,本文在集成学习思想的基础上,运用方差倒数法对Lasso、XGBoost和随机森林进行模型赋权并线性结合,从而构造组合回归模型,提高了预测精度;最后通过评价指标RMSE和MAPE的对比发现组合模型较单项模型具有更强的稳健性和更高的预测精度。

 
股票配资
  从广义上讲,融资也叫金融,即货币资金的融通,事主经过各种方式到金融市场上设法筹集或贷放资金的行为。从狭义上讲,是公司筹集资金的行为与过程。总之,融资存在很大的风险,故如何分析影响股票融资涨跌幅的因素,为购买者提供良好的信息服务显得尤为重要。
 
  本文的实证分析分为两个阶段:阶段一,本文借助同时具有正则化和特征选区作用的Lasso回归模型对国内融资数据进行分析,探究影响股票融资涨跌幅的主要因素。阶段二,为充分发挥Lasso、XGBoost、RF三个模型的优势,基于集成学习思想,以SSE为衡量指标对三个模型进行赋权并线性结合,从而构造回归组合模型,以预测股票融资跌涨幅。
 
  二、相关理论与实证研究
 
  (一)数据选取与处理
 
  1.数据来源。本文采用的是股票代码为725的京东方A股票数据,来源于“狗熊会”官网中的“精品案例库”模块,共920个样本。
 
  因变量为跌涨幅,自变量为现价x1、融资余额x2、融资余额增速x3、融资买入额x4、融资买入额增速x5、融资偿还额x6、融券余量x7、融券卖出量x8。
 
  2.缺失值处理。在数据审核中发现缺失值样本仅占4.9%,缺失比例较低,故可直接进行剔除。
 
  3.归一化。由于数据集中各变量的量纲不一致,故需进行离差标准化(转换函数如下),将值映射到[0,1]之间。
 
  4.数据划分。在下文的模型训练中,为对模型的正确性进行检验,本研究将数据集分成测试集与训练集(比例为1:4)。
 
  (二)多重共线性检验
 
  多重共线性指变量之间具有高度相关的依存关系。在涉及经济的相关问题中,当多个自变量间相关性较强时,则认为违背了多元线性回归中的基本假定,此时经由最小二乘法得到的参数估计值不仅方差增大而且不稳定,易使模型估计失真。因此,在面对多元回归问题时应先进行多重共线性检验。
 
  由于本文的输入数据是一个八维向量,故需运用条件数法进行共线性诊断:设数据矩阵为X,若矩阵XTX的特征根至少存在一个近似为0,则X的列向量(自变量)必定存在多重共线性。下面的条件数公式可用于判断是否近似为0,
 
  同时也用于衡量多重共线性的严重程度:
 
  ·k>100:程度很小;
 
  ·100≤k≤1000:程度较强;
 
  ·k>1000:程度严重。
 
  借助R语言来计算条件数,结果为,即自变量间存在较强的多重共线性。故经典多元线性回归模型不再适用于本文所探究的问题,在下面的研究中本文选择了能克服这一缺陷的Lasso、XGBoost和随机森林模型。
 
  (三)因素评估:Lasso模型
 
  Lasso是一种收缩估计法,“在多重共线性的情况下基于惩罚函数筛选特征变量,通过压缩系数来提取有效特征并直接剔除高自相关变量以提高识别精度,增加模型的可解释性”。其基本思想是在其最小二乘的目标函数基础上加一个对系数的一阶惩罚函数,从而产生某些严格等于0的回归系数。Lasso估计被定义为
 
  t≥0是约束值(对回归系数βj的一范式惩罚),主要通过交叉验证法确定。
 
  本文借助R语言计算得到涨跌幅与各影响因素的关系:
 
  故影响股票涨跌幅的因素重要性排序为:融资买入额、融券余量、融资余额、融资偿还额、现价、融资买入额增速、融券卖出量。其中融资余额增速的回归系数为0,表示对跌涨幅几乎不产生影响。
 
  (四)涨跌幅的预测:回归组合模型
 
  1.XGBoost与随机森林回归模型。XGBoost是一种新型梯度提升的集成学习方法,可集成许多CART回归树模型从而形成一个强分类器,并在算法上做了改进以达更高精度。“Xgboost利用损失函数的二阶泰勒展开,同时添加正则项以衡量模型复杂度和损失函数下降程度,这在一定程度上避免了过拟合”。
 
  随机森林是一种基于分类树的集成算法,在机器学习中占有重要地位。其算法的基本原理是:在CART算法的基础上加入随机化特点,即在样本数据中进行随机采样,以生成大量分类回歸树,最后以投票方式产生结果。RF模型可以处理大量的、高纬度的定量或定性数据,且对缺失值和多重共线性不敏感,泛化能力强,相对其他算法有着很大的优势。
 
  2.回归组合模型。Lasso、XGBoost、RF是多重共线性回归问题中常用的三种模型,对数据的解释能力各有侧重点。在回归预测中通常借助某种评估标准进行模型对比与选择,但经此选出的单一模型并不代表一定优于其他模型。事实上,它们在回归领域中各有优势,相互之间也存在差异性不足,仅凭某一评估标准来选择模型并不是最优做法。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

  • 上一篇:金鹰小盘:股票配资不需要抵押随时可以入市?
  • 下一篇:【配资帝国】正反馈交易与账户杠杆