当前位置: > 股票>正文

华泰证券金融工程:基于回归法的基金持股仓位测算 基金持仓与股市

2023-09-07 02:18:41 互联网 未知 股票

华泰证券金融工程:基于回归法的基金持股仓位测算

【华泰金工林晓明团队】基于回归法的基金持股仓位测算

来源:华泰金融工程  林晓明团队

摘要

仓位测算的基本思路是基于日频基金净值和一级行业指数的回归

本报告探讨了几种基于回归法的基金持股仓位测算模型,是以基金的日频收益率作为因变量,29 个一级行业指数日收益率作为自变量,通过不同的回归方式对各行业变量前的回归系数进行拟合,再求所有回归系数之和,即得基金仓位预测值。我们对四种回归方式(主成分回归、逐步回归、岭回归、Lasso 回归)在普通股票型基金和偏股混合型基金的测试结果进行对比,发现Lasso 回归和逐步回归的预测精度较高,主成分回归稍弱,岭回归存在系统性高估现象。

主成分回归、逐步回归、岭回归、Lasso 回归均能缓解自变量共线性问题

基金仓位测算回归模型中,自变量组(29 个一级行业日收益率)存在明显的多重共线性,若直接采用普通最小二乘回归进行求解,则各行业变量前面的拟合系数会互相干扰,出现不合理的回归结果,并且共线性严重时回归方程无法通过数值方法求解。主成分回归可以将自变量组转化成互相正交的几个主成分;逐步回归可以选择一个自变量的子集进行回归;岭回归和Lasso 回归则是在普通最小二乘的损失函数基础上添加正则化项,使原本较为病态的回归问题可以正常求解。四种回归方式均能缓解自变量的多重共线性问题。

仓位预测效果:Lasso 回归和逐步回归较好,岭回归相对较差

在普通股票型基金和偏股混合型基金中,主成分回归、逐步回归、Lasso 回归的预测误差大多落在[5%,15%]区间范围内,Lasso 回归和逐步回归的结果稍好于主成分回归,岭回归则存在系统性高估的现象。岭回归与另外三种回归方法最大的区别是不存在降维行为,主成分回归是通过主成分分析法将解释变量降维,逐步回归和Lasso 回归的拟合结果中只有部分解释变量的回归系数不为零。岭回归的回归系数并不存在稀疏化特征,基本每个行业变量前面回归系数都不为零,我们猜测这可能是导致岭回归存在系统性高估现象的原因。

回归时间窗口长度敏感性:大于30 天预测效果平稳,但也不宜长于60 天

我们选取2017 年四季度末、2018 年一季度末、二季度末三个横截面,在普通股票型基金和偏股混合型基金中对四种回归方法进行时间窗口长度敏感性测试,将窗口长度从15 天到59 天进行遍历,发现大部分情况下,各方法的预测误差均值在窗口长度大于30 天之后比较平稳,趋于一个稳定的值,说明各方法的解已经收敛;在小于30 天时没有明显规律。因为回归系数的实际含义是过去一段时间窗口内基金仓位的平均状况,并用这个值代表我们对当前时刻基金仓位的预测值,所以窗口长度也不宜取得太长(一般没有必要超过一个季度,约60 个交易日),否则预测结果可能会滞后。

 

研究背景

基金仓位是指基金持有的股票资产占基金资产的比例。公募基金作为A股市场中重要的机构投资者,其持股动向一直受到市场关注。一方面,出于对基金经理投资能力的认可,股票投资人一般认为公募基金的仓位变动反映了市场投资情绪变化等关键信息;另一方面,基金投资人也会随时关注其持有的基金的仓位变动情况,辅助自己的投资决策。然而,公募基金只在每个季度末对其资产配置情况进行披露,这就使得投资者与基金管理者之间存在一种相对的信息不对称性。所以对基金仓位的测算研究成为一项有意义的工作。

目前常见的基金仓位测算方法主要基于传统意义上的指数模拟法,即运用基金净值数据和指数点位数据进行回归计算。理论意义上的指数模拟法可以选取单一指数,也可以选取复合指数为基准。对于单一指数,主要选取市场覆盖性强、具有代表性的单个指数,而复合指数通常选取一组代表不同投资风格的指数进行加权合成。本篇报告也依循这一传统测算思路,采取几种不同的回归方式,对普通股票型基金和偏股混合型基金进行仓位测算,并与真实结果进行比对,评价几种方法的优劣。

基金仓位测算方法

数据选取

我们使用29 个一级行业指数日收益率作为回归模型的自变量,基金的日频收益率作为因变量,通过几种不同的多元线性回归方式,进行基金仓位测算。

版权声明: 本站仅提供信息存储空间服务,旨在传递更多信息,不拥有所有权,不承担相关法律责任,不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请发送邮件至 举报,一经查实,本站将立刻删除。