基于行业关联网络的行业集群划分与应用

基于行业关联网络的行业集群划分与应用

王海WangHai;韩伯棠HanBotang

(北京理工大学管理与经济学院,北京100081)

(SchoolofManagementandEconomics,BeijingInstituteofTechnology,Beijing100081,China)

摘要:基于改进的时间序列相似性度量构建行业关联网络,运用最小生成树算法简化网络结构。通过对中国股票市场进行实证研究,考察网络结构得到行业群的划分,并通过统计得到行业群在不同经济周期阶段下表现的一般规律,为战略性行业配置和投资决策提供有价值的参考信息。

Abstract:Anewapproachisproposedtomeasurethesimilarityoftimeseries,andacross-sectorinterdependencynetworkisbuilt.ThenetworkstructurecanbesimplifiedandanalyzedbasedontheMinimumSpanningTree(MST)algorithm.Hence,thesectorrotationstrategiesindifferentperiodsofbusinesscycle,andrelatedspecificapplicationscanbestudied.Sectorclusterscanprovideabasisforstrategicsectorallocation.Thepaperissupposedtopresentreferencedmethodstoclassifyrelatedsectors.

关键词:网络分析;行业指数;行业集群;经济周期

Keywords:networkanalysis;sectorindex;sectorclusters;businesscycle

中图分类号:F830.91文献标识码:A文章编号:1006-4311(2011)07-0123-03

0引言

近年来,行业分析及行业配置在证券投资基金的投资组合管理中得到了广泛应用,但主要集中于定性的研究,而定量的研究较少。分散化的投资思想认为,适当加入一些与其他资产相关度较低的资产能够降低投资组合的风险;而集中配置大量相关性较高的行业则可能导致系统风险的增大。因此,进行行业配置时,首先应按照行业的收益与风险特征,将其分成行业集群,这样可以对同一行业群在宏观层面进行分析。例如,研究在经济周期的不同阶段行业群的表现是否具有规律性,不同行业群对宏观经济变量的敏感度是否不同;也可以在需要分散系统风险时,避免配置于相似性较大的行业。在投资实务界,不同的机构会根据不同的行业分类标准编制行业指数,行业指数是投资界重要的市场表征和投资参考。但是由于各种分类方法不尽相同,按照不同的分类标准,会产生很多细分行业且有交叠。

学术界和投资界通常依据行业对于经济波动的敏感性将行业分为三类:周期性行业、防御性行业和成长性行业。周期性行业的景气周期变化与经济周期密切相关;防御性行业的产品需求弹性小,其经营状况在经济周期的上升与下降阶段较稳定;成长性行业的景气周期变化与国民经济整体的周期变化并不密切相关。国外一般将行业划分为增长敏感型、利率敏感型和价格敏感型三大类。而我国政府投资、出口和消费升级是经济增长的三大主要动力,利率、汇率和部分商品的价格是受管制的,行业群的划分也可以按行业敏感性因素,将上市公司所属行业分为收入敏感型、支出(投资)敏感型和对世界经济冲击敏感型三大类。以上的分类方法考虑的角度不同,分类的结果也不同;而且有些具体行业属于国民经济统计中的分类,有的行业细分类别不属于同一层次的行业划分。实体经济中的行业与证券市场中的行业并不一致。

对于战略性的行业配置,应该对已有行业指数进行大类的划分。若有一个较理想的方法进行行业群的划分,则在进行行业配置时可以考虑行业群的特征,为投资管理提供指导。本文内容的研究,跳过了行业盈利能力等基本面分析,从证券市场的行业表现出发,考虑收益与风险特征划分行业群,以期为战略性行业配置提供依据。

1文献回顾

近年来,国内外学者对于利用网络工具分析证券市场的研究取得了一些开创性的成果。Mantegna(1999)[1]引入最小生成树(MinimumSpanningTree,MST)方法,以个股为网络节点,个股间的关联为边,聚类分析了S&P500中的股票,从而创造性的提出了用网络方法解析股票关联性的途径。Micciche等(2003)[2]以纽交所93只股票在12年间的股价为研究对象,比较了以股票收益率和波动率建立的两个关联网络,重点分析了节点度的分布;Bonanno等(2004)[3]通过研究个股股价两两之间在某段时间内的波动相关系数,建立了一个复杂网络用以描述股价关联特征。由于关联网络的边描述的是个股之间的关联关系,在最初构建的网络中,所有节点均两两连接,通常会有很多边并非代表股票间真正的关联关系,因此需要从所有边中选出有实际意义的边构成真正的关联网络。对于全连通的网络图,用最小生成树来简化结构往往滤掉过多的边而损失了有价值的关联信息。Tumminello等(2005)[4]用平面最大过滤图法来解决这一问题,它所构建的网络呈现的拓扑结构比MST更复杂。

我国学者也在相关领域有一定的研究,庄新田等(2007)[5]以上海交易所持续交易的个股为样本,基于相关系数建立网络,研究了上交所个股的波动特征。黄纬强等(2008)[6]运用最小生成树法和平面最大过滤图法构建我国上证180指数和深证100指数相应的股票关联网络,有效地挖掘了股票聚类结构信息。这些股票网络中节点间距离是基于股票序列间相关系数的度量,任意两只股票的距离共同组成了距离矩阵。但是上述方法只考虑了收益率的相似性,而没有考虑风险的相似性。

2行业关联网络构建方法

在构建行业关联网络时,考察的对象是行业指数。因此将每个行业作为一个节点,将行业之间的相关性度量作为具有权重的边,由此所构建的行业关联网络为无向加权网络,网络所有生成树中权值之和最小的生成树称为最小生成树。Kruskal提供了一个求无向连通网络G=(V,E)的最小生成树的算法。其基本思想是将网络G的所有边按权值从小到大排序,然后依次考察每条边作为最小生成树T的候选树枝,如果某条边不与已经选中的边构成回路,则合乎要求,否则就被放弃而考察下一条边,直到所有的边考察完毕,或更简单地,只要T中已经有V-1条边即可终止算法。

前人的研究中,网络构建一般采用Pearson相关系数作为收益率序列相似性的度量。本文在此基础上,同时考察行业指数的系统性风险以及收益波动的相似性。所谓系统性风险是指资产受宏观经济、市场情绪等整体性因素影响而发生的价格波动。贝塔系数又称系统性风险系数,是资产或资产组合系统性风险的度量。贝塔系数来源于资本资产定价模型CAPM[7],CAPM模型的核心思想是当证券市场处于均衡状态时,资产的预期收益率等于无风险利率加上风险溢价,即E(Ri)=Rf+βi(E(Rm)-Rf),其中E(Ri)表示第i种资产或者资产组合的预期收益,Rf表示市场无风险收益率,E(Rm)表示市场组合收益率,βi表示第i种资产的贝塔系数。GARCH模型主要针对时变波动率进行建模[8],GARCH类模型已经在理论研究和实证研究中得到了相当广泛的应用,在目前的波动率模型中占据着重要地位。

基于以上风险和波动性的度量,本文提出新的时间序列相似性度量方法。同时考虑序列收益的相关性、序列风险的相似性,以及序列波动性结构特征的相似性,分别利用原有的Pearson相关系数、贝塔系数的欧式距离、以及基于GARCH模型的波动率估计参数进行度量,具体说明如下。

(1)若x,y为两个指数收益率序列,则Pearson相关系数计算为:其中-1≤ρ≤1。因为相似性越高,则对应二者之间的距离应该越小,为了将距离度量与相关性统一,定义距离为:

(2)

(2)计算行业收益序列的贝塔系数,分段进行平均,计算其欧式距离。

(3)

(3)对收益率序列进行GARCH(p,q)的波动率拟合,其方差方程为:

(4)

分别为x和y序列的参数向量;Vx和Vy是估计参数的协方差矩阵,定义时间序列波动性相似性度量的距离为[9]:

d3=(Lx-Ly)′V-1(Lx-Ly)(5)

其中,V=Vx+Vy,这个定义满足距离的三个约束条件:

1)d(x,y)?叟0;

2)如果x=y,则d(x,y)=0;

3)d(x,y)=d(y,x)。

本文将上述三个距离进一步归一化,取三个距离的均值作为时间序列相似性的最终度量。

3实证分析

本文选取申银万国一级行业指数,进行行业关联网络的构建,并利用MST算法简化网络,样本区间为2005-1-4至2009-12-31。为了比较本文提出的时间序列的相似性度量,文中分别给出利用原有度量方法和新方法产生的网络图,如图1和图2所示。

从网络的结构看,用原有相似性度量生成的行业关联网络图上,与机械设备行业关联性较大的行业比较多,并没有充分的形成分类;而改进后的网络图上,相似性较大的行业群分布较均匀。对于生成的无环网络图,去掉n条边,可以将最小生成树变成n+1个独立的树,从而形成聚类。其中,我们可以明显观察到四个行业群的存在,行业分类结果如表1所示。该分类方法是基于相似性的度量,将相似性最近的行业划归为一个行业集群。

将行业按其收益与风险的特征相似性进行归类,也可以分析其在经济周期下的行业轮动的一般规律。为了检验以上分类的行业群在不同经济周期阶段的表现,本文分阶段统计不同行业的累积收益,并按高低顺序排列。从行业群中各个行业的收益表现可以得到以下结论:在复苏周期,强周期行业群表现最好,中周期行业群和轻工业居中,消费类表现最差;在过热周期,强周期行业群表现最好,中周期行业群居中,消费类和轻工业表现最差;在滞涨周期,消费类和轻工业表现最好,中周期行业群居中,强周期行业群表现最差;在衰退周期,中周期行业群和消费类表现较好,轻工业和强周期行业群较差。当经济发展处于不同阶段时,不同行业之间可能会表现出相互各异的业绩;宏观经济事件的发生也会对各个行业产生不同的影响。因此,把握住经济周期的脉搏,进行动态的行业配置或者行业轮动策略会创造出客观的超额收益。

4结论

文中提出了基于改进的时间序列相似性度量方法的行业关联网络分析,通过最小生成树算法简化网络的结构,得到行业群的划分。利用我国证券市场上的行业指数进行实证研究,并对不同经济周期阶段下的行业表现进行统计,得到行业群在不同经济周期阶段表现的一般规律。

从资产配置的视角看,本文讨论的问题属于战略性行业配置方法,在一个较长期的投资期限上更有意义。行业聚类方法综合考虑了行业的收益、风险等因素,能对不同行业在相同经济环境下的表现进行有效的分类。该行业分析方法既能反映各个经济发展阶段中行业间业绩表现的相近程度,又能较全面地刻画行业收益率间的相互关系,从而为投资决策提供有价值的参考信息。

参考文献:

[1]Mantegna,R.N.HierarchicalStructureinFinancialMarkets[J].TheEuropeanPhysicalJournalB,1999,1(1):193-197.

[2]Micciche,S.,Bonanno,G.,Lillo,F.,etal.DegreeStabilityofaMinimumSpanningTreeofPriceReturnandVolatility[J].PhysicaA:StatisticalMechanicsandItsApplications,2003,384(1/2):66-73.

[3]Bonanno,G.,Caldarelli,G.,Lillo,F.,etal.NetworksofEquitiesinFinancialMarkets[J].TheEuropeanPhysicalJournalB,2004,38(2):363-371.

[4]Tumminello,M.,Aste,T.,Matteo,T.D.etal.AToolforFilteringInformationinComplexSystems[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2005,102(30):10421-10426.

[5]庄新田,闵志锋,陈师阳.上海证券市场的复杂网络特性分析[J].东北大学学报:自然科学版,2007,28(7):1053-1056.

[6]黄玮强,庄新田,姚爽.中国股票关联网络拓扑性质与聚类结构分析[J].管理科学,2008,21(3):94-102.

[7]Sharpe,W.F.CapitalAssetPrices:ATheoryofMarketEquilibriumunderConditionsofRisk[J].JournalofFinance,1964,(19):425-442.

[8]BollerslevT.AGeneralizedAutoregressiveConditionalHeteroske-dasticity[J].JournalofEconometrics.1986,(31):227-307.

[9]Caiado,J.,Crato,N.&Pena,D.Comparisonoftimeserieswithunequallengths,manuscript,2007.

基金项目:国家自然科学基金项目(70973011);北京市重点学科建设项目。

作者简介:王海(1980-),男,吉林蛟河人,博士研究生,研究方向为决策理论与方法、金融数量分析、风险管理。

标签:;  ;  ;  

基于行业关联网络的行业集群划分与应用
下载Doc文档

猜你喜欢