王盛明①WangShengming;卢秉亮②LuBingliang
(①沈阳航空职业技术学院,沈阳110034;②沈阳航空航天大学计算机学院,沈阳110136)
(①ShenyangAviationVocationalTechnicalCollege,Shenyang110034,China;
②CollegeofComputer,ShenyangAerospaceUniversity,Shenyang110136,China)
摘要:基于LDD的预取策略如DDP考虑了数据距离,但是没有考虑数据的访问概率和更新频率和数据大小,针对以上问题提出基于价值的数据预取(CDP)策略,一些重要的数据预取因素如访问概率、更新频率、数据项大小、数据距离和有效范围等都包含在价值函数里,根据价值函数值的大小来选择被预取的数据。通过实验对比,CDP比DDP策略更有效的提高缓存的命中率。
Abstract:LDD-basedprefetchingstrategieslikeDDPtakethedatadistanceintoaccount,butdonottakeintoaccounttheaccessprobabilityofdata,updatingdataandsizeoffrequency.Fortheseissues,thispaperproposesavalue-baseddataprefetching(CDP)strategy,andsomeimportantdataprefetchingfactors,suchasaccessprobability,updatefrequency,dataitemsize,datadistanceandrangeofdataareincludedinthevaluefunction.Wecanchoosetheprefetchingdatabasedonthesizeoffunctionvalue.Bycomparingtheexperiment,CDPismoreeffectivethanDDPstrategytoimprovethecachehitrate.
关键词:位置相关信息服务;位置相关数据;数据预取;缓存命中率
Keywords:location-dependentinformationservices;locationdependentdata;dataprefetching;cachehitratio
中图分类号:TP39文献标识码:A文章编号:1006-4311(2011)10-0152-02
0引言
移动计算环境下,网络的弱连接、低带宽使得用户而无法及时获取所需的信息,特别是查询位置相关数据(LocationDependentData,LDD)时,容易因用户位置的改变而导致查询结果过时失效或者不正确。而数据预取技术能够显著提高数据访问速度和充分利用广播带宽[1]。
1基于价值的数据预取策略
1.1位置相关数据的模型位置相关数据(LDD),是指其值取决于具体地理位置的数据,LDD具有特定的适用范围。
数据的有效范围区域(ValidScopeArea),是指数据实例有效范围的几何区域。每个LDD实例有一个特定的有效范围,只有在此有效范围之内,该实例才是正确的。
数据距离(DataDistance),是指MC当前位置和数据实例有效范围之间的距离。
1.2CDP预取方法本文提出CDP策略,预取时根据价值函数的值进行选择,预取价值函数如下:Cost=Puseful×(benefit-penalty)(1)
式(1)中Puseful为MC访问LDD的概率,benefit为MC预取LDD的获益价值,penalty为预取LDD的惩罚代价。
1.2.1数据预取的奖惩代价数据预取到本地缓存后,并非所有的数据都是MC需要的,经过运算处理后能成为有效查询的数据才是用户需要的,只有这部分数据才能给MC的查询访问带来获益。本文用fbenefit(di)表示预取数据di的获益价值函数,即MC未预取数据时的访问时间与预取数据时的访问时间减少的比例。
1.2.2访问LDD的概率对于MC访问某一种LDD可能性的概率,主要以MC经过该数据有效范围的概率和未来访问该数据的概率为依据,因此把MC将来可能经过有效范围内数据列为预取的候选集C。主要考虑以下两点因素:①从时间的角度来考虑。越久未被更新的数据,说明其因服务器端的数据更新而导致预取数据失效的可能性越小;而越久未被访问的数据说明其比较陈旧,再次被访问的可能性就越小。②从空间的角度来考虑。研究表明,在位置相关信息服务的数据访问中,MC沿着某条移动路径通过的概率越高,数据距MC当前的位置越近,且数据有效范围区域的面积越大,或者越靠近MC当前移动路径或移动方向上的LDD越容易被访问。
1.3备选预取数据的择取数据预取的目标是希望在MC有限资源的前提下,使得所预取的数据尽可能都是MC需要的,并且尽可能多的提供有效查询信息。
在数据择取过程中应考虑以下两种情况:
①当S=0(缓存已满)时,不论C中是否有剩余的未被预取的LDD,都将停止预取。
②当0<S(缓存还有剩余空间)且size(i)>S,则根据MC当前位置和缓存的剩余空间来计算应预取数据总量的大小。
2模拟实验及性能分析
实验以预取数据在缓存中的命中率为指标进行测试对比。测试的工作负载为一组随机产生的查询序列,由100个查询组成,每次查询生成的条件字段、条件值和数据表都是按照一定的规则随机产生的。将MC的缓存的大小分别设置为实验数据总量的10%、15%、20%、25%、30%时分别进行五组实验,实验结果如图1所示。
3结论
在移动环境中,数据预取是有效提高访问速度和减少数据访问时间的一个可行办法。本文主要考虑MC访问LDD可能性概率以及每一种数据能提供多少有效查询信息,设计出一个预取价值选择函数,在候选集中找到预取数据,只要这些数据出现在广播信道,就预取到本地缓存。通过实验比较,CDP策略比DDP、DHP策略更有效的提高了缓存命中率。
参考文献:
[1]李国徽,杨兵,陈辉,等.移动环境下支持实时事务处理的数据预取[J].计算机学报,2008,31(10):1841-1847.
[2]YinL,CaoG.Adaptivepower-awareprefetchinwirelesanetworks[J].IEEETransactionsWire1essCommunications,2004.3(5):1648-1658.
[3]JiangZ,KleinrockL.Webprefetchinginamobileenvironment[J].IEEEPersonalCommunications,1998,5(5):25-34.
[4]PersoneVDN,GrassiV,MorlupiA.Modelingandevaluationofprefetchingpoliciesforcontext-awareinformationservices[C].Proceedingsofthe4thAnnualInternationalConferenceonMobileComputingandNetworking,1998:55-65.
[5]ZhengB,XuJ,LeeDL.Cacheinvalidationandreplacementstrategiesforlocation-dependentdatainmobileenvironments[J].IEEETransactionsonComputers,2002,51(10):1141-1153.