计算机论文
数据提取技术可以显著提高数据访问速度
时间:2022-04-25 23:02 所属分类:计算机论文 点击次数:
引言
在移动计算环境下,网络的弱连接和低带宽使用户无法及时获取所需信息,尤其是查询位置相关数据(Locationdendendata、LDD)时,由于用户位置的变化,查询结果容易过时或不正确。数据提取技术可以显著提高数据访问速度,充分利用广播带宽[1]。
1基于价值的数据提取策略。
1.1位置相关数据的模型位置相关数据(LDD)是指取决于具体地理位置的数据,LDD具有特定的适用范围。
数据的有效范围区域(ValidScopearea)是指数据实例有效范围的几何区域。每个LDD实例都有一个特定的有效范围。只有在这个有效范围内,这个例子才是正确的。
数据距离(Datadistance)是指MC当前位置与数据实例有效范围之间的距离。
1.2CDP预取方法本文提出了CDP策略,预取时根据价值函数值进行选择。预取价值函数如下:Cost=Puseful×(benefit-penalty)(1)
(1)Puseful为MC访问LDD的概率,benefit为MC提取LDD的利益价值,penalty为提取LDD的惩罚代价。
1.2.1数据预取的奖惩代价数据提取到当地缓存后,并非所有数据都需要MC。用户需要经过计算和处理后能够有效查询的数据。只有这部分数据才能使MC的查询和访问受益。本文用fbenefit(di)表示提取数据di的受益价值函数,即MC未提取数据时的访问时间与提取数据时的访问时间的比例。
1.2.2访问LDD的概率主要基于MC通过该数据的有效范围和未来访问该数据的概率。因此,MC未来可能通过有效范围内的数据被列为候选集C。主要考虑以下两个因素:①从时间的角度的角度考虑。数据更新时间越长,服务器端数据更新导致预提数据故障的可能性越小;未访问的数据越长,再次访问的可能性越小。②从空间的角度来看。研究表明,在位置相关信息服务的数据访问中,MC沿移动路径通过的概率越高,数据越接近MC当前位置,数据有效范围区域的面积越大,或者越接近MC当前移动路径或移动方向的LDD越容易访问。
1.3选择预选数据的目标是在MC有限资源的前提下,使预选数据尽可能需要MC,并提供尽可能多的有效查询信息。
数据选择过程中应考虑以下两种情况:
①当S=0(缓存已满)时,无论C中是否有剩余未预取的LDD,都将停止预取。
②当0(缓存还有剩余空间)和size(i)>S时,应根据MC当前位置和缓存剩余空间计算应提取数据总量。
2.模拟实验和性能分析。
测试比较缓存中预取数据的命中率。测试的工作负载是一组随机生成的查询序列,由100个查询组成。每次查询生成的条件字段、条件值和数据表都是按照一定的规则随机生成的。MC缓存的大小分别设置为实验数据总量的10%、15%、20%、25%和30%。
3.结论。
在移动环境中,数据提取是有效提高访问速度和减少数据访问时间的可行方法。本文主要考虑了MC访问LDD的可能性概率以及每个数据能提供多少有效的查询信息,设计了一个提取价值选择函数,并在候选人中找到了提取数据。只要这些数据出现在广播通道中,它就会被提取到本地缓存。通过实验比较,CDP策略比DDP更有效地提高了缓存命中率。