• 1.摘要
  • 2.基本信息
  • 3.网格的数据管理
  • 4.网格数据
  • 5.网格数据管理的功能

网格数据管理

网格数据管理是专门的管理数据体制。

基本信息

  • 中文名

    网格数据管理

  • 属性

    专门的管理数据体制

  • 特性

    可复制可移动可压缩

  • 性质

    资源

网格的数据管理

数据是网格中的一种重要资源,具有可复制、可移动、可压缩、可加密等特性。网格上许多数据的数据量非常大,且通常为分布式存储,需要专门的管理机制来管理网格上的数据,如数据传输、数据存储、副本管理等。

网格数据

网格数据也是一种资源,但这种资源与其他网格资源相比,具有一些与众不同的特点:

(1)网格中数据的量是巨大的

网格计算,特别是数据密集型的众多科学和工程计算,通常会需要处理大量的数据,如美国宇航局的卫星每天都将处理和生成超过2TB的数据,全球气候变暖模拟实验也产生TB数量级的数据。另外,对于追求高精度的网格应用,如天气预报的计算、大型仿真计算等,为了提高计算问题的精度,就需要处理更大的数据量。

(2)数据资源是网格应用或程序之间联系的纽带

网格应用领域中的程序需要访问和产生大量的数据,不同的程序之间也需要传输大量的数据,以实现信息的交互和协调的工作。以天气预报为例,原始的数据来自各个地区观测台的实时观测数据以及某个数据中心的历史天气信息,它们经计算中心处理加工后,形成未来天气的预报信息,该信息数据再由发布系统发布给用户,如电视台、专业网站等。贯穿此过程的就是数据资源,包括实时观测数据、历史数据、预报数据,它们将观测系统、处理系统、发布系统联系起来,构成完整的天气预报网格应用。

(3)数据资源具有可无限复制的特点

只要通过合法的用户请求,网格数据资源就可以被复制成指定的多个备份。例如一份数字地图的数据,可以复制给多个使用者;或者是一类商品的类型、价格、销量等信息,可以在厂家、代理和销售商之间复制和同步。而其他类型的网格资源则不一定具有可复制的特点。例如硬件资源就无法复制,操作系统、应用软件及其许可证(License)也不应该被复制。

(4)数据资源具有特殊的存储机制

网格中的数据资源可以创建多个副本,并存于不同的地方,用户请求该数据时,网格管理机构在原始数据和多个备份之间选择合适的数据副本供用户使用。一个数据集也可以是地理上分布的,即一个数据集的多个部分存放在不同的地方,但对用户而言,看到的还是一个完整的数据集,请求使用时当作一个资源来请求,网格管理机构将分散的数据部分合理地组织起来交给用户使用。数据资源还是可被缓存的,用户使用数据资源时可以在本地或距离使用点近的范围中缓存该资源,当以后需要再次使用时只要访问本地缓存就可以了。

网格数据管理的功能

数据管理是网格系统中重要的模块,它要为网格用户提供透明地共享使用网格上存储资源和数据资源的手段,为用户提供透明地访问、存储、传输和管理数据的界面,使用户能够方便地实现数据共享。

(1)数据实例

网格中的数据可以用数据文件或数据库的形式存在,为了隐藏以不同形式存储的数据的具体细节,提供一个统一的接口,网格中引入了“数据实例”这个新的概念。数据实例是网格上数据管理的基本单位,它可以是一个数据文件或其中的一部分,也可以是一个数据库或其中的部分数据记录,还可以是数据实例的组合,通过数据实例的属性就可以访问相应的数据。

(2)数据传输

数据传输将数据从源节点传输到目的节点,这是网格数据管理的基本功能之一。用户作业所需的输入数据、应用运行产生的结果数据、交换运算过程中的中间数据都需要数据传输的支持。将数据下载到本地,然后开始应用是普遍可见到情况,在某些情况下,如因本地存储空间的限制而不能将所有数据下载到本地后再使用时,数据传输将会更加频繁。数据传输需要满足传输速度、数据完整性、容错性的要求。

数据传输可以在源节点和目的节点之间建立一条通路,完成所有数据的传输。为了提高数据传输的速度,可使用并行传输技术。这种方式在节点之间建立多个数据连接,在不同的数据通道上传输数据的不同部分。在源节点的发送能力和目的节点的接收能力足够的前提下,增加通路的数量,从而提高数据传输的速度。