账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
漫谈网格资料库
 

【作者: 張東淼】2007年03月27日 星期二

浏览人次:【5155】

前言

资料库相关技术的发展,总是离不开资讯科技演进的影子,早在70年代的大型mainframe 时代,资料库总是隐身在大型主机身上;及至80年代的PC盛行,资料库系统也随之现身在各式PC的身上。当物件导向技术逐渐走向成熟时,资料库系统也跟着这股浪潮,推向物件的世界。90年代是一个属于网际网路的时代,各式各样的应用都搬到了虚拟网路的世界,资料库也不例外地加入了这股无法抵挡的趋势;而其中网格运算( grid computing )更是扮演举足轻重的地位。诚如Wells(1) 所言,网格运算即将改变人们使用电脑的方式,亦即,今日电脑可以透过网际网路各自交换资讯,在可预见的未来,网格将会是个虚拟网路中的池子(Pool),提供足够的计算能力,来解决许多目前仍无法顺利进行的大量运算问题。 当然,以往常见的计算机科学概念,移到网格的世界之后,亦会有另一番新意。


若单从资料库技术发展及应用也会发现遵循着相同的足迹,从早期的各式资料库模型到80年代盛行的关联式资料库(RDBMS)以及物件导向式资料库(ODBMS),都可看出与资讯科学、程式语言发展密不可分的关系。在网格运算的世界里,这些资料库的基本元素也有了不同的诠释,尤其是平行运算所强调的工作(job)化为许许多多同步进行的次工作来完成的特性,大大提高了资料的独立性(data Independence)。因此,不论是储存的实体或是存取的方式都有着不同以往的面貌。以下将从硬体元件及软体发展,两个不同的面向,来介绍网格资料库所应俱备的各式元素。


网格资料库的硬体基石:平行运算及网格环境

谈到网格资料库,就不得不聊聊平行运算,因为这正是建立网格资料库的基石。平行运算的概念,也是来自硬体的发展;当硬体的开发日渐成熟,人们就希望在同样的时间单位,PC能多做点事,其中有两种方法可以达成目的,其一是增加运算能力,例如提高CPU 时脉及汇流排速度等;另一方面则可以利用平行运算的方式,让更多机器在同一时间内共同工作。显然地是后者在硬体开发成本上是比较占优势的。


平行运算的发展已有一段时日了,早些年多是在科学计算上,尤其是需要大量运算方面,如天气资料或天文资讯的计算等。随着PC的日渐普及,这些以往只能在超级电脑上才能进行的工作,也逐渐藉由平行运算的建置,转移至小型PC上;因此,常听到一些丛集电脑(clustering PC)的平行运算能力,大大超越传统的超级电脑的消息。不过这些例子都只集中在某些特定的应用范围,与一般大众比较难有交集。直到90年代末期,网际网路的兴起,一种架构在平行运算之上的 网格运算(grid computing)环境被提出,大家才真正感受到平行运算所带来好处。所谓的网格是指一架构在网路基础上的完全分散式系统,其系统不但可以横跨各个不同的网路域(domain),也可以容纳各种不同的硬体主机系统,而其上所提供的应用是以服务(service)形式存在,不论使用者或所需之资源都可动态分配;亦即这是一种非常有弹性的机制,可以根据使用者的需要及网路状况,以及其使用权限而授予可用之资源。所以,网格所带来的使用环境,早已超越先前平行运算所能提供的。对企业而言,网格不但能提供大量运算所需的计算能力,也可以以其建立虚拟平台,整合更多的硬软体资源,提供单一使用介面,让应用可扩及相关的企业伙伴。当然,在学术研究上的工程及科学计算方面,网格更是最佳的大型问题解决工具。


然而人们真正看到网格的能力,是在P2P 资料分享机制的出现。 P2P 一开始仅是网路上音乐档案分享的机制,伴随的是Napster 及Gnutella 两个档案分享模式,虽然Napster 因智财权的问题而关闭,但其所提出的分享平台,却如雨后春笋般的在网路世界出现,近来,人们也渐渐能接受这种分享机制,也看到了网格所能展现的无远弗届的传播能力。其实,这只是网格世界的冰山一角,尤其是在硬体建罝成本逐年下降之后,网格的硬体环境日趋成熟,网际网路更是架构了一个虚拟的网格世界;目前已有愈来愈多的应用,转移至网格的平台来使用。除了上述的档案分享之外,Skype 亦利用相同的网格概念,来传送语音资料;电玩公司亦走相同的分享机制来建立庞大的线上游戏世界。


网格资料库的软体之路

光有硬体的支援,并不足以支撑起网格资料库系统;上节所谈的硬体发展,只是资料库系统最底层的硬体储存单位,完整的资料库系统则包含了资料结构、操作命令、安全管控以及储存元件等部份。在资料库技术的发展历史中,资讯科技一直扮演重要的推手。其中最重要的改变是在70年代初期,Dr. Codd 所提出的关联式资料库的概念,在此之前有关资料库的理论与实作,都是以作业系统的档案结构,当做建构资料库的基础单元;而有了关联式资料库的理论架构之后,资料库有了长足的进步,资料存取单元也从实体档案结构,转成以表格(table)当作最基本的结构。此一转变不但让资料库系统的发展,逐渐摆脱硬体制造厂商的束缚,也让资料库系统找到了一更宽广的发展空间。从大型主机到桌上型PC都有相应的资料库可资利用,而在企业界的应用,更是扩及各行各业。


此后资料库技术的发展,则与程式语言的演进有了更密切的关联。例如当物件导向程式语言发展成熟,资料库系统也从关联式资料库转进到物件导向式资料库。其中最主要的变革是资料结构导入物件的观念,以及资料存取操作命令的改变,都让资料的存取更有效率。当然,硬体的发展仍旧提供了最佳的支撑力量,尤其是储存媒体的开发与储存空间的倍增,都让资料库有更大发挥空间;不过,网路技术的发展则让资料库系统有了不一样的面貌,以往的资料库系统,都与硬体、作业系统息息相关,有了网路之后,人们开始有分散风险的想法,当然资料库系统也从中央控制逐渐走向分散式的架构。此种分散式架构渐渐蔚为主流,其中又因平行运算技术的出现,更让资料库技术的开发活络了好一阵子,各种不同的平行化理论及其实验性平台,都一一出现在学术研究及市售的系统中。


直到90年代网际网路的出现,资料库系统又注入了新的元素,这也是本文所要谈及的网格资料库。网格的发展当然是如上述硬体及网路技术的更新,不过要落实到资料库系统之中,仍有许多必须考量的因素。


网格资料库的建置

网格运算的环境所强调的即是,完全的分散式俱弹性的资源共享机制;然而对资料库系统而言,所要求的不仅仅是将资料单元,当做物件分散到网路上而已,还必须考虑使用者权限、系统安全以及查询效率等等因素。上一节所提及的平行运算即是提升系统效能的最有力工具。但是若只做到平行运算的要求,也仅是平行运算资料库系统而已,并不能发挥网格的特性。若要完全运用到网格的能力,就必须做到分散式资料库才行。以下是 Wells(1) 所提出的12项分散式资料库应俱备的要求:


  • ●Local autonomy


  • ●No reliance on a central site


  • ●Continuous operation


  • ●Location independence


  • ●Fragmentation independence


  • ●Replication independence


  • ●Distributed query processing


  • ●Distributed transaction management


  • ●Hardware independence


  • ●Operating system independence


  • ●Network independence


  • ● DBMS independent



从上面的要求项目中,可以看出网格环境所强调的是分散、自主的精神。所以要打造一个网格资料库系统,的确存在一些门槛;并不是换换资料库系统或是更新一些硬体设备即可达成的。若一切都是从头建立,那也许是最简单的解决方式,问题是有许多的硬体早已购买,也有许多资料库系统早已上线服役多年,并不是用汰换的方式可以解决的。如何整合现有的系统,遂成为近来学术研究的热门题目。为了有效解决此问题,于是有了 OGSA-DAI(Open Grid Services Architecture


Data Access and Integration)中介软体整合介面的提出。这是一个介面整合的框架(Framework),亦即任何有心想在现有系统中发展网格资料库系统的,都可根据这个框架来自行开发相关程式。以下(图一)与(图二)即是此整合介面的示意图。



《图一 整合接口的示意图(1)》
《图一 整合接口的示意图(1)》

《图二 整合接口的示意图(2)》
《图二 整合接口的示意图(2)》

由于这是个中介软体是采开放式的架构,所需的相关开发工具,可从网站上自行下载安装。这个中介软体也使用了许多开放原始码(open source)程式,所以使用者可自行依本身的硬软体配置,自行撰写或修改程式,以符合本身的系统需求。


结语

随着资讯技术的不断演进,资料库系统一直扮演着重要的角色;在进入网际网路的新世代,资料库及其应用依然有着鲜明的标记。在可预见的未来,无论是透过何种机制来整合旧有的资料库系统,或是利用更先进的资讯通讯技术,网格资料库系统及其相关技术,无疑是未来发光发热的明日之星。 (作者为玄奘大学资传所助理教授)


(资料来源:参考文献


Wells, April J. ,‘Grid Database Design’, Auerbach Publications (2005)


Xiufen Lu et al, ‘Research of the Access and Integration of Grid Database’, ‘Proceedings of the 10th International Conference on Computer Supported Cooperative Work in Design’ (2006)


http://www.ogsadai.org.uk/) (HTTP://呜呜呜.喔跟蔡岱.org.UK/))


相关文章
Android装置多核心系统设计策略
多核心计算机带来软件应用的困扰
伺服器系统大吹多心风
多核心服务器处理器架构介绍(下)
多核心伺服器处理器架构介绍(上)
comments powered by Disqus
相关讨论
  相关新闻
» 中华电信拓展数位签章应用 促进服务更便捷安全
» 趋势科技网路资安平台扩充AI辅助功能 防止遭误用与外部滥用
» 远传电信营运每年减碳5万吨 获施耐德电机永续发展影响力奖肯定
» 宜鼎推出 iCAP Air 智慧物联空气品质管理解决方案 透过即时空品数据自主驱动决策
» AI人工智慧再升级 探究国际网路社群治理层面


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK85E4J6V1OSTACUK0
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw