账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
低容量快照实现资料库应用快速回复
网路与储存技术专栏(9)

【作者: LSI】2009年09月04日 星期五

浏览人次:【11044】

现今仍有许多企业组织无法分清楚「业务永续」和「灾难复原」机制的差别。业务永续机制指的是藉由为系统架构加上足够的抵抗力,来确保其在某些单点错误发生时,公司业务能持续活动下去。灾难复原机制则是确保资料回复点(Recovery Point Objective;RPO)及系统回复时间点(Recovery Time Objective;RTO)确实地存在系统架构之中,使受损的资料能顺利地在某个时间点上被复原。



对企业而言,若采取传统的资料备份与复原方法,将造成业务损失与人力工时的浪费,使得RPO与RTO成为高成本的策略。为了应付不断变化的企业需求以及快速成长的资料量,业界必须发展更多新方法,以满足使用者立即备份的需求。



本文将讨论运用LSI StoreAge SVM快照强化应用复原解决方案与其他方案的比较,并说明此技术能如何提高效能、资料完整性,以及达成更快的复原速度。



各种快照技术剖析


现今业界已有许多种快照与远端备份技术,不过仅提供在储存阵列内部的快照功能,或为资料管理者提供主机层级的快照功能,借以减少资料备份的窗口。几种常见的技术如下:



写入即复制(Copy on Write;COW)快照


主机层级快照利用卷册管理员(Host Volume Manager)来管理快照,并提供一些方式让备份代理程式将资料传送到备份伺服器。这可让备份代理程式暂时停止资料库的运作,并在将档案系统复制到磁碟里的同时产生卷册快照(Volume Snapshot)。接着,使用者可以在备份代理程式上检视这份快照,并透过串流模式在区域网路上传送。这项解决方案在资料被传送到磁碟时,将会使资料库暂时中断数秒,然后才回复到正常运作。



业界称上述方法为「写入即复制(COW)」,因为当快照在卷册上运作时,若要改变资料模块,必须先将其读取与写入快照,然后才能完成原始资料的写入。但是如此一来,系统必须承担效能下降的风险,而可以想见地,在一些高负载的系统上,这将会严重影响效能表现与终端使用者经验,特别是当备份代理程式还同时透过串流模式在传送资料。也因此,不管什么时候,COW都限制了快照的数量。



许多主机外的快照是在磁碟阵列中所进行的,因此能间接减轻资料库伺服器在执行COW时的负担。此种方法的另一个优点是快照复本可直接储存于备份伺服器,因此不需要透过额外伺服器或区域网路就能进行备份。不过,这项解决方案势必会增加磁碟阵列控制器的负荷量。在每一个逻辑装置(Logical Unit Number;LUN)中,控制器的负荷主要来自COW所产生的快照副本,而主机的庞大流量则使其雪上加霜。



虚拟化储存能将快照技术与储存网络系统(SAN)做连结,然而缺点是许多采用COW的解决方案都会大量增加系统的负担。在很多情况下,即使只使用了基本的卷册管理功能,都需要庞大的CPU运算资源与具备大容量的快取次系统的支援。



写入即导向(Redirect on Write;ROW)快照


除了上面提到的COW之外,还有一种常见的高扩充性区块层级快照技术,称作「写入即导向(ROW)」快照技术。



ROW快照提供高扩充性,并透过低容量快照取代全容量快照,所以让使用者可以检视完全独立的可读写式磁碟卷册。这项特性让企业能将快照应用于资料备份、应用测试、更新档测试,以及开发等作业。 ROW的另一项好处是每一个卷册可提供大量的快照,并能透过这些快照档案将资料快速回复到某一个特定的时间点。透过这种更细微的资料粒度,让ROW能更进一步地减少RPO的数量。



另外,还有一些进阶功能可为使用者省下宝贵的时间,例如透过检视技巧的辅助,运用快照档案将资料还原。 ROW允许使用者在将快照资料嵌回原始来源之前进行修改或修复,进而缩短复原时间。如此一来,ROW能将停机时间对企业造成的冲击降至最低。



通常在使用快照技术时,系统都会要求将磁碟组合成一个一致的群组,如此一来便可以将资料库档案与登录档分别存放于不同的磁碟来管理,以利后续的资料库设计。这项功能让所有的资料库、登录档及资料卷册,都能创造出一致的快照档案。所以,应用伺服器能被更有效地管理,而且也可以透过程序档来让快照自动化。这个特性对于大型资料库的安装来说尤其重要,因其牵涉到内含许多不同内容的多颗磁碟之整合。因此,若无法将这些不同来源的资料在同一个时间点进行撷取的动作,就会造成资料库的不稳定,甚或导致资料库无法使用。



《图一 高低容量快照式意图(A)全容量快照:原始卷册大小x快照数量+1。主机写入至原始资料模块,加重在原始资料卷册上COW的I/O负荷,因此支援的快照有限。 (B)低容量快照:主​​机仅写入新的快照区,因此拥有更高的扩充性。 》


资料库应用的各种挑战


应用整合


资料库应用中最重要的要素之一,就是确保任何解决方案都能提供一个机制,以保护资料的完整性。



企业决定选用何种解决方案来推动应用整合是一件相当重要的事情。若企业在暂停应用资料的变更前,就对关键任务资料库进行快照,资料就可能出现前后不一致的结果,其后果相当于突然拔掉伺服器的电源插头。于是就衍生出许多问题,例如:




  • ●资料库是否能复原?



  • ●执行何种作业类型是否有差别?



  • ●是否能前推至尚未进行的动作之前?



  • ●资料库管理者要花多长的时间来修复?



  • ●将会流失多少资料?



  • ●若无法回复资料,会有什么样的后果?





应用整合让资料库能以透明化的方式进行暂停读写,并提供系统足够的时间将缓冲区的资料写入磁碟,以确保资料的完整性。其中,功能强大的SANAPI描述档能支援各种资料库类型,包括Microsoft SQL Server、Microsoft Exchange及Oracle。而像Sybase 12.5这类仅提供命令列执行介面的静态资料库,在建立快照之前会先把资料写入磁碟。也因为这层相似的特性,所以可以将它们整合到SANAPI描述档,借此使用这类资料库的相关功能。



SAN CLI元件库提供许多介面,不但能用来建立即时快照,同时还可以确保资料的一致性。随后大量的快照档案便可以上传到备份伺服器上的SATA硬碟,或是经由VTL再转至传统的磁带柜做储存动作。透过这些强大的标准套件,远端即时资料储存便不难实现,同时亦能节省资料回复动作所需的大量时间与成本。



应用回复


许多企业会订立资料备份策略,却疏忽了资料回复策略,但是每个应用程序都应该同时具备以上两者。企业必须为他们每天在使用的系统排定一个优先顺序,如此方能顺利制定后续的资料回复策略。



传统的备份方法可以让你把资料回复到预设的备份点,而透过较审慎的规划及纪录档重播,甚至可以将其回复到较新的时间点。快照备份则是让你可以随时检视经由快照撷取的档案资料,并且在资料毁损的时候,将资料库档案的复本套回受损的资料库。然而,这一连串复制与贴上的动作看似简单,实际上却得花费可观的时间。



例如,某些快照解决方案,仅能将资料回复到最近一次撷取快照时的状态。其风险在于若该时间点的资料仍处于损毁状态,就被迫得采用传统备份的回复方法,进而大幅增加回复资料所耗费的时间。



采用StoreAge SVM容量快照解决方案,能将一份可完全读/写的资料回传到原始,或已经回复过的资料库伺服器中,以便检查资料的完整性。若发现某个快照档案有毁损的状况,则会迅速套用更早一点的快照档案,以维持资料的完整性。接着,被称作时间前推(roll forward)的测试,便在不影响原始资料的前提下开始进行。在时间前推的过程中若发现问题,该笔资料将会被保存起来,并由系统一再测试其参数,直到问题解决了为止。若系统成功完成时间前推的测试,便会将资料回复到他本来的面貌。这边可以得到一个结论,若没有快照功能的辅助,上述的资料回复过程是不可能达成的。



若没有采用这些技术,一旦时间前推失败了,测试者就必须从磁带回存资料,再进行一次前推、测试。若还是行不通,就使用更早版本的资料再试一遍-这种昂贵、费时、又不受欢迎的工作,会对团队产生额外的压力。



若企业的资料库并不需要进行时间前推,而且也不介意仅采用最近时间点的快照档案,那么Recovery Point Objective将会把资料回复至最后一次撷取快照的时间点,然后经由StoreAge低容量快照应用程式(StoreAge multiView)的测试后,进行一个简单的时间回推,再把资料回复成原来的样子。



另外,为了维持应用程式的运作,也有一些企业选择部署丛集解决方案。此法为将资料库应用安装在形成丛集的不同节点上,而后资料库便在节点上运作。一旦执行资料库程式的某节点发生故障,则正常运作的节点会取而代之,继续接手执行资料库。上述过程需要复杂的运作环境来支援,不仅资料库本身必须支援多节点的丛集环境,连支应资料库运行的众多相关资源,都必须有节点间转移的能力。此外,负责备份这些资料库应用的程式亦必须支援丛集环境,导致此解决方案售价偏高。但是,若运用了上述的快照技术,就能大幅降低丛集环境备份解决方案的复杂性。



上面提到的各种解决方案,其目的都在因应本地端所可能遭遇的各种灾害,包括人为错误、SAN故障、以及主机故障等因素。但若是遭遇恐怖攻击,或是恶劣气候导致设施瘫痪等大范围的灾害呢?



运用远距备份维持应用资料的完整性


很多企业为了预防本地端的资料库毁损,通常会让关键的资料库内容在其他地点也能照常运作,并且能在远端检视本地端资料的毁损状况。有鉴于此,先进的快照功能可以让企业在不会干扰系统运作的前提下,进行资料的检验动作,以利缩短回复毁损资料的时间。



然而,若企业只选用了远距备份或资料同步镜射,则有两个必须考量的因素可能影响资料的完整性:




  • (1)许多灾害并非是发生在短时间内的单一事件,而是可能持续数分钟甚至长达数小时(断断续续的停电、通讯线路中断、磁碟故障等)。其中,间歇性的故障最难以应付,因为它们会在灾难发生时,不只一次地损害资料的完整性。



  • (2)另一个要考虑到的因素是修复故障所需的时间。在采用同步镜射方法时,所有资料─不论是否受损─都会立即被复制到次要储存装置,而其结果是若一端的资料库档案系统毁损,另一端的资料也会跟着遭殃。要将这类型的资料毁损修复,通常得花上数小时到数天,在某些情况下甚至无法复原。





综上所述,若企业选择了错误的回复方法,则可能使资料毁损得更严重,甚至导致资料完全遗失的情况。而若是没有采用快照,就无法将资料回复到已知的时间点,因此必须采用传统的备份/回存方法。反之,如果采用全容量的快照,就必须花费大量时间来复制所有资料,导致回复后的资料过时而不符实际状况。最后,某些快照技术仅允许在主要或次要的站点中择一撷取快照,这意谓着若应用整合快照仅局限在本地端,则复制的快照档案无法维持与原应用的一致性。



《图二 资料库及快照档案从本地端或备援伺服器复制过程的示意图。备援端可用来进行站点外备份,或取代原系统上线运作,且模块层级的资料异动内容会复制到主要站点。 》


解决之道


针对这些问题,StoreAge SVM提供了一些解决方式,首先来谈谈低容量快照。因为低容量快照所复制的档案容量较小,因此可以得到较多的检验时间点,以便检查档案的一致性。若在检查过程中发现了某个一致的状态,就能借此让资料库回复上线,可能的话还可以把资料状态推移至较新的时间点。应用整合快照则可以将资料复制到备援端,故在灾害发生的时候可以将原本的资料在本地端或备援端的伺服器上重现,并且不需要透过磁带回存。



StoreAge SVM针对这些问题提供解决方案。运用低容量快照,就能得到许多时间点,可检查这些时刻的资料一致性。找到某个一致的状态后,就能让资料库回复上线,若可能的话还能把资料状态推移至较新的时间点。应用整合快照会复制到灾难复原站点,且能在灾难复原或主要站点上,快速让一致的资料上线运作,不必从磁带进行回存。最后,非同步镜射自动回复功能(StoreAge multiMirror)可让灾难复原测试进行得更顺利,方法是只把灾难复原站点中被异动过的资料模块回存到主要站点,而不必对所有资料进行完整的模块层级资料同步化。如此一来,就不必为了要达到理想的资料更新速度而花大笔金钱去购买频宽。



---本文由LSI公司提供---



相关文章
并购将持续发生半导体游戏规则逐渐转变
打造具备音视频媒体闸道的多核处理器
服务器虚拟化与DAS储存
RAID 6基本原理与应用
运用快照强化实现低成本灾难复原机制
comments powered by Disqus
相关讨论
  相关新闻
» 美光针对用户端和资料中心等市场 推出232层QLC NAND
» 摩尔斯微电子在台湾设立新办公室 为进军亚太写下新里程碑
» 爱德万测试与东丽签订Micro LED显示屏制造战略夥伴关系
» 格斯科技携手生态系夥伴产学合作 推出油电转纯电示范车
» Arm:因应AI永无止尽的能源需求 推动AI资料中心工作负载


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84Q96F51ESTACUKR
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw