用云存储进行归档(下)
服务是关键要素
因此,服务水平管理是是否使用云归档还是原本也运营模式的关键要素。在从云归档供应商采购服务时,你需要考虑以下服务水平方面的问题:
在线时间。对于绝大多数应用,3个9或4个9的可用性就已足够应对业务所需。假如你需要5个9的高可用性,这种数据访问性的要求可能无法使用在归档层上。存储在归档层上的数据通常会定义为非关键性的。关于在线时间的要求在很大程度上决定了供应商应当具备多少基础架构,因此这会对托管的成本造成重大影响。毋庸置疑的是,需要明确数据存取的实际时间、访问模式以及宕机所会造成的损失。这些计算机结论可以和各种保障系统在线所需的成本进行比较,基于这种比较可以很容易地调整或拒绝是否采用云环境。供应商通常在无法满足服务水平协议(SLA)时退回托管费用的部分款项或给予其它形式的补偿。不过这种警告可能隐藏在合约中,务必仔细阅读。
可访问性。可访问性和在线时间并不完全一样。存储系统可能运行正常,不过可能由于子部件造成一项应用的不可用。假如你需要冗余或数据链路的多项冗余,举例来说,你可能在支付后发现后备方案无法满足应用所需。因此请确保服务水平中包含端到端的数据可用性。
性能。量化你的应用所需的IOPS并且将其纳入到SLA之中。IOPS可以通过平均或者峰值活动状态加以测算。假如你要求峰值时刻的IOPS保障,你可能要为此支付供应商更多的费用。一些供应商会以量计费,不过许多企业不喜欢这种不确定的账单方式,可能会受到极端情况的影响。绝大多数企业可以接受一定数量上的运作限制(尤其是针对归档层的存储)以获取成本优势。在这种情况下,SLA只保证一定的IOPS而非最终用户的性能体验。假如应用要求超过了合约规定的IOPS量,这就绝对是企业IT部门的问题了;当然可以通过购买额外IOPS的方式来满足。
数据恢复。和内部的应用一样,IT部门需要详细说明基于云的归档的恢复点目标(RPO)和恢复点目标(RTO)。这和正常在线时间有关,但同样和意外事件相关,比如数据损坏或者虽然没有影响整体在线时间但是影响到个体应用程序的部件故障。供应商一般都有默认的RPO和RTO,对于归档层而来一般都是足够的。此外,毋庸置疑的是,需要明确业务单元所能容忍的各类的数据丢失或应用故障。在很多时候,这会比你认为的要长。
灾难恢复(DR)。如果云归档是用于离线复制存储来满足数据冗余的要求,你可以不考虑该层灾难恢复的策略。不过购买者需要注意:绝大多数的托管存储并不包含任何灾难恢复事故的防护。如果托管数据属于混合云存储中的活动数据,灾难恢复规划是完全必要的。托管服务供应商可能定期备份所有数据,不过他们通常不会循环备份离线站点中的数据,即便做的话也是以很少的频率(比如每月一次)。虽然在数据中心中做到SAS-70合规中的灾难恢复非常困难,但也绝非不可能的事。托管企业提供的灾难恢复通常要显著地增加额外的成本,并且会快速改变托管业务的经济情况。请确保数据不会遗留在具有风险的地方。
备份和恢复。即便托管服务供应商定期备份数据并且频繁地循环离线存储数据,IT部门也并非完全没有风险。托管企业通常只有有限的备份软件和磁带技术。这意味着其备份形式(硬件、软件或者两者兼备)可能和你的IT系统并不匹配。假设IT部门尝试从供应商的磁带中进行恢复,可能由于没有足够的基础架构支持而造成严重的延误。请考虑好在最坏的情况下的解决方案。
兼容性。需要特殊合规规范的归档数据也可以用在云托管上。你可能需要确保数据存放的媒介不能改变。你或许要严格限定存取规范,并且可以追溯和审计;遵照SAS-70的供应商可能有这样的流程。
固定成本和可变成本。归档较之于使用自有的基础架构,其核心收益之一就是你只需支付你使用的存储。这一指标会受你使用的多少的影响,但其也有最小的固定成本。
从云归档
很清楚,对于将陈旧的数据存放在相对昂贵的内部阵列的那些企业,云归档显然很有吸引力。问题在于是否需要将基于磁带的归档迁移到云端。大型企业可能通过数以百计的离线磁带实现归档操作。将所有这些磁带取出,读取数据并迁移到云归档基础架构的工作让人望而却步。这里还有一个前提,就是供应商有充足的硬件来读取所有磁带,部分磁带的格式已经被淘汰。此外,没有哪家云供应商可以在托管这样庞大的数据的同时,接受和大型磁带库相同的成本。磁盘压缩和数据重复删除技术可能会非常有用,不过成本上的差异仍使得磁带的成本只有其的一个零头。
即便从磁带转向云归档的阻碍很大,云归档仍不失为一种可以考虑的方式。超过7年以上的磁带在保存上代价高昂,并且可能有各种问题。最佳实践显示企业需要在每五年读取并重新写入磁带,来确保格式准确以及数据可以被读取。这是一项需要加以考虑的工作。比如,有着10,000份磁带归档以及每5年一周期的更新,企业需要在每年更新2,000份磁带。每天大约是6盘磁带,这虽然可行,但这属于年复一年而又不会带来生产效益的工作。此外,问题的关键在于检索的概率。一些企业考虑到恢复操作可能非常麻烦,允许磁带被废弃,不过前提是恢复数据的概率以及丢失数据的风险。在另一方面,假如你知道恢复操作是无法避免的,你现在就可以考虑选择时间,预留经费来从磁带迁移到云端,这可以在以后节省下大量的时间和精力,甚至应对一些突发情况。
并不是说磁带已经不适合用作归档了。其在绝大多数情况下仍旧是最低成本的解决方案。此外LTO中线性磁带文件系统使得磁带可以扮演“第四层”存储的新角色,因此其可以在云(或者数据中心)中作为额外的一层提供给存储的0、1、2、3层。在云归档环境中,这可以有效地生成混合云并对很少访问的数据提供相对快速的访问(比如分钟级),而成本却和磁带类似。磁带也会有内置的压缩技术,并支持加密和一次写入多次读出(WORM)。使用自动化的分层软件,数据可以自动化地迁移带归档层。
考虑到不可避免的意外事件
迄今为止,我们已经描绘出云归档服务美好的前景。通常一份投入一份回报,不过并不全是这样。企业应当考虑将数十TB的数据交给供应商后,其无法兑现承诺合约的结果。当然供应商会赔偿一小部分,不过小额的赔偿款很难弥补真正的损失,以及对IT部门声誉造成损害。并且突发事件可能会一开始就终止合约,供应商可能不会为无法满足特定的性能水平支付赔偿款项。因此规划中还应当包含备选的托管功能,无论是内部的备用系统或者另一家供应商。云归档并不属于高风险的方案,不过聪明的企业凡事都会准备在前。
相关链接一:云归档考虑的核心问题
• 云归档在可用性和成本之间达成了一种平衡。虽然放弃了最低的成本收益,但其提供可供接受的数据访问性能。
• 使用云服务商要求IT部门从管理设备向管理服务等级进行转变
• 清晰地定义服务级别是成功进行云归档托管的关键
• 企业需要在意外发生时有合适的退出策略
相关链接二:归档和备份
虽然许多IT部门仍认为其陈旧的备份磁带属于“归档”,然而在归档和备份数据之间仍有特定的使用场景和访问性能要求的差异。
备份是为了保护正在使用中的数据;假设数据必需从备份中恢复,其通常在备份创建后很快速地完成。备份数据通常只有很短的保存周期。
归档是将一系列数据保存很长一段时间,用于合规规范、企业管理或作为知识产权。归档数据很少被访问使用,不过可以进行检索,从而特定的数据可以相对快速简易地恢复。
存储网络行业协会对备份和云归档服务给出了明确的定义:
“云备份中,云只是简单的数据备份仓库;而在云归档和保存中,云端会进行一系列的活动确保长期的数据保存、保护并且确认数据的有效性。”
etsme是采用云计算原生技术打造的个人私有云/小型私有云产品,即刻入手etsme,探索更多贴心功能,掌控自己的数字世界。