探秘大文件备份之挑战
当备份大文件的时候,管理员们曾因备份容量和备份应用无法支持所需备份文件大小而苦恼。如今,这些所谓的限制已然不是问题,但是备份管理员遇到了备份大文件时的其它问题。
尽管备份介质容量和备份应用兼容性问题已然逐渐消失,在离线备份时仍可能遇到问题,尤其是一些类型的可移动备份介质。
比如说,系统管理员最近尝试将一个2GB的数据拷贝到DVD里;过程中,他发现他使用的软件不支持备份超过2GB的数据。
幸运的是,这样的大文件备份问题不再常见。因为大多数企业都不再依赖于DVD拷贝的方式来保护他们的重要数据。企业通常使用将数据写到磁盘或者磁带上来完成备份,可以支持超过GB级别以上的文件备份。
尽管超过GB级别的文件变得越来越普遍,在对这些文件进行备份保护的时候仍然会有问题,问题集中在这些文件的备份及恢复性能表现上。
事实上并没有一种合适于不同公司的通用方案来保护大文件数据。企业需要考虑他们自身独有的业务需求及定制合适他们的解决方案。管理员可以通过如下的问题来定位需求:
· 有大量的大文件需要备份还是仅仅少量大文件?
· 大文件是否频繁修改或者相对稳定?
· 大文件是否会定期产生?
· 对大文件的恢复是不是有恢复时间点要求?
· 备份是创建在本地还是写在云端?
对这些问题的回答将帮助你规划出对这类文件长期保护的有效方法。
比如说,如果企业频繁创建或者修改大文件,那么合适的方式是针对这些大文件,部署高性能、大容量的备份介质。
换句话说,如果发现创建这样的大文件不是一件经常的事情,那么通过离线归档的方式完成这些文件的保护则更为合适一些。
备份介质的位置也将影响其性能。如果备份到本地备份介质,那么备份大文件的时候对备份进程产生的影响则可以忽略不计。大多数备份解决方案都提供了足够的带宽以确保大文件备份的快速完成。然而如果备份介质是在远端数据中心或者是云上,那么备份性能则可能会成为问题。
互联网的带宽是有限的,具体的带宽限制取决于分配给备份进程的带宽数量,备份大文件可能会非常耗时,且可能会影响其他需要备份的数据。
一种解决方案就是使用备份做种的方式。这样的方式下,就无需通过互联网进行大文件的传输。一旦远程备份做种完成,基于文件块的变化则会通过备份方式传递过去,故而备份就能以无需复制整个文件的方式进行同步。
当然,在一些企业里,特定的文件类型甚至很少被改动过。比如说那些高清的视频文件,这些文件也许会被修改,但修改的部分通常被写到单独的文件中,这样就可以避免对源文件进行修改。如果企业的实际情况与此类似,那么就不建议对文件做种,因为这些数据最终还是会被修改。更好的一种方式就是将不改动的数据进行归档操作处理,以作长期保留使用。
恢复性能
如果大文件出了什么问题,那么快速恢复就非常的重要。
首先,能快速想到的解决方案就是使用重复数据删除技术的优势,减少需要在恢复中传递的数据块。尽管这种方式在一些场景中得以适用,然而并不是每次都很有效果。一些类型的数据会有更好的去重效果。一些大文件类似像视频文件往往是已经使用过本地压缩模式,故而去重效果不一定会很好。
这的确是事实,最快的大文件恢复方式就是本地有一份数据拷贝或者磁带拷贝。
尽管如果能够实现将备份复制到远端数据中心是理想的选择,本地最好也有一份相应的拷贝。这不仅是因为本地文件恢复相较于从云端恢复更有效率,同时一旦远程备份无法访问就能从本地快速恢复。
如果因为某些原因,必须要从云端恢复大文件,那么就只能临时调整带宽限额以确保能相对更快的恢复数据。大多数云备份产品允许管理员通过QoS或者类似的机制限制互联网带宽使用量。这样一来,其它的互联网流量就不会因为该备份进程拥塞或者影响。在大文件需要被快速恢复的时候,就需要临时放宽互联网带宽限制,使得文件能更快的得以恢复。
结论
对大文件的备份及保护长期以来对于管理员来说都是挑战。尽管容量问题曾是最大的痛点,现如今大多数挑战都集中在文件的备份或者恢复性能上。
etsme是采用云计算原生技术打造的个人私有云/小型私有云产品,即刻入手etsme,探索更多贴心功能,掌控自己的数字世界。