区分重复删除技术增量备份和数据压缩(一)
随着数据量的不断增长,数据存储安全的重要性开始逐渐被越来越多的人所重视,在数据存储安全性方面,数据备份的重要作用越来越得到体现。在数据存储中,各种病毒,非法操作,误操作,自然灾害都会造成大量的数据损失。据统计,硬件故障,软件错误以及人的误操作是数据丢失的最主要原因。50%以上的数据丢失是由于硬件故障或软件错误造成的,剩下的数据丢失由人的错误操作造成,很小的一部分数据丢失才是由病毒类产生。因此,数据备份的逐渐成为存储技术中非常重要的研究和发展部分。
在数据备份的领域,各种技术和概念层出不穷,许多的用户想要完全理解和分清相互之间的概念是比较困难的一件事情,特别是最近比较流行的重复删除技术和增量备份技术,还有数据压缩技术的相互区别和联系,这几个技术的概念本身比较容易混淆,我们从技术本身的特点和相互涉及的应用领域分析这几个概念。
增量备份
首先我们谈谈传统的数据备份技术——增量备份(incremental backup)。增量备份主要是解决完全备份中对备份容量要求巨大和备份的时效性比较差的两个问题提出的解决方案。增量备份只备份相对与上一次备份操作以来新创建或者更新过的数据。因为在特定的时间段内只有少量的文件发生改变,没有重复的备份数据,既节省了存储空间,又缩短了备份的时间。因而这种备份方法比较经济,可以频繁的进行。
典型的增量备份方案是在偶尔进行完全备份后,频繁的进行增量备份。但是在增量备份系统中,一旦发生数据丢失或文件误删除操作时,恢复工作会比较麻烦,因为恢复操作需要查询一系列的备份文件,从最后一次完全备份开始,将记录在一次或多次的增量备份中的改变应用到文件上,增量备份的恢复需要多份的备份文件才可以完成。多个备份文件间的关系就像链条,一环扣一环,其中任何一个备份文件出现问题都会导致整个链条脱节,所以增量备份的可靠性比较差,这种备份方式早期也常常在磁带技术中采用。
数据压缩
我们常说的数据压缩技术就更加贴近信息存储的本质,在信息数字化的过程中,数据压缩技术是起了非常大的作用。各种信息的数字化的过程就是采样,量化和编码的过程,基于这些处理过程中产生的各种冗余,像时间冗余,空间冗余,结构化冗余和知识冗余,数字压缩技术可以有效的消除各种冗余带来的容量的损失,将数据表现的方式优化。
这也是基本的信息数字化所使用的手段。在音频和视频的数字化中使用的数字压缩技术更广泛,这是一种基本技术,而增量备份只是数据保护过程中的一种策略,两个概念的层次都不一样。所以在这个概念的理解上不能有混淆,要分清楚。
etsme是采用云计算原生技术打造的个人私有云/小型私有云产品,即刻入手etsme,探索更多贴心功能,掌控自己的数字世界。