三种类型的重复数据删除技术的优劣比较
在本篇存储决策者大会视频中,Marc Staimer概述了重复数据删除技术的三种主要类型:文件级、数据块或数据子块,以及内容识别,同时他还描述了各种方式的优劣。
Dragon Slayer咨询公司总裁Marc Staimer说:“基于存储或基于文件的重复删除技术可以减少冗余的文件,降低主存储的消耗。这些工作都是在文件级别上完成的。所以一旦你有重复文件,它就会删除重复文件。这种技术一般都是免费的。你在购买NetApp、EMC或其他厂商的设备时得到该技术。不过实际上,他们赠送的这项技术也是有缺陷的。”
Staimer表示,这种重复删除技术的优势在于其在处理重复的邮件附件、重复的ISO文件或高端图像方面的高效性。他表示这项技术能提供相对于主存储数据约为1/2到1/3的数据缩减。
Staimer说:“这是你从主存储上可以达到的最佳效果。当然在二级存储的缩减方面会更好一些。所以你只需要从这方面理解这种技术即可。”
他表示,这种类型的重复删除的读写延迟较其它类型的会更长,这意味着它要频繁地进行后台处理,而并非是实时联机的,尤其是在主存储的数据重复删除中。
另一种类型的重复删除不在文件层实现,而是关注在单独的数据块和数据子块上(后者小于512字节),进而减少存储消耗。这类重复数据删除技术能非常精准地实现“卓越的”重复删除,并实现高效的数据备份。不过使用这类重复数据删除方式的存储通常代价不菲,Staimer补充道。
他还说:“要记住,内置这种技术的存储通常都有一定的溢价。所以他要比其它存储耗费更多的钱。”
此外还有第三类:内容识别的重复数据删除存储,Staimer表示,这种技术是由Dell提供的。
Staimer说:“其会这样处理数据…并在不同文件之间找出相同的数据碎片。然后将其重新压缩成一种新的格式,这样你得使用特定的读取软件在数据被压缩后进行读取操作。因此其在不同文件类型的环境中很有优势。”他还指出这种方法需要特别的读取软件来浏览数据,另外,重复删除过程必需安排在企业的正常运营时间以外。
etsme是采用云计算原生技术打造的个人私有云/小型私有云产品,即刻入手etsme,探索更多贴心功能,掌控自己的数字世界。