对象存储:有什么大惊小怪的?
在今年惠普公司的年度分析师会议上,惠普存储事业部的高级副总裁和总经理David Scott提出了一个大胆的观点:NAS将会消失,基于对象的存储技术将会是非结构化数据的未来。Scott并不是唯一对对象存储感兴趣的人。几乎每个星期都有一些领先存储厂商(和少数小厂商)在对象存储市场发布声明。在最近的一次统计中,对象存储市场有近20家厂商,其中包括所有的主流存储厂商。虽然对象存储市场不像DAS、SAN和NAS市场那么大,但它的发展势头很强。
不过,这种趋势更多的是来自厂商的推动,而非来自用户。许多小厂商在努力说服客户接受并使用对象存储;用户其实不理解他们为什么需要将另一种存储平台(不是基于标准的存储平台)引入他们的环境。或许对于他们来说引入对象存储还为时过早,因为他们还没有遇到很大的挑战来迫使他们做出改变。正如一个厂商告诉我的:“它只是解决了一个还没到来的问题。”这个问题什么时候到来取决于行业的发展和使用情况。
对象存储定义
对象存储的工作原理和标准的文件级存储不同。在一个标准的存储架构中,数据的内容被一个分层的文件系统管理,这个文件系统使用一个索引表指向文件在存储中的物理位置,它只需要跟踪元数据的内容就行。但这种方法对一个目录下所能管理的文件数量有限制。而对象存储将数据放到一个大小可变的容器(“对象”)中。每个对象具有唯一的ID(而非文件名)和包含详细属性的元数据。元数据可以被用来自动创建存储策略,例如将旧的数据从高性能硬盘迁移到费用低廉的大容量硬盘,或删除过期的数据等。对象存储能提供更简单的设计和更好的扩展性。它的缺点是性能问题,从对象存储中读取数据的时间要比从文件系统级存储中读取要长。然而,最近一些厂商如DataDirect Networks和Scality都在质疑这个观点。
对象存储已经推出很多年了。最早的(或许是大家最熟悉的)对象存储系统是EMC在21世纪初期推出的Centera。Centera被称为内容可寻址存储(CAS),因为它从内容本身获得一个对象ID,为数据生成一个数字指纹。Centera的目标客户是需要长期可用归档数据的客户,比如医院,它们偶尔需要及时的读取一些数据(例如搜寻记录或病人的医疗图片)。Centera通过私有的API与应用程序集成,EMC为此建立了一个强大的ISV合作伙伴生态系统和销售渠道。
Centera不是一个高性能系统,它也不需要有很高的性能。目前市场上的许多下一代的对象存储仍然是针对半激活(semi-active)的数据,如可用归档或Web内容仓库,对象存储的性能可以满足这些需求。对象存储的可扩展性和可管理性让他们很自然地通过云来部署后端。
一些对象存储被设计用做高性能主存储,支持需要高吞吐量的应用,这些应用通常用于媒体娱乐、研发和分析行业。对象存储从架构上来说很适合这类应用,因为它天生的向外扩展特性可以提供更大的带宽和总体吞吐量。但这些优点在一定程度上也是一种挑战——它要面对大家对它的负面看法,也要克服人们对其是主要用于归档解决方案的观念。然而,Quantum的StorNext软件已经看到了来自媒体娱乐行业的机遇,同时DataDirect Networks和Scality公司(在一定程度上还有Cleversafe和它们集成的Hadoop)也看到了机会。
一个常见的和使用场景无关的挑战是这些对象存储需要与私有的API集成;他们不会与使用诸如NFS、CIFS/SMB或SCSI的标准接口的应用“会话”。缺乏标准接口已经成为阻碍用户采用的主要原因,因为用户不希望开发新的应用程序接口。但更重要的原因是用户不希望自己被绑定在单个厂商的存储架构下。这在过去几年都是一个问题,不过这个问题可能很快会得到解决,因为大部分对象存储厂商已经添加(或即将添加)对NFS和CIFS的支持。此外,许多厂商还增加了对亚马逊Web服务的简单存储服务(Amazon S3)的API,这个API事实上很快会成为RESTful接口的标准。这个进步最终应该会解决使用对象存储的大问题,并且刺激整个市场。
对象存储的应用限制
使用对象存储的用户在很大程度上仍然局限于那些有钱和资源来实现应用集成的服务提供商或大型企业。在企业级IT系统中,NFS和CIFS依然会存在(不会有技术消亡。HP甚至为了老式的无法迁移到其他系统的应用每年采购几台小型机)。但随着时间流逝,接口会被标准化,应用也在按照使用对象存储作为后端设备的理念来开发,我们可以期待对象存储将在企业中作为一种能创造可衡量的收益的存储平台。
将来,对象存储很可能会与NFS和CIFS共存,作为存储和管理非结构化数据的另一种方法。具体部署方式和客户具体的使用案例有关。当数据量增长时,可管理性、费用开销和随机读写的吞吐量以及一些如快照备份、远程复制(作为长期归档或数据密集型高增长率应用)的高级功能对于对象存储来说很可能是一个挑战。但这并不是说对象存储永远不会有这些高级功能,相反,它们正在不断追赶,同时存储厂商也不会原地踏步。而且在某些特定的使用场景中,一些和Hadoop集成的应用利用并行的、向外扩展的对象存储架构在存储和处理大数据上看起来非常有效。最终,对象存储将会降低成本并简化管理的复杂性。
etsme是采用云计算原生技术打造的个人私有云/小型私有云产品,即刻入手etsme,探索更多贴心功能,掌控自己的数字世界。