云存储介绍

pgupdnend

贡献于2011-11-18

字数:0 关键词: 分布式/云计算/大数据

云存储介绍 作 者:Tiger@中国云计算论坛 Email:binboth@foxmail.com QQ 号: 1036479498 第 1 页 共 9 页 云存储(Cloud Storage)这个概念一经提出,就得到了众多厂商的支持和关 注。如:Amazon 推出的 Elastic Compute Cloud(EC2:弹性计算云)云存储产品, 旨在为用户提供互联网服务形式同时提供更强的存储和计算功能。内容分发网络 服务提供商 CDNetworks 和著名的云存储平台服务商 Nirvanix 发布了一项新的 合作,并宣布结成战略伙伴关系,以提供业界目前唯一的云存储和内容传送服务 集成平台。微软推出了提供网络移动硬盘服务的 Windows Live SkyDrive Beta 测 试版。EMC 加入道里可信基础架构项目,致力于云计算环境下关于信任和可靠 度保证的全球研究协作。IBM 也将云计算标准作为全球备份中心的 3 亿美元扩 展方案的一部分。 云存储变得越来越热,大家众说纷“云”,而且各有各的说法,各有各的观 点,那么到底什么是云存储? 一、什么是云存储 云存储在云计算 (Cloud Computing)概念上延伸和发展出来的一个新的概 念。云计算是是分布式处理(Distributed Computing)、并行处理(Parallel Computing) 和网格计算(Grid Computing)的发展,是透过网络将庞大的计算处理程序自动分 拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经计算分析之后 将处理结果回传给用户。通过云计算技术,网络服务提供者可以在数秒之内,处 理数以千万计甚至亿计的信息,达到和“超级计算机”同样强大的网络服务。 云存储的概念与云计算类似,它是指通过集群应用、网格技术或分布式文件 系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同 工作,共同对外提供数据存储和业务访问功能的系统。 为了让云存储的定义更加清晰明了一些,与企业 IT 专家常打交道的行业分 析师重新整理了一下云存储的定义,概括出了云存储具有如下特点:( 1 ) 超 强的 可扩展性;(2)不受具体地理位置所限;(3)基于商业组件;(4)按照使用收费, 如每 G 收 15 美分;(5)可跨不同应用。 第 2 页 共 9 页 二、云存储不是存储而是服务 借用广域网和互联网的结构来解释云存储。当使用广域网和互联网时,我们 只需要知道是什么样的接入网和用户名、密码就可以连接到广域网和互联网,并 不需要知道广域网和互联网中到底有多少台交换机、路由器、防火墙和服务器, 不需要知道数据是通过什么样的路由到达我们的电脑,也不需要知道网络中的服 务器分别安装了什么软件,更 不需要知道网络中各设备之间采用了什么样的连接 线缆和端口。 广域网和互联网对于具体的使用者是完全透明的,我们经常用一个云状的图 形来表示广域网和互联网,如下图: 虽然这个云图中包含了许许多多的交换机、路由器、防火墙和服务器,但对 具体的广域网、互联网用户来讲,这些都是不需要知道的。这个云状图形代表的 是广域网和互联网带给大家的互联互通的网络服务,无论我们在任何地方,都可 以通过一个网络接入线缆和一个用户、密码,就可以接入广域网和互联网,享受 网络带给我们的服务。 参考云状的网络结构,创建一个新型的云状结构的存储系统系统,这个存储 系统由多个存储设备组成,通过集群功能、分布式文件系统或类似网格计算等功 能联合起来协同工作,并 通 过 一 定 的 应 用 软 件或应用接口,对用户提供一定类型 的存储服务和访问服务。 第 3 页 共 9 页 当我们使用某一个独立的存储设备时,我们必须非常清楚这个存储设备是什 么型号,什么接口和传输协议,必须清楚地知道存储系统中有多少块磁盘,分别 是什么型号、多大容量,必须清楚存储设备和服务器之间采用什么样的连接线缆。 为了保证数据安全和业务的连续性,我们还需要建立相应的数据备份系统和容灾 系统。除此之外,对存储设备进行定期地状态监控、维护、软硬件更新和升级也 是必须的。 如果采用云存储,那么上面所提到的一切对使用者来讲都不需要了。云 状 存 储系统中的所有设备对使用者来讲都是完全透明的,任何地方的任何一个经过授 权的使用者都可以通过一根接入线缆与云存储连接,对云存储进行数据访问。 就如同云状的广域网和互联网一样,云存储对使用者来讲,不是指某一个具 体的设备,而是指一个由许许多多个存储设备和服务器所构成的集合体。使用者 使用云存储,并 不 是 使 用 某 一个存储设备,而是使用整个云存储系统带来的一种 数据访问服务。所以严格来讲,云存储不是存储,而是一种服务。 云存储的核心是应用软件与存储设备相结合,通过应用软件来实现存储设备 向存储服务的转变。 第 4 页 共 9 页 三、云存储的结构模型 与传统的存储设备相比,云存储不仅仅是一个硬件,而是一个网络设备、存 储设备、服务器、应用软件、公用访问接口、接入网、和客户端程序等多个部分 组成的复杂系统。各部分以存储设备为核心,通过应用软件来对外提供数据存储 和业务访问服务。云存储系统的结构模型如下图所示: 云存储系统的结构模型由存储层、基础管理层、应用接口层和访问层组成。 (1)存储层 存储层是云存储最基础的部分。存储设备可以是 FC 光纤通道存储设备,可 以是 NAS 和 iSCSI 等 IP 存储设备,也可以是 SCSI 或 SAS 等 DAS 存储设备。 云存储中的存储设备往往数量庞大且分布多不同地域,彼此之间通过广域网、互 联网或者 FC 光纤通道网络连接在一起。 存储设备之上是一个统一存储设备管理系统,可以实现存储设备的逻辑虚拟 化管理、多链路冗余管理,以及硬件设备的状态监控和故障维护。 (2)基础管理层 基础管理层是云存储最核心的部分,也是云存储中最难以实现的部分。基础 管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储设 第 5 页 共 9 页 备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更 强更好的数据访问性能。 CDN 内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用 户所访问,同时,通过各种数据备份和容灾技术和措施可以保证云存储中的数据 不会丢失,保证云存储自身的安全和稳定。 (3)应用接口层 应用接口层是云存储最灵活多变的部分。不同的云存储运营单位可以根据实 际业务类型,开发不同的应用服务接口,提供不同的应用服务。比如视频监控应 用平台、IPTV 和视频点播应用平台、网络硬盘引用平台,远程数据备份应用平 台等。 (4)访问层 任何一个授权用户都可以通过标准的公用应用接口来登录云存储系统,享受 云存储服务。云存储运营单位不同,云存储提供的访问类型和访问手段也不同。 第 6 页 共 9 页 四、云存储的技术前提 从上面的云存储结构模型可知,云存储系统是一个多设备、多应用、多服务 协同工作的集合体,它的实现要以多种技术的发展为前提。 (1)宽带网络的发展 真正的云存储系统将会是一个多区域分布、遍布全国、甚至于遍布全球的庞 大公用系统,使用者需要通过 ADSL、DDN 等宽带接入设备来连接云存储,而 不是通过 FC、SCSI 或以太网线缆直接连接一台独立的、私有的存储设备上。只 有宽带网络得到充足的发展,使用者才有可能获得足够大的数据传输带宽,实现 大量容量数据的传输,真正享受到云存储服务,否则只能是空谈。 (2)WEB2.0 技术 Web2.0 技术的核心是分享。只有通过 web2.0 技术,云存储的使用者才有可 能通过 PC、手机、移动多媒体等多种设备,实现数据、文档、图片、音频和视 频等内容的集中存储和资料共享。Web2.0 技术的发展使得使用者的应用方式和 可得服务更加灵活和多样。 (3)应用存储的发展 云存储不仅仅是存储,更多的是应用。应用存储是一种在存储设备中集成了 应用软件功能的存储设备,不仅具有数据存储功能,还具有应用软件功能,可以 说是服务器和存储设备的集合体。应用存储技术的发展可以大量减少云存储中服 务器的数量,从而降低系统建设成本,减少系统中由服务器造成单点故障和性能 瓶颈,减少数据传输环节,提供系统性能和效率,保证整个系统的高效稳定运行。 (4)集群技术、网格技术和分布式文件系统 云存储系统是一个多存储设备、多应用、多服务协同工作的集合体,任何一 个单点的存储系统都不是云存储。 既然是由多个存储设备构成的,不同存储设备之间就需要通过集群技术、分 第 7 页 共 9 页 布式文件系统和网格计算等技术,实现多个存储设备之间的协同工作,使多个的 存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能。如 果 没 有 这 些技术的存在,云存储就不可能真正实现,所谓的云存储只能是一个一个 的独立系统,不能形成云状结构。 (5)CDN 内容分发、数据压缩技术、数据加密技术 CDN 内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用 户所访问,同时,通过各种数据备份和容灾技术保证云存储中的数据不会丢失, 保证云存储自身的安全和稳定。如 果 云存储中的数据安全得不到保证,想来也没 有人敢用云存储,否则,保存的数据不是易于丢失,就是众所周知。 (6)存储虚拟化技术、存储网络化管理技术 云存储中的存储设备数量庞大且分布在多不同地域,如 何实现不同厂商、不 同型号甚至于不同类型(如 FC 存储和 IP 存储)的多台设备之间的逻辑卷管理、 存储虚拟化管理和多链路冗余管理将会是一个巨大的难题,这个问题得不到解 决,存储设备就会是整个云存储系统的性能瓶颈,结构上也无法形成一个整体, 而且还会带来后期容量和性能扩展难等问题。 云存储中的存储设备数量庞大、分布地域广,造成的另外一个问题就是存储 设备运营管理问题。虽然这些问题对云存储的使用者来讲根本不需要关心,但对 于云存储的运营单位来讲,却必须要通过切实可行和有效的手段来解决集中管理 难、状态监控难、故障维护难、人力成本高等问题。因此,云存储必须要具有一 个高效的类似与网络管理软件一样的集中管理平台,可实现云存储系统中设有存 储设备、服务器和网络设备的集中管理和状态监控。 第 8 页 共 9 页 五、云存储和云计算的关系 云计算是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序, 再交由多台服务器所组成的庞大系统经计算分析之后将处理结果回传给用户。云 计算系统的建设目标是将运行在 PC 上、或单个服务器上的独立的、个人化的运 算迁移到一个数量庞大服务器“云”中,由这个云系统来负责处理用户的请求, 并输出结果,它是一个以数据运算和处理为核心的系统。 云存储是通过集群应用、网格技术或分布式文件系统等功能,将网络中大量 各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存 储和业务访问功能的系统。 当云计算系统运算和处理的核心是大量数据的存储 和管理时,云计算系统中就需要配置大量的存储设备,那么云计算系统就转变成 为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。 与云计算系统相比,云存储可以认为是配置了大容量存储空间的一个云计算 系统。云计算和云存储的架构模型对比如下图所示: 从架构模型来看,云存储系统比云计算系统多了一个存储层,同时,在基础 管理也多了很多与数据管理和数据安全有关的功能,在 两 者在访问层和应用接口 层则是完全相同的。 第 9 页 共 9 页 六、近在眼前的云存储服务 亚马逊提供一种称为弹性计算云(Amazon EC2,Amazon Elastic Compute Cloud)的服务。Amazon EC2 所提供的处理能力可实时增减,少则 1 台虚拟机, 多至 1000 台以上。针对 EC2,Amazon 此后推出了弹性块存储 (EBS,Elastic Block Storage)产品,同时提供存储和计算能力。 亚马逊 EC2 总经理 Peter De Santis 说:“我们允许用户独立于实例进行容量 配置,从 1GB 到 1TB 都可以。”最初,EBS 起步价为 1GB/月收取 10 美分,对 每 100 万个存储 I/O 请求收取 10 美分。据了解,用户可以将 EBS 转移到 Amazon 的 S3 存储服务上。 IBM 在 2008 年 4 月也推出了云存储的服务,它是针对那些拥有 2~3 个 Windows 服务器,或者拥有小型数据中心的商业用户。IBM 云存储是一种典型 的网络数据存储服务,它将数据存储在众多虚拟化服务器当中,提供第三方的支 持和服务。通过云存储,IBM 为用户提供远程数据保护以及邮件管理服务。 据透露,微软也有可能将发布一款基于 Web 的服务,用户通过手机存储共 享并备份数据。预计这一服务将在运行微软 Windows Mobile 6手机操作系统的 手机上实现,用户将得到 200MB 免费存储空间,可以视为一种云存储服务。 如果说这些云存储服务都还是局限在国外,距离国内消费者还非常遥远,那 么在我们身边其实已经有了云存储服务的萌芽。例如 PSP 玩家所熟悉的“纳米 盘”,堪称国内第一款真正意义上的支持外链免费大容量网络硬盘。我们还可以 看到很多诸如此类的网络硬盘服务,如 800Disk、Mofile 和猪八戒网盘等。这些 网络硬盘服务,都可以视为一种面向个人的云存储服务。 微机厂商也在打云存储的主意。2007 年,EMC 收购了在线备份服务商 Mozy。 在欧洲,Mozy 与联想有一个合作,在 其 ThinkPad 笔记本电脑上捆绑 Mozy 软件, 用户购买 ThinkPad 笔记本电脑就可以自动获得 Mozy 所提供的在线备份服务。 EMC 有计划与联想合作,将这种服务引入到中国市场。 第 10 页 共 9 页 参考文献 存储部落,www.sansky.com 百度百科,http://baike.baidu.com

下载文档,方便阅读与编辑

文档的实际排版效果,会与网站的显示效果略有不同!!

需要 5 金币 [ 分享文档获得金币 ] 4 人已下载

下载文档

相关文档