EMC Avamar手艺白皮书_笔记本电脑硬盘恢复数据

日期:2011-05-10 / 人气: / 来源:网络

  企业数据的冗余程度极高,在同一系统内和不同系统之间存储着许多完全相同的文件或数据(例如,发送给多个接收者的操作系统文件或文档)。编辑的文件也存在与以前版本相同的大量冗余数据。传统的备份软件一次次地重复存储所有这些冗余数据,因此进一步增加了冗余。Avamar 利用获得专利的全局重复数据消除技术和单实例存储技术,消除了文件和子文件数据段级别的冗余。

  在源位置全局消除冗余数据

  在备份操作期间,Avamar 是在源位置解决备份数据冗余问题的,然后才跨 LAN 或 WAN 传输数据。将 Avamar 备份代理部署在需要保护的系统(如服务器、台式机和笔记本电脑)上,可识别并过滤掉单个系统内和多个系统之间的文件中随时间推移而重复存储的数据段。这可确保每个具有唯一性的数据段仅在整个企业内备份一次。因此,拷贝或编辑的文件、共享的应用程序、嵌入的附件,甚至每天都在变化的数据库,都只会产生少量的增量备份数据。

  通过仅移动新的、具有唯一性的子文件数据段,Avamar 可将每日所需的网络带宽和存储量减少到1/500。通过在全局范围内只存储每个子文件数据段的单个实例,Avamar 还可将总体后端磁盘存储量降低到 1/50,从而实现经济高效的基于磁盘的长期恢复。

  可变长度数据段与固定长度数据段

  确定数据段大小的方法是在数据段(或子文件)级别消除冗余数据的关键因素。快照或复制技术通常采用固定块或固定长度数据段。遗憾的是,即便对数据集只进行很小的改动(例如,在文件开头插入数据),尽管这样做对数据集的实际改动其实是极小的,但也会改变数据集中的所有固定长度数据段。Avamar 使用智能的方法来确定数据段的大小,这种方法通过观察数据本身来确定逻辑边界点,从而消除了低效现象。

  确定逻辑数据段

  Avamar 获得专利的确定数据段大小的方法旨在跨企业内的所有系统实现最佳效率。Avamar 的算法对数据集的二进制结构(构成数据集的数字 0 和数字 1)进行分析,以根据上下文确定数据段边界,所以无论数据集存储在企业中的什么位置,Avamar 客户端代理都能够识别出任何数据集中完全相同的数据段。Avamar 的数据段平均大小为 24 KB,压缩后平均大小仅为 12 KB。

  通过分析二进制结构,Avamar 的方法可适用于包括数据库在内的所有类型和大小的文件。例如,如果在文本文件的开头和中间各添加一个段落,Avamar 的算法将识别出并仅备份新的、修改过的数据段,从而显著减少需要发送和存储的备份数据量。

  图 1. EMC Avamar 软件可识别包含该数据的、具有唯一性的子文件可变长度数据段(在此示例中为 PowerPoint 演示文稿)。而且将在全局范围内(跨所有站点和服务器)仅存储每个数据段的单个实例。

什么是Scale Up和Scale Out?

导读:Scale Out(也就是Scale horizontally)横向扩展,向外扩展 Scale Up(也就是Scale vertically)纵向扩展,向上扩展 无论是Scale Out,Scale Up,Scale In,实际上就是一种架构的概念,这些概念用在存储上可以,用在数据库上,网络上一样可以。 简单比喻下Sc

Scale Up,Scale Out,

作者:管理员




现在致电4006-2991-90 OR 查看更多联系方式 →

Go To Top 回顶部