首页
正文
2018/01/16

“去重+压缩”完美诠释“1+1=0”

张冠群



点击“戴尔企业级解决方案”快速订阅

“

“1+1”在什么情况下等于0?

在算错的情况下等于0!

Excuse me?

小编从不打诳语,

一脸认真地告诉说,

“数据压缩+重复数据删除”等于0

想知道为什么?

欲知详情,且看下文分解…

”


一谈到重复数据删除,很多人想到的就是虚拟带库;而一提到压缩,想到的就是文件和视频。在讨论重复数据删除和压缩怎么用之前,我们先来看一下什么是重复数据删除,什么是压缩。


存储空间、预算 双双告急!

你考虑过这个办法吗?


重复数据删除,简单来说就是遇到重复数据时,不是保存重复数据的副本,取而代之的是增加一个指向第一份(并且是唯一一份)数据的索引。从根本上讲,它能减少存储数据所占用的空间。这样做会带来诸多好处,如节约IT经费、无须为额外空间增加投资入;减少备份数据、数据快照等的大小;较少电源压力;节约网络带宽;节约时间。


数据压缩有各种各样的算法,但是究其本质,还是一种编码技术。假如,我们将这篇文章常用的字符串“重复数据压缩”六个字编码为“去重”,那么本文中的字数就会相应地减少,即便这样也还是有多份“去重”存在。


重复数据删除与数据压缩的主要区别在于:假如你有两份完全相同的数据(File or Block Level),数据压缩会对每份数据进行编码,进而用简单编码代替复杂编码。而重复数据删除则能辨别出这是两份相同的数据,从而只保存第一个数据,并通过指针将第二份数据指向第一份源数据。


所以我们看到,重复数据删除和压缩在本质上是不矛盾的,如果能在数据存储中既使用重复数据删除技术,又使用数据压缩技术,那一定是事半功倍的。


既然重复数据删除和压缩技术这么好,那么你有想过在生产存储上用去重和压缩吗?


其实很多IT经理都想在生产存储上用去重和压缩,但是却有很多的担心,可以说是一言难尽。让我们先来看一份调研数据:


如上图所示,2016年,ESG针对373位IT人员就“数据存储环境业务挑战”的调研显示,排名第二位的就是数据的快速增长。小编私下里也和多位资深的IT运维人员交流过他们的数据增长情况。


A君:“当初规划的时候,明明是考虑到了未来三年内的数据增长,结果刚用了一年空间就不够了。”


B君:“每年的IT预算都在降低,存储空间越来越紧张。”


小编:“你有考虑过用去重和压缩吗?”


“考虑过,一是不知道具体能省多少空间,但最主要还是担心对现有应用系统造成影响,比如对性能的影响、对可靠性的影响、对运维的影响等等。如果导致数据丢失,那就得不偿失了。”


那么今天,小编就带着大家来看看这个问题,戴尔的存储是如何解决这些问题的。


数据去重与数据压缩联动出击

数据去重比竟达50:1


我们还是先用数据说话,来看一份调研数据,同样是来自ESG的测试数据。



据图表数据显示,在不同应用环境下,经过数据压缩和重复数据删除之后,数据量都有大幅的缩减。而如果单使用压缩技术,数据的缩减量却并不是十分明显。这些主要是和应用的数据类型以及压缩算法有关,而大多数应用环境,在应用压缩和重复数据删除以后,数据的缩减量都非常的可观。从ESG基于实际应用环境的测试结果来看,实现了非常好的数据缩减。


“由于应用环境的不同以及特定数据的复杂类型,很难有一个特定的标准值来描述压缩和去重的效率。戴尔SC存储的目的是通过一个全面的方法提供最佳的用户价值(见上图)。戴尔SC系列存储通过分层架构(SSD以及HDD),精简克隆等技术实现了上述目标。同时,数据效率被大幅改善,经过ESG实验室基于实际应用数据的测试达到了66.75%。整个12TB的数据,实现了3:1的数据去除。相比之前ESG实验室的测试结果,包括在线压缩去重,戴尔SC系列存储都表现出了非常好的性能。”(编者译,源自ESG测试报告)。


具体压缩率数据请参照下表:


从这个数据表中,我们能更清楚的看到压缩和重复数据删除的效果。其中很多IT经理比较关注VMware环境,我们看到,在使用数据压缩后,能够实现2:1的压缩率,而将重复数据删除和数据压缩结合在一起来使用,数据变为了不到原来的30%。可以说这对使用VMware虚拟化环境的客户是一个非常好的消息。即便是在VDI环境,经过压缩和去重之后,也能实现2:1的去除率。在Hyper-V环境,更是达到了惊人的50:1的去除率。由此可见,在戴尔SC存储上使用重复数据删除和数据压缩,确实能有效的提高整个存储的利用率。


担心性能被拖垮?

SC系列告诉你,不存在!


那么,打开压缩和重复数据删除功能以后,对存储性能会有什么影响呢?最主要的得益于SC系列存储独特的体系结构设计,整个压缩和去重过程几乎对性能没有影响。下面,我们就来分析一下这个问题。


首先我们先来看一下SC系列存储的体系结构设计。我们说SC存储设计的核心是闪存,是新一代的体系结构,原因正是基于此。如下图所示,在SC存储内部,最多可将存储分为三个层次,分别是T1、T2、T3。这个分层过程是系统自动的,比如,如果添加7.2K的NL SAS,那么系统会默认的把它分到T3,如果添加WI SSD,那么系统就会把它默认分到T1。由于RAID10和RAID5在读写性能上的差异,我们知道同种类型的磁盘组RAID10写性能要优于RAID5而读性能基本相当,所以SC存储在每一层里面又会分为RAID10和RAID5两种条带类型。



其次最关键的一点,所有系统新写入的数据都放在T1的RAID10里面,而每过一段时间,系统就会做一个Data Progression,保存数据bitmap之后将数据块属性变为只读。之后,将不活跃的数据逐渐迁移到下一层,比如T1 RAID10到T1 RAID 5或者T1 RAID5到T2 RAID10。通过这种方式,整个存储的性能永远是T1的性能,而无需进行调优。如果使用中,觉得性能不够,就需要相应的添加T1的磁盘,如果觉得容量不够,就可以添加性价比最高的T3磁盘。SC存储正是通过这种方式,实现了最优的性价比!


而重复数据删除和数据压缩的过程就发生在Data Progression的过程中。在去重过程中,Page被移动到专用的存储空间。重复数据删除的页面为4 KB大小的切片,并基于切片制作Hash指纹。用Hash指纹对比重复数据删除的字典进行查询,以查看切片是否已被保存在字典中。如果已经保存,则读取两者的源数据进行比较,以确保数据一致,如果一致之后会将切片删除。如果不一致,则分别保存切片数据以及Hash指纹,并做相应的更新。压缩过程与去重过程近似。



由以上SC存储的架构和去重压缩过程可见,SC的去重压缩过程其实是后去重压缩过程,得益于SC的分层流动存储架构,整个去重过程不会影响生产数据的性能。因为生产数据的“写”性能全部发生在T1的RAID10组里面, “读”也绝大部分发生在T1的SSD里面,故可以达到理想的数据去重效率,即平均数据去除率66%。所以,即便是在生产存储中使用也无需担忧。需要说明的是,客户也无需为去重和压缩花费额外的费用,只要客户的存储环境中有一定数量的SSD磁盘,就可以使用戴尔SC存储的去重和压缩功能啦!


说到这里,其实戴尔SC存储还有两个包含在基础软件包里的功能,可以让客户在VMware虚拟机环境使用压缩和重复数据删除的时候如虎添翼。一个是VVols,另一个是QoS。


VVols,可以让存储直接映射虚拟卷给VM虚拟机,而无需将整个卷硬设备host主机。有了VVols,虚拟机管理员使用熟悉的VSphere工具为每台虚拟机选择SC系列策略,存储管理员只需定义可供虚拟机管理员使用的策略的菜单。另一项功能就是QoS,说起来更厉害了,有了QoS,存储管理员可以给每个卷设置属性文件profile,可以限制这个卷的IOPS以及MB/s。同时也可以给一组卷设置整个Group的IOPS以及MB/s。



看到这儿,相信你已经揭开1+1等于0的谜底了。简单来说,戴尔SC存储利用先进的分层流动存储架构在进行数据压缩和重复数据删除的同时,对生产数据的性能影响为“零”。另外,借助VVols、QoS以及压缩和重复数据删除功能一起在生产环境中使用,真的可以灵活、高效的进行管理,实现事半功倍,按需分配。


在线咨询
项目咨询
采购咨询专线400-884-6610
订阅偏好享优先通知
热门评论
暂无相关评论
删除回复
回复
删除回复
更多回复
查看全部条评论
{{dataFromApi ? '您是否在找' : '其他企业都在看'}}
{{item.slogan}}
{{item.slogan}}
{{item.title}}
咨询客服获取特惠价{{item.sale}}{{item.price}}{{item.sale}} {{item.price}}
项目咨询
发表评论...
  • 在线客服
    联系客服
    (工作日 08:30-17:30)
  • 项目咨询
  • 采购咨询专线
    400-884-6610
    (工作日 08:30-17:30)
  • 售后咨询专线
    7*24小时客户支持
    400-886-8616
    400-886-8618
取消发送
取消发送
热门评论
删除回复
回复
删除回复
更多回复
暂无相关评论
发表评论...
发送
张冠群
删除该评论,是否确认操作?
取消
确认

参与问卷提交即有机会成为幸运用户,

赢取精彩礼品一份,寻找幸运的你,快来参与吧!

立即参与>>
5秒后自动关闭
取消
最近搜索
    热门搜索
    • AI PC
    • 2025新品
    • Dell Pro 笔记本
    • Dell Pro 台式机
    • Dell Pro Max 工作站
    • Dell Pro 显示器
    • 17G 服务器
    • 数据存储
    • 数据保护

    如果您对当前页面内容感兴趣,

    可填写“项目咨询单”,

    进行专业咨询及帮助。

    戴尔企采中心
    戴尔专线客服
    暑期大放价,焕新3.7折起!注册享免费抽奖、0元试用、千元好礼、万元服务、资产回收等。详情咨询在线客服或拨打400-884-6610
    请在这里输入内容
    发送
    管理您的Cookie
    戴尔使用不同类型的 Cookie 来优化您的体验并启用某些网站功能,改善您的整体网页浏览体验。请注意,如果阻止 Cookie,则可能会影响您的网站体验,并可能对我们可提供的服务或功能造成影响。
    基本

    允许用户在我们的网站上移动以及提供访问诸如您的个人资料和购买、登录凭据以及网站其他区域等功能的访问权限。

    营销

    用于了解我们网站上的用户行为,并展示与您的兴趣更相关的广告。

    统计

    通过收集和报告信息,帮助我们了解访问者如何与我们的网站互动。

    * 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。

    拒绝
    确认
    取消
    确认
    请确认您的邮箱地址,
    我们会发送下载链接至您的邮箱。
    请填写正确邮箱
    您的企业近期是否有采购 IT 产品的计划?
    请选择
    提交并获取下载链接
    提交成功,下载链接已发送到您的邮箱,
    请查收!

    戴尔发布针对AI领域服务器产品

    还剩2页未读

    图片标题

    戴尔发布针对AI领域服务器产品

    批量议价
    填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
    OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020
    为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠
    型号

    8G 1TB SAS H330 DVDRW 495W

    参考价格
    6499.006499.00咨询客服获取特惠价
    意向购买数量
    1
    * 公司名称
    请输入公司名称
    * 姓名
    请输入姓名
    * 手机
    请输入手机
    * 邮箱
    请输入邮箱
    * 需求描述
    请选择
    采购专线
    联系客服
    提交
    *验证码无效
    确认
    全新PowerEdge DSS8840
    DSS8440是一款2路4U服务器,旨在为机器学习应用提供极高的性能,配备多达10个加速器
    PowerEdge DSS840 型号1
    PowerEdge DSS840 型号2

    恭喜您,秒杀成功!

    后续工作人员会与您进行联系

    抱歉,您没有抢到!

    您还可以参与其他产品的秒杀活动哦

    请输入兑换码

    PowerVault ME4012
    限时免费升级 / 提速不加价 / 性能秒提7倍
    限时促销
    5秒后自动关闭

    感谢您的报名

    返回首页
    请输入验证口令
    复制以下链接观看视频
    复制
    Toast 内容
    补全信息
    请补全您的身份信息
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请准确填写您的邮箱
    完整报告即时发送到您的邮箱
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请选择标签,将有助于提供精准服务
    您对哪类产品感兴趣?
    • 云
    您将应用于哪个领域?
    • 大数据
    • 软件定义
    请输入您的企业邮箱与手机号,方便后续发送资料
    企业邮箱

    请输入企业邮箱

    手机号

    请输入手机号

    订阅成功

    我们将每月通过邮箱发送资料报告发给您

    成功图片
    关闭
    文章标题
    文章标题
    文章标题
    文章标题
    订阅您感兴趣的内容,我们将每月通过邮箱发送资料报告发给您
    开启订阅
    长按扫码关注戴尔企采网
    了解更多企采会员福利
    长按识别跳转小程序
    手机号绑定
    手机icon图标

    请输入手机号

    验证码icon图标
    获取验证码

    请输入验证码

    绑定手机号
    绑定手机号的三大理由
    1.网信办规定,互联网注册用户要提供基于移动电话号码等的真实身份。
    2.微信授权登录出现故障时,仍用手机号顺利登录,会员各项权益及活动不受影响。
    3.绑定手机号即可享受免费抽奖、0元试用、积分兑换好礼等会员权益。
    loading请稍后...
    订阅弹层
    订阅表单弹层
    邮箱:
    姓名:
    订阅成功弹层
    {{form.textBtnText}}
    {{form.textBtnText}}
    {{form.subBtnText}}
    去注册
    {{form.textBtnText}}
    获取“戴尔资产报告”
    请提供设备使用方的相关信息,以免影响后续保修
    立即获取
    获取“戴尔资产报告”
    您已提交成功,请您注意查收邮件,“戴尔资产报告”将在2个工作日以邮件的形式发送给您
    查看设备保修情况
    注册有礼
    去认证