首页
正文
2021/04/21

Dell EMC NFS 存储解决方案|哥斯拉 vs. 金刚,谁赢了?

戴尔官方企采中心

                   

                   

话说前阵子上映的

好莱坞大片

《哥斯拉大战金刚》


                           

可在全国各地

掀起了一波观影浪潮


                           

两个原本在不同

电影世界里的巨兽

突然走到了同一个荧幕

成为本片的一大看点


                           

而电影海报

也很好展现了这种戏剧性

画面里哥斯拉和金刚

互相挥舞拳头

大战一触即发


                           

让人迫切想知道

谁才是真正的怪兽“一哥”


                           

那么,到底谁更厉害呢?

(提示:下文剧透警告) 


                   

                   


       

看过电影的小编表示,金刚被哥斯拉暴打...在第一次交手的时候,哥斯拉被一拳击中只是退了个踉跄,而金刚被打一拳直接倒在地上。到了第三次交手,金刚更是被打得奄奄一息...        

   

其实,这也不能怪金刚太弱,实在是对手太强了...“哥斯拉”的原型是生活在海洋岛屿上的一种蜥蜴,因为人类不加节制地进行核实验,引起了基因突变而变成了怪兽。它不仅有强悍的肉体,还有“原子吐息”这种BUG级别的魔法攻击。        

 

而金刚呢,说到底只是一只长得很大的的猩猩,虽然有人类一般的智慧,但在绝对实力面前,依然只有被碾压的份。        


这是不是也从侧面说明基因的重要性呢?        


 


       


                   

                               

                           

                               
了解你的基因                                    

                   

                       

说起基因,今年是第一版人类基因组序列图谱发布20周年。这20年里,基因测序技术的发展势如破竹,为生命科学的研究突破创造了不计其数的科学价值。
 

当前,基因测序在临床上的应用主要有两类,一类是针对普通人的疾病筛查,通过测定已知的与某种疾病相关的基因序列位点,来推断其未来罹患该种疾病的概率;另一类是针对癌症等致命性疾病的伴随诊断,通过测定某些特定的基因序列位点,在一系列的药物或治疗方案中找到针对特定患者最为有效的药物或方案。      

关于基因测序的流程,主要有以下几个步骤:        



测序数据分析流程(以全基因组分析为例)如下图:        



实验仪器测量数据处理和分析,首先通过实验仪器对生物分子进行测量,使用一些后处理软件对原始的大量数据进行处理和分析。然后对序列数据进行同源及相似性搜寻、比对、序列分析、遗传发育分析等。        


基因测序技术应用需要对海量、复杂、多变的数据进行分析计算,因此对高性能计算机的计算性能、内存容量、数据带宽等要求很高,同时还必须支持完善的基因测序分析工作流。        

   

在短短十几年间,基因测序技术已经形成了多个研究方向,其中与高性能计算相关的主要研究重点如下:    

    

01
序列比对

                       

序列比对(SequenceAlignment)的基本问题是比较两个或两个以上符号序列的相似性或不相似性。在序列对比的过程中,将会产生巨量的数据,这对我们的存储系统带来了较大规模的挑战,如下图:        


       

可以看出,现在用于存储的硬盘容量每14个月会有一倍的增长,而基因序列的数据量则每5月左右会翻一番。 

      

02
序列拼接

                       

序列拼接是将测序生成的reads短片段拼接起来,恢复出原始的序列。该问题是序列分析的最基本任务,是基因组研究成功与失败的关键,拼接结果直接影响到序列标注,基因预测、基因组比较等后续任务。

基因组序列的拼接也是基因组研究必须解决的首要难题。其困难不仅来自它的海量数据(以人类基因组序列为例,从数量为10兆级的片断恢复出长度为亿级的原始序列),而且源于它含有高度重复的序列。        

     

从计算机方面来讲,在拼接初期,会有大量的初始数据导入内存,然后对这些数据进行处理。因此,序列拼接对于计算机的内存量和计算能力都有非常大的需求。        

  

       


                   

                               

                           

                               
基因测序产品方案配置建议                                    

                   

根据以上基因测序软件的普遍特点,戴尔科技给出了如下的集群配置建议:        

  


(1)基因比对、拼接等计算非浮点密集型计算应用,CPU利用率、idle%呈现规律性交替变化,并且程序起始阶段CPU利用率低,主要进行I/O处理,高主频可加快进度,双路节点配置建议选用戴尔科技新一代PowerEdge服务器平台,提供最苛刻工作负载和卓越性能。        



(2)内存带宽随CPU利用率交替变化并且峰值并不高,内存容量需求较大,基本上是输入序列大小的5-6倍,单节点搭配8条或16条32GB或64GB内存即可满足中小规模算例需求。


对于大规模的基因拼接、比对计算,内存容量建议配置在2TB以上,PowerEdge R940xs服务器最大可支持6TB内存(单根128GB*48根),可充分保障计算需求。


(3)网络压力较低,仅在读写I/O时涉及到较多网络传输,普通10G或25G以太网即可满足网络带宽需求,选择高速InfiniBand网络也会在一定程度上降低延迟,提升效率。

 

(4)存储读写压力适中,磁盘读写均呈现阶段性,小规模算例存储读写峰值带宽均在500MB/s以下,选用存储服务器PowerEdge 740xd或740xd2即可满足需求。


中规模算例如人体全基因组比对、拼接等,在程序初始阶段输入文件磁盘读取、计算结果磁盘写阶段对存储的带宽压力会比较大,此时建议选择Dell EMC NFS存储解决方案(NSS),可提供5GB/s以上的带宽,更好地应对存储压力。

                   

                   

                               

                           

                               
Dell EMC NFS存储解决方案介绍                                    

                   

                       


Dell EMC NFS存储解决方案(NSS)是一种完全基于NFS的文件存储,提供包括所有必须的硬件、软件、性能指南、支持和部署服务,它实现了功能、性能和可扩展性的完美结合,能够处理大量数据请求,从而支持高达1PB(5U空间84盘位*12TB单盘容量)的原始存储空间。        


它由戴尔科技HPC专家采用成熟的戴尔易安信技术进行设计和优化,与未经优化的NFS解决方案相比,吞吐量可提高30%。在下面的案例中,戴尔科技采用最新的硬件设备和xfs,lvm 及lvs等技术,配置包括2台PowerEdge R740服务器,1台PowerVault ME4084存储,可用容量为640TB,以达到7GB/s的读和4.8GB/s写性能。

               


方案架构图图        


测试配置清单        


NSS7.4-HA服务器软件版本         

                   

测试摘要:                    


NSS7.4解决方案的I/O性能测试中,所有性能测试均在无故障的情况下进行,以测量解决方案的最大能力。测试重点是三种类型的I/O模式:大量的顺序读取和写入、小量的随机读取和写入,以及三项元数据操作(文件创建、统计和删除)。        


840TB(原始存储大小)配置通过EDR上的IPoIB网络连接进行了基准测试。使用32个节点计算群集来生成基准测试的工作负载。每个测试都在一系列客户端上运行,以测试解决方案的可扩展性。        

  

本研究中使用了IOzone和mdtest基准。IOzone用于顺序和随机测试。对于顺序测试,使用了1024KiB的请求大小。传输的数据总量为2TB,以确保NFS服务器高速缓存达到饱和。随机测试使用了4KiB请求大小,每个客户端读取并写入一个4GiB文件。使用mdtest基准配合OpenMPI执行了元数据测试,包括文件创建、统计和删除操作。        



IPoIB大规模顺序I/O性能        


       


IPoIB随机 I/O性能

IPoIB元数据操作                     

为了评估系统的元数据性能,使用了MDTest工具版本1.9.3。使用的MPI发行版为OpenMPI版本1.10.7。执行元数据测试的方法是:为最多32个线程数创建960000个文件,然后增加文件数,以测试解决方案的可扩展性,如表列出的结果。
         

元数据测试:跨线程分发文件和目录         



IPoIB文件创建性能
         


IPoIB文件统计性能

       

IPoIB文件删除性能        

       

测试结果汇总        

        

方案优势总结                    


适用于HPC NFS存储的Dell EMC Ready解决方案具有如下优势:        


0
1 
统一交付                    

提供基于标准的戴尔易安信PowerEdge服务器、PowerVault ME4存储产品以及Redhat的可扩展文件系统帮助用户部署NFS服务器,以达到最佳性能及可靠性。缩短用户的安装时间,降低了规划和部署存储系统的成本。                        

0
2 
高性能                    

针对HPC NFS存储的Dell EMC Ready解决方案对吞吐量性能进行了调整,存储单柜可支持5U84块硬盘,可提供7GB/s的读和4.8GB/s写性能。                        

0
3 
可扩展                    

通过在受支持的单个命名空间中轻松扩展多达64个节点,可以更轻松地满足未来需求,从而以更快的吞吐量运行更大、更复杂的应用程序。                        


另外,戴尔科技提供提供针对Dell EMC HPC NFS存储解决方案的安装和实施服务,戴尔科技现场部署工程师可将此解决方案部署至您的HPC环境或非HPC环境中,确保您的存储解决方案获得成功。         

        

                                       

尊敬的读者

                          

如果你想了解更多

戴尔科技在医疗行业的

领先优势和技术成果


欢迎参加4月23日

于杭州举办的

2021中华医院信息网络大会

         

戴尔科技将携手合作伙伴

带来全面的医疗IT基础架构

解决方案


欢迎扫描下图二维码

报名参会

                  

Ps. 今天成功报名预约的同学

还有机会抽取礼品~

▼

 


                                   

                                   


                     



本文转载自戴尔易安信解决方案公众号

相关内容推荐:戴尔春季新品特惠月开启|服务器、交换机、存储等产品钜惠进行中


在线咨询
项目咨询
采购咨询专线400-884-6610
订阅偏好享优先通知
0元试用图片
热门评论
暂无相关评论
删除回复
回复
删除回复
更多回复
查看全部条评论
{{dataFromApi ? '您是否在找' : '其他企业都在看'}}
{{item.slogan}}
{{item.slogan}}
{{item.title}}
咨询客服获取特惠价{{item.sale}}{{item.price}}{{item.sale}} {{item.price}}
项目咨询
发表评论...
  • 在线客服
    联系客服
    (工作日 08:30-17:30)
  • 项目咨询
  • 采购咨询专线
    400-884-6610
    (工作日 08:30-17:30)
  • 售后咨询专线
    7*24小时客户支持
    400-886-8616
    400-886-8618
取消发送
取消发送
热门评论
删除回复
回复
删除回复
更多回复
暂无相关评论
发表评论...
发送
戴尔官方企采中心
删除该评论,是否确认操作?
取消
确认

参与问卷提交即有机会成为幸运用户,

赢取精彩礼品一份,寻找幸运的你,快来参与吧!

立即参与>>
5秒后自动关闭
取消
最近搜索
    热门搜索
    • AI PC
    • 2025新品
    • Dell Pro 笔记本
    • Dell Pro 台式机
    • Dell Pro Max 工作站
    • Dell Pro 显示器
    • 17G 服务器
    • 数据存储
    • 数据保护

    如果您对当前页面内容感兴趣,

    可填写“项目咨询单”,

    进行专业咨询及帮助。

    戴尔企采中心
    戴尔专线客服
    您好,我们的在线客服人工咨询时间为工作日的 8:30-17:30,感谢您的咨询! 请留下您的联系方式,我们会在下个工作日第一时间与您取得联系,祝您生活愉快,工作顺利~
    管理您的Cookie
    戴尔使用不同类型的 Cookie 来优化您的体验并启用某些网站功能,改善您的整体网页浏览体验。请注意,如果阻止 Cookie,则可能会影响您的网站体验,并可能对我们可提供的服务或功能造成影响。
    基本

    允许用户在我们的网站上移动以及提供访问诸如您的个人资料和购买、登录凭据以及网站其他区域等功能的访问权限。

    营销

    用于了解我们网站上的用户行为,并展示与您的兴趣更相关的广告。

    统计

    通过收集和报告信息,帮助我们了解访问者如何与我们的网站互动。

    * 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。

    拒绝
    确认
    取消
    确认
    请确认您的邮箱地址,
    我们会发送下载链接至您的邮箱。
    请填写正确邮箱
    您的企业近期是否有采购 IT 产品的计划?
    请选择
    提交并获取下载链接
    提交成功,下载链接已发送到您的邮箱,
    请查收!

    戴尔发布针对AI领域服务器产品

    还剩2页未读

    图片标题

    戴尔发布针对AI领域服务器产品

    批量议价
    填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
    OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020
    为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠
    型号

    8G 1TB SAS H330 DVDRW 495W

    参考价格
    6499.006499.00咨询客服获取特惠价
    意向购买数量
    1
    * 公司名称
    请输入公司名称
    * 姓名
    请输入姓名
    * 手机
    请输入手机
    * 邮箱
    请输入邮箱
    * 需求描述
    请选择
    采购专线
    联系客服
    提交
    *验证码无效
    确认
    全新PowerEdge DSS8840
    DSS8440是一款2路4U服务器,旨在为机器学习应用提供极高的性能,配备多达10个加速器
    PowerEdge DSS840 型号1
    PowerEdge DSS840 型号2

    恭喜您,秒杀成功!

    后续工作人员会与您进行联系

    抱歉,您没有抢到!

    您还可以参与其他产品的秒杀活动哦

    请输入兑换码

    PowerVault ME4012
    限时免费升级 / 提速不加价 / 性能秒提7倍
    限时促销
    5秒后自动关闭

    感谢您的报名

    返回首页
    请输入验证口令
    复制以下链接观看视频
    复制
    Toast 内容
    补全信息
    请补全您的身份信息
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请准确填写您的邮箱
    完整报告即时发送到您的邮箱
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请选择标签,将有助于提供精准服务
    您对哪类产品感兴趣?
    • 云
    您将应用于哪个领域?
    • 大数据
    • 软件定义
    请输入您的企业邮箱与手机号,方便后续发送资料
    企业邮箱

    请输入企业邮箱

    手机号

    请输入手机号

    订阅成功

    我们将每月通过邮箱发送资料报告发给您

    成功图片
    关闭
    文章标题
    文章标题
    文章标题
    文章标题
    订阅您感兴趣的内容,我们将每月通过邮箱发送资料报告发给您
    开启订阅
    长按扫码关注戴尔企采网
    了解更多企采会员福利
    长按识别跳转小程序
    手机号绑定
    手机icon图标

    请输入手机号

    验证码icon图标
    获取验证码

    请输入验证码

    绑定手机号
    绑定手机号的三大理由
    1.网信办规定,互联网注册用户要提供基于移动电话号码等的真实身份。
    2.微信授权登录出现故障时,仍用手机号顺利登录,会员各项权益及活动不受影响。
    3.绑定手机号即可享受免费抽奖、0元试用、积分兑换好礼等会员权益。
    loading请稍后...
    订阅弹层
    订阅表单弹层
    邮箱:
    姓名:
    订阅成功弹层
    {{form.textBtnText}}
    {{form.textBtnText}}
    {{form.subBtnText}}
    去注册
    {{form.textBtnText}}
    获取“戴尔资产报告”
    请提供设备使用方的相关信息,以免影响后续保修
    立即获取
    获取“戴尔资产报告”
    您已提交成功,请您注意查收邮件,“戴尔资产报告”将在2个工作日以邮件的形式发送给您
    查看设备保修情况
    注册有礼
    去认证