首页
正文
2018/04/25

不用谢,这是我应该存的

康翔

π,是韦建文老师和上海交通大学高性能计算中心一众同事的骄傲。


这不是人们熟知的那个希腊字母,也并非指代圆周率,而是2013年10月23日落户到上海交大的一台超级计算机。该系统峰值性能达到263万亿次,当时位列全球第158、中国第11、上海市第1。


从97份应征稿件里,上海交通大学高性能计算中心最终选择了「π」为这台机器命名。在希腊文中,π具有并行的涵义;在数学中,作为无限不循环的无理数,π是人类理解无限的开始;在想象中,我们则可以将π看作交通大学首字母J和T的组合。


存储系统面临挑战

作为校级的超算平台,π的首要任务当然是满足校内的计算需求,然后才会考虑为外面的科研机构和公司提供服务。


不消说,π的到来为上海交大诸多院系带来充足火力,为超过130个课题组提供了数千万核小时的计算能力,资源利用率一般在60%左右,CPU的占用率则常年维持在70%以上。


π是当时全国高校里使用异构计算最大的集群规模,总共有332个节点,加速卡节点65个,20个胖节点(通常双路作为1个节点,胖节点指的是多路),还有130块GPU加速卡。韦建文表示,事实证明这些加速卡在分子计算等方面有很好的效果。


上海交大传统的强势学科,譬如物理、天文等学系,以及生命科学、医学等学院,迅疾将海量的计算任务托付给π,各种学科研究藉此得到了充足的发展和推动。一时间,举校上下好评如潮。


然而,问题终归还是来了。


存储容量的问题首当其冲。此前π配置了720TB的存储空间,本以为能够满足一段时期内的需求,孰料到2016年初,存储占用率就达到了90%——这简直已经是存储需求的「红色警戒」了。


与此同时,系统的管理运维过于复杂,特别是针对高性能计算的存储经验不是很足,占去了存储管理员的更多精力。


更具体的,还包括一些细节上的问题。譬如存储系统对小文件的读写速度不尽如人意,结果导致用户体验不佳的情况——这些校内用户们往往距离很近,蹬几分钟自行车就可以上门讨要说法了。


存储系统的升级,成为摆在上海交大高性能计算中心面前的紧要任务。


解析用户核心需求


针对上海交大超级计算机π的现状,戴尔公司进行了深入的研究与分析。


首先,在高性能计算领域,高效地将数据传入和传出计算节点至关重要,这通常会涉及到一些复杂的因素。超算系统能够以极高的速度产生和使用数据,存储倘若不能跟上的话,必然会成为整个超算系统的瓶颈,再强大的计算能力也无从发挥。


其次,对上海交大这种科研任务重、计算需求极大的用户来说,存储的扩展必须被考虑进去,数据对性能和容量的需求会持续不断地快速增加,因此新的存储系统必须能做到弹性、有序的扩展,不断提高存储的吞吐量和性能,从而为整个超算系统提供有力的支持。


最后,上海交大高性能计算中心为全校各个院系提供服务,人力资源相对紧张,不可能为管理和监控复杂的存储系统配备太多的管理员,因此新的存储系统必须易于管理。


戴尔认为,基于戴尔与英特尔在企业级Lustre 平台(Intel Enterprise Edition for Lustre,简称IEEL),能够完全满足上海交大高性能计算中心的要求。该存储解决方案使用Lustre这一领先的HPC开源并行文件系统,这也意味着它具有良好的可用性和可扩展性。


安装了IEEL的戴尔HPC存储设备,专门面向那些需要部署完全受支持、易于使用、具有高吞吐量、能够横向扩展且经济实惠的并行文件系统存储解决方案的学术和行业用户,是一款能够提供高性能和高可用的存储系统,此前在剑桥、华大基因等超算系统中均得到了良好的应用。


值得称道的是,该解决方案利用智能、丰富且直观的管理界面(Intel Manager for Lustre,简称IML),大大简化了所有硬件和存储系统组件的管理和监控。它在容量或/和性能方面易于扩展,从而为未来增长提供了方便的途径。


超算系统存储升级,鱼与熊掌不能得兼?戴尔说:No!


存储方案大体框架

为上海交大高性能计算中心设计的方案里,戴尔采用了第十三代企业级Dell PowerEdge R730机架服务器(6台),以及最新一代的高密度DELL PowerVault MD3420 (1台) +MD3460 (1台)磁盘阵列,作为整个存储系统的核心。


其中,DELL R730机架服务器用于元数据服务器+对象数据服务器,它的主要配置为:2路E5-2660 V3 2.6GHZ 10核心处理器,256GB RDIMM 2133Mhz DDR4内存,2块300GB的15000转硬盘,H730 1Gb缓存 RAID卡,以及冗余的750W白金级电源。


DELL MD3420磁盘阵列用于元数据存储系统,它配置了双12G的SAS控制器,以及16GB镜像保护缓存,配置24个800G MIX SSD,做成RAID10,并设置了2块热备盘和1块冷备盘。


DELL MD3460磁盘阵列用于对象数据存储系统,它同样配置了双12G的SAS控制器, 以及16GB镜像保护缓存,OST裸盘容量最高可以达到3840TB。做成RAID6(8+2)后,可用容量差不多是2553TB ,同样也设置了2个热备盘和1块冷备盘。


最后是英特尔Lustre商业版用于并行文件系统,提供了2个MDS、4个OSS授权。


至于本方案中同时涉及到的以太网交换机、IB交换机扩展卡、线缆等方面的内容,请点击阅读原文下载案例报告。


选择戴尔的理由

在一番比对和研讨之后,上海交大高性能计算中心最终选择了戴尔的产品方案,作为π2.0未来规划上线的二级存储系统。


韦建文老师表示,首先,戴尔产品方案的吞吐性能非常好,这一点尤其得到了高性能中心的高度认同。在这样的前提下,戴尔还能做到极富竞争力的价格,这简直是用户意想不到的BONUS了。


其次,戴尔有着非常好的本地支持服务,高性能中心完全不用担心备件问题,5年白金专业支持、一年无休的4小时上门服务,足以帮助高性能中心满足来自各个院系的严苛计算任务的需求。


再次,上海交大高性能中心对Lustre极为认可,这种文件系统彻底摒除了过去小文件读取存储的瓶颈,π的强大计算能力得以充分发挥。作为英特尔最为核心的合作伙伴,戴尔的设备上运行Lustre显得尤为高效。


最后,上海交大在选择供应商时,也非常注意供应商在高教领域的其他应用状况——虽然学校与学校之间各有各的不同,但是在高性能计算方面的需求,终归是相差不远。此前,高性能中心就已经了解到戴尔在全球很多名校,譬如剑桥超算系统的存储方面,均得到了很好的应用。


韦建文老师指出,在数据中心领域,戴尔有着非常高的市场占有率,其解决方案的软硬件配置也很透明。综合以上各种因素,上海交大高性能中心最终选择了戴尔。


应用痛点一扫而光

据悉,作为主存储系统,戴尔的产品方案目前已经在上海交大高性能中心投入使用,各个院系的数据基本已经迁移过来。原先的存储系统并没有被废弃,而是用作备份和二级存储,这也算得是对原有投资的某种保值。


从各方的反应来看,大家很满意,原有的应用痛点都得到了很好的解决,各个院系均反应新的存储系统更加高效和稳定。以生命科学学院的基因组测序为例,他们已经新增了100多TB的数据。在使用过程中,各种大小文件的读取和存储速度令人满意。


不止于此,存储管理员也得到了解放。通过IML提供的Web界面,管理员可以很方便地观看存储状况,并且在远程对一般性的故障和突发状况进行处理。


韦建文老师告诉我们,当前系统的存储容量已经提升到2PB,数据总量在其中所占比例已经下降到「红线」以下。不过考虑到各个院系的数据增长速度,高性能计算中心准备到后续将之扩容到3PB。


未来,上海交大高性能计算中心和π集群将会更多地向异构的方向发展,下一代会考虑高吞吐量的耦合计算能力。与此同时,高性能计算中心还在考虑在存储节点上使用闪存的可能,以便更进一步提升性能和IO带宽,为用户提供更好的计算和存储服务。


最后,韦建文老师表示,十分感谢戴尔公司提供如此优秀的产品和解决方案。


至于戴尔,则已经在本文的标题上做出回应了。


在线咨询
项目咨询
采购咨询专线400-884-6610
订阅偏好享优先通知
热门评论
暂无相关评论
删除回复
回复
删除回复
更多回复
查看全部条评论
{{dataFromApi ? '您是否在找' : '其他企业都在看'}}
{{item.slogan}}
{{item.slogan}}
{{item.title}}
咨询客服获取特惠价{{item.sale}}{{item.price}}{{item.sale}} {{item.price}}
项目咨询
发表评论...
  • 在线客服
    联系客服
    (工作日 08:30-17:30)
  • 项目咨询
  • 采购咨询专线
    400-884-6610
    (工作日 08:30-17:30)
  • 售后咨询专线
    7*24小时客户支持
    400-886-8616
    400-886-8618
取消发送
取消发送
热门评论
删除回复
回复
删除回复
更多回复
暂无相关评论
发表评论...
发送
康翔
删除该评论,是否确认操作?
取消
确认

参与问卷提交即有机会成为幸运用户,

赢取精彩礼品一份,寻找幸运的你,快来参与吧!

立即参与>>
5秒后自动关闭
取消
最近搜索
    热门搜索
    • AI PC
    • 2025新品
    • Dell Pro 笔记本
    • Dell Pro 台式机
    • Dell Pro Max 工作站
    • Dell Pro 显示器
    • 17G 服务器
    • 数据存储
    • 数据保护

    如果您对当前页面内容感兴趣,

    可填写“项目咨询单”,

    进行专业咨询及帮助。

    戴尔企采中心
    戴尔专线客服
    您好,我们的在线客服人工咨询时间为工作日的 8:30-17:30,感谢您的咨询! 请留下您的联系方式,我们会在下个工作日第一时间与您取得联系,祝您生活愉快,工作顺利~
    管理您的Cookie
    戴尔使用不同类型的 Cookie 来优化您的体验并启用某些网站功能,改善您的整体网页浏览体验。请注意,如果阻止 Cookie,则可能会影响您的网站体验,并可能对我们可提供的服务或功能造成影响。
    基本

    允许用户在我们的网站上移动以及提供访问诸如您的个人资料和购买、登录凭据以及网站其他区域等功能的访问权限。

    营销

    用于了解我们网站上的用户行为,并展示与您的兴趣更相关的广告。

    统计

    通过收集和报告信息,帮助我们了解访问者如何与我们的网站互动。

    * 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。

    拒绝
    确认
    取消
    确认
    请确认您的邮箱地址,
    我们会发送下载链接至您的邮箱。
    请填写正确邮箱
    您的企业近期是否有采购 IT 产品的计划?
    请选择
    提交并获取下载链接
    提交成功,下载链接已发送到您的邮箱,
    请查收!

    戴尔发布针对AI领域服务器产品

    还剩2页未读

    图片标题

    戴尔发布针对AI领域服务器产品

    批量议价
    填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
    OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020
    为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠
    型号

    8G 1TB SAS H330 DVDRW 495W

    参考价格
    6499.006499.00咨询客服获取特惠价
    意向购买数量
    1
    * 公司名称
    请输入公司名称
    * 姓名
    请输入姓名
    * 手机
    请输入手机
    * 邮箱
    请输入邮箱
    * 需求描述
    请选择
    采购专线
    联系客服
    提交
    *验证码无效
    确认
    全新PowerEdge DSS8840
    DSS8440是一款2路4U服务器,旨在为机器学习应用提供极高的性能,配备多达10个加速器
    PowerEdge DSS840 型号1
    PowerEdge DSS840 型号2

    恭喜您,秒杀成功!

    后续工作人员会与您进行联系

    抱歉,您没有抢到!

    您还可以参与其他产品的秒杀活动哦

    请输入兑换码

    PowerVault ME4012
    限时免费升级 / 提速不加价 / 性能秒提7倍
    限时促销
    5秒后自动关闭

    感谢您的报名

    返回首页
    请输入验证口令
    复制以下链接观看视频
    复制
    Toast 内容
    补全信息
    请补全您的身份信息
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请准确填写您的邮箱
    完整报告即时发送到您的邮箱
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请选择标签,将有助于提供精准服务
    您对哪类产品感兴趣?
    • 云
    您将应用于哪个领域?
    • 大数据
    • 软件定义
    请输入您的企业邮箱与手机号,方便后续发送资料
    企业邮箱

    请输入企业邮箱

    手机号

    请输入手机号

    订阅成功

    我们将每月通过邮箱发送资料报告发给您

    成功图片
    关闭
    文章标题
    文章标题
    文章标题
    文章标题
    订阅您感兴趣的内容,我们将每月通过邮箱发送资料报告发给您
    开启订阅
    长按扫码关注戴尔企采网
    了解更多企采会员福利
    长按识别跳转小程序
    手机号绑定
    手机icon图标

    请输入手机号

    验证码icon图标
    获取验证码

    请输入验证码

    绑定手机号
    绑定手机号的三大理由
    1.网信办规定,互联网注册用户要提供基于移动电话号码等的真实身份。
    2.微信授权登录出现故障时,仍用手机号顺利登录,会员各项权益及活动不受影响。
    3.绑定手机号即可享受免费抽奖、0元试用、积分兑换好礼等会员权益。
    loading请稍后...
    订阅弹层
    订阅表单弹层
    邮箱:
    姓名:
    订阅成功弹层
    {{form.textBtnText}}
    {{form.textBtnText}}
    {{form.subBtnText}}
    去注册
    {{form.textBtnText}}
    获取“戴尔资产报告”
    请提供设备使用方的相关信息,以免影响后续保修
    立即获取
    获取“戴尔资产报告”
    您已提交成功,请您注意查收邮件,“戴尔资产报告”将在2个工作日以邮件的形式发送给您
    查看设备保修情况
    注册有礼
    去认证