首页
正文
2018/12/07

工程师笔记|浅析AI平台的架构设计

戴建功
“ 

关于机器学习,很多人都强调算法而忽视了基础架构的作用,一种看似“高大上”的算法集成到实际环境中,也可能用起来“水土不服”,原因就在于基础架构的支持力度不够。所以,基础架构和算法同等重要,这里我们从AI平台基础架构中至关重要的存储架构,谈一谈AI平台的架构设计, 供相关人员参考。

”

目前,在政策和市场的双重驱动下,我国人工智能发展获得长足进步,“言必谈AI”已经成为各个科技公司技术峰会和企业间交流必不可少的话题。各家企业希望借力AI加速自身业务的发展和创新,通过AI帮助企业在数字化转型的浪潮中取得先发优势。

梦想回归现实,话语落到行动,因而,搭建自己的AI平台成为了最近两年很多企业的重点战略规划。

数字化转型

搭建一个AI平台,在哪里搭建?这是企业首先需要考虑的问题。是署在本地,还是部署在云端?这需要根据自身业务特点来选择,不过,无论你的AI平台在哪个地方,其基本流程都可分为四个步骤:

❶ 把原始数据从各种数据源导入到数据湖,进行数据拆分、清洗等数据预处理工作;

❷ 把数据交给AI训练集群通过机器学习神经算法框架进行训练;

❸ 训练完成后就可以把得到的最优参数设置模型,进行人工智能应用的部署;

❹ 最后把机器学习的数据进行归档。

有人说人工智能应用构建最重要的是算法框架。这种说法笔者并不苟同,框架或平台尽管重要,但也可能因行业发展流行或衰退,所以,AI平台的构建并不能只懂算法,因为算法实现不等于问题解决,问题解决不等于现场问题解决。

data lack参考架构

而追求高可用、高性能、灵活易用的基础架构才是永恒不变的。Google就是依靠强大的基础架构能力让 AI 研究领先于业界,因为基础架构知识是AI工程师进行高效团队协作的共同语言。工业界的发展让深度学习、自动机器学习成为可能,未来将会有更多人关注底层的架构与设计。

因此,今天的主题就是浅析对AI平台基础架构中至关重要的存储架构需求▼:

如果把机器学习训练集群中的GPU比作飞驰的高铁列车,那么一个优秀的AI平台数据管道就像高铁网络中的铁轨。当你考虑如何从你的AI部署中获取最佳结果时,数据管道或许是最重要的考量点。

数据管道

▒ 我们知道企业级存储主要有三种模式:基于数据块的SAN存储,基于文件的NAS存储和对象存储。首先SAN存储因为自身无法实现跨不同主机共享数据,不适合直接用于AI平台,可以排除;其次对象存储达不到AI平台数据管道所需的高性能也可以排除,所以文件存储是一个不错的选择,但有些因素必须考虑▼:

➣ 选择何种文件系统

• 横向扩展架构例如Lustre 或者 GPFS;

• HDFS,通用的大数据文件系统;

• NFS,最广泛部署的共享文件系统。

➣ 能够存放各种来源的结构化和非结构化数据,而不牺牲性能

• 日志和传感器数据;

• 数据库数据:包括关系型数据库和非关系型数据库;

• 邮件日志;

• 个人主目录;

• 其他数据类型。

➣ 同时满足随机小IO和顺序大IO的性能

• 从上面列举的数据来源可以看到一些数据源产生的是随机小IO,而有些数据源是顺序大IO;

• 文件系统必须能够在两者之间平衡性能。

➣ 最大性能和数据移动的能力:

• 文件系统的最大性能;

• 能够高效的移动数据。

➣ 数据生命周期的自动化

• 自动分层智能决定不同数据集的存储位置,比如高性能层,归档层等;

• 同时满足数据分类和过滤过程的实时性能;

➣支持最新的存储和内存介质如NVMe和SCM等,从而在性能和延迟上获得数量级的提升

你的AI平台选择的文件系统和数据架构至少应该满足以上条件,这对AI平台的长久发展非常重要。

 

单一命名空间

AI数据集能够轻易地增长到很大规模,为适应这种数据大规模增长,需要一个可以横向扩展的单一命名空间文件系统,并且能够随着客户端训练节点的扩展而线性提升存储性能。

▒ 客户端访问这个单一命名空间有不同的方式,不同方式意味着不同的性能要求,一种训练模型为异步训练,数据集被静态地分布于训练集群节点,每次训练只有一个节点访问命名空间中的一部分特定数据。

戴尔易安信R940xa和R840服务器

戴尔易安信R940xa和R840服务器

专为AI平台优化设计

另一种训练模型为同步进行,数据集相互关联紧耦合在一起,需要被训练集群中所有节点同时访问。这种情形明显需要更高的文件系统性能。

还有一种多层神经网络训练模型,每个训练节点有序地从文件系统中读出数据集进行训练,这样就导致整个数据集不断地被反复读取,一个节点读一次,不断地换手。

➣ 除了上述几点外,在选择AI平台的文件系统存储时还有一些其他因素也需要考虑,包括:

• 易于管理;

• 扩展简单;

• 支持多租户和存储QoS;

• 支持客户端缓存;

• 产品技术持续更新能力。

 

你会选择何种数据架构?

相信以上我们所讨论的标准能够帮助你选择一个适合AI需求的文件系统和数据架构,如果还是不清楚也没有关系。戴尔易安信的AI解决方案满足上述所有要求,包括Lustre横向扩展高性能存储解决方案,原生支持HDFS的ISilon横向扩展NAS 解决方案,自动分层的横向扩展Fluid NFS解决方案。

戴尔易安信Lustre横向扩展高性能存储架构

戴尔易安信Lustre横向扩展高性能存储架构

戴尔易安信横向扩展高性能文件系统

戴尔易安信横向扩展高性能文件系统

每一种方案都在国内的AI研究机构和相关企业已有落地的案例参考。正在筹划搭建自己的AI平台的企业机构,可以咨询戴尔易安信专业的人工智能解决方案专家了解各方案的优劣和特点,从而根据自己的建设需要,从长远考虑选择最适合自己的AI平台。

未来已来,戴尔易安信端到端解决方案为企业的AI平台建设全方位助力,加速组织数字化转型。


在线咨询
项目咨询
采购咨询专线400-884-6610
订阅偏好享优先通知
热门评论
暂无相关评论
删除回复
回复
删除回复
更多回复
查看全部条评论
{{dataFromApi ? '您是否在找' : '其他企业都在看'}}
{{item.slogan}}
{{item.slogan}}
{{item.title}}
咨询客服获取特惠价{{item.sale}}{{item.price}}{{item.sale}} {{item.price}}
项目咨询
发表评论...
  • 在线客服
    联系客服
    (工作日 08:30-17:30)
  • 项目咨询
  • 采购咨询专线
    400-884-6610
    (工作日 08:30-17:30)
  • 售后咨询专线
    7*24小时客户支持
    400-886-8616
    400-886-8618
取消发送
取消发送
热门评论
删除回复
回复
删除回复
更多回复
暂无相关评论
发表评论...
发送
戴建功
删除该评论,是否确认操作?
取消
确认

参与问卷提交即有机会成为幸运用户,

赢取精彩礼品一份,寻找幸运的你,快来参与吧!

立即参与>>
5秒后自动关闭
取消
最近搜索
    热门搜索
    • AI PC
    • 2025新品
    • Dell Pro 笔记本
    • Dell Pro 台式机
    • Dell Pro Max 工作站
    • Dell Pro 显示器
    • 17G 服务器
    • 数据存储
    • 数据保护

    如果您对当前页面内容感兴趣,

    可填写“项目咨询单”,

    进行专业咨询及帮助。

    戴尔企采中心
    戴尔专线客服
    您好,我们的在线客服人工咨询时间为工作日的 8:30-17:30,感谢您的咨询! 请留下您的联系方式,我们会在下个工作日第一时间与您取得联系,祝您生活愉快,工作顺利~
    管理您的Cookie
    戴尔使用不同类型的 Cookie 来优化您的体验并启用某些网站功能,改善您的整体网页浏览体验。请注意,如果阻止 Cookie,则可能会影响您的网站体验,并可能对我们可提供的服务或功能造成影响。
    基本

    允许用户在我们的网站上移动以及提供访问诸如您的个人资料和购买、登录凭据以及网站其他区域等功能的访问权限。

    营销

    用于了解我们网站上的用户行为,并展示与您的兴趣更相关的广告。

    统计

    通过收集和报告信息,帮助我们了解访问者如何与我们的网站互动。

    * 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。

    拒绝
    确认
    取消
    确认
    请确认您的邮箱地址,
    我们会发送下载链接至您的邮箱。
    请填写正确邮箱
    您的企业近期是否有采购 IT 产品的计划?
    请选择
    提交并获取下载链接
    提交成功,下载链接已发送到您的邮箱,
    请查收!

    戴尔发布针对AI领域服务器产品

    还剩2页未读

    图片标题

    戴尔发布针对AI领域服务器产品

    批量议价
    填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
    OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020
    为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠
    型号

    8G 1TB SAS H330 DVDRW 495W

    参考价格
    6499.006499.00咨询客服获取特惠价
    意向购买数量
    1
    * 公司名称
    请输入公司名称
    * 姓名
    请输入姓名
    * 手机
    请输入手机
    * 邮箱
    请输入邮箱
    * 需求描述
    请选择
    采购专线
    联系客服
    提交
    *验证码无效
    确认
    全新PowerEdge DSS8840
    DSS8440是一款2路4U服务器,旨在为机器学习应用提供极高的性能,配备多达10个加速器
    PowerEdge DSS840 型号1
    PowerEdge DSS840 型号2

    恭喜您,秒杀成功!

    后续工作人员会与您进行联系

    抱歉,您没有抢到!

    您还可以参与其他产品的秒杀活动哦

    请输入兑换码

    PowerVault ME4012
    限时免费升级 / 提速不加价 / 性能秒提7倍
    限时促销
    5秒后自动关闭

    感谢您的报名

    返回首页
    请输入验证口令
    复制以下链接观看视频
    复制
    Toast 内容
    补全信息
    请补全您的身份信息
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请准确填写您的邮箱
    完整报告即时发送到您的邮箱
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请选择标签,将有助于提供精准服务
    您对哪类产品感兴趣?
    • 云
    您将应用于哪个领域?
    • 大数据
    • 软件定义
    请输入您的企业邮箱与手机号,方便后续发送资料
    企业邮箱

    请输入企业邮箱

    手机号

    请输入手机号

    订阅成功

    我们将每月通过邮箱发送资料报告发给您

    成功图片
    关闭
    文章标题
    文章标题
    文章标题
    文章标题
    订阅您感兴趣的内容,我们将每月通过邮箱发送资料报告发给您
    开启订阅
    长按扫码关注戴尔企采网
    了解更多企采会员福利
    长按识别跳转小程序
    手机号绑定
    手机icon图标

    请输入手机号

    验证码icon图标
    获取验证码

    请输入验证码

    绑定手机号
    绑定手机号的三大理由
    1.网信办规定,互联网注册用户要提供基于移动电话号码等的真实身份。
    2.微信授权登录出现故障时,仍用手机号顺利登录,会员各项权益及活动不受影响。
    3.绑定手机号即可享受免费抽奖、0元试用、积分兑换好礼等会员权益。
    loading请稍后...
    订阅弹层
    订阅表单弹层
    邮箱:
    姓名:
    订阅成功弹层
    {{form.textBtnText}}
    {{form.textBtnText}}
    {{form.subBtnText}}
    去注册
    {{form.textBtnText}}
    获取“戴尔资产报告”
    请提供设备使用方的相关信息,以免影响后续保修
    立即获取
    获取“戴尔资产报告”
    您已提交成功,请您注意查收邮件,“戴尔资产报告”将在2个工作日以邮件的形式发送给您
    查看设备保修情况
    注册有礼
    去认证