首页
正文
2020/02/28

你还在用这种方法搭建Hadoop吗?

戴尔官方企采中心
如果让你在钥匙和手机中选一个
你会选哪个?

相信很多人选手机
吃饭、购物、打车、取钱
没有是手机干不了的
想回家也不难

手机App上找个开锁公司就好了

而如果选钥匙
你可能还没出小区大门

就开始后悔了...

手机对于今天人们生活的

重要性不言而喻

这样的例子小编再举一个

就是Hadoop对于大数据的重要性

▓ 从2006年诞生至今,Hadoop已经走过了13个年头,成为互联网行业大数据计算的标准配置。虽然时有言论唱衰Hadoop(主要针对商业发行版,而不是Hadoop技术本身),但它依然是大数据平台的核心和事实标准。

今天,几乎所有公司开展大数据项目都会首先引入Hadoop,然而成功却并不容易。2016年的时候Gartner估计有60%的大数据项目遭遇失败。这中间当然有市场、策略等在内的很多因素,但其中一个因素很多人回过头才发现,是因为它们一开始就走在了“羊肠小道”上。

 比如下面这个案例 


搭建标准Hadoop集群

还没上线就出问题

IT系统架构师小王供职于一家提供数据服务的A公司,该公司通过网络爬虫7×24不间断在互联网上收集所有注册企业的公开的信息,进行数据处理和信息聚合,供其用户进行查询。

最近,A公司业务上有了新的创新,他们决定在现有提供查询服务的基础上,进一步对外提供数据分析服务。经公司讨论决定,这个任务,落到了小王的头上。

借鉴互联网公司的经验,小王最开始用标准服务器搭建标准Hadoop集群。该平台对外提供Hadoop as a service服务,每当用户有请求,平台都会自动帮用户生成一套Hadoop环境,同时加载300+TB由公司提供的公共数据进去。

但是,这样的平台

在前期测试阶段就出现了问题


首先
当出现一个节点故障时,前端用户使用系统时会感觉非常慢,极端情况下甚至出现过部分数据不可用,集群停止服务等问题。同时故障修复过程也非常缓慢,严重影响了用户体验。

作为一个外部服务平台,这样的表现显然无法满足A公司及其外部用户SLA要求。



其次

作为一个多租户平台,同时要支撑很多套Hadoop集群运行,并且每套Hadoop集群都会存储一份由A公司提供的300+TB公共数据。大量重复数据存储造成的空间开销异常高,直接导致需要部署的服务器数量惊人,而A公司所有IT设备均托管在运营商机房,久而久之造成机房的租用成本高企。



最后

大批量服务器部署带来的运维成本对IT部门也是很大的负担。

面对这种情况

只能硬着头皮用下去吗?

当然不是!

小编向您推荐

Isilon for Hadoop解决方案

PowerMax NVMe 数据存储

端到端 NVMe,支持横、纵向扩展

参考价格:咨询客服获取特惠价了解详情

SC 系列 全闪存

欢迎选择更好的闪存架构

参考价格:咨询客服获取特惠价了解详情

“等等!Isilon我是知道的,它不是你们常说的那个用在影视行业很牛掰的NAS存储嘛?它能如何帮到我??”


不错,Isilon确实是以NAS的形象闻名于江湖

但是它可不仅仅定位于NAS!

Isilon由英特尔®至强®处理器提供支持,该处理器采用软件定义的基础设施和敏捷云架构,为Isilon提供了卓越的性能和效率,可加速要求严苛的文件工作负载,使企业发挥数据资本的价值,加速业务的数字转型。

Isilon搭建Hadoop

大数据也能玩的溜

其实,戴尔易安信Isilon是一个成熟的数据湖解决方案,它的OneFs操作系统支持丰富数据访问协议,当一种协议写入数据湖的文件,可以马上通过其他协议被访问。

例如,用户通过SMB写入到Isilon中的文件,可以马上通过HDFS被Hadoop计算节点访问,省去了标准Hadoop集群繁琐的ELT过程,而且OneFs原生支持HDFS,避免了协议转换带来的性能开销。

具体来说

用Isilon来架构Hadoop集群

比标准Hadoop集群更具优势



首先
传统通过DAS构建的,是计算和存储集中的单层架构,在扩容时需要同时扩容计算和存储,往往会造成计算资源过剩,形成资源浪费。
而通过Isilon构建地是计算与存储分离的二层架构。让计算归计算,存储归存储,这样就可以随需灵活地扩充资源,实现最佳资源利用率。


打个比方

单层架构好比一个人被绑住双脚,不能走,只能跳,前行速度慢且吃力。

二层架构好比一个人的双脚挣脱了束缚,迈开步子往前跑,自然前进地更快。





其次

利用DAS构建的标准Hadoop集群,需要将各类在线数据经过繁琐的ETL过程才能实现大数据分析。

而通过Isilon构建Hadoop集群,能够实现数据的就地分析,无需繁琐的转换,从而避免了协议转换带来的性能开销。



最后

就像前面小王案例中遇到的,当出现一个节点故障时,前端用户就会受到显著的影响,这就是标准DAS Hadoop无法避免的单点故障风险。

而基于Isilon搭建的Hadoop集群无单点故障,每个节点都是NameNode,能够有效避避免业务风险。此外,Isilon的服务质量更有保证,即使有节点失效,也不会显著降低集群的性能。




具体到A公司新业务的应用场景

  • Isilon支持多租户,可以轻松实现不同用户的Hadoop环境逻辑上完全隔离。
  • 配合Smart Dedupe技术,可以在全局将多Hadoop实例中的共用数据进行重删,实现极佳的存储经济性。

  • 每个节点都是NameNode,更高可用性。

  • Isilon集群还能随需动态扩展高性能节点或大容量节点,实现最佳的投入产出比。

总之,相较于标准架构用服务器搭建Hadoop集群,采用Isilon方案能够为A公司节省更多机柜空间和能耗,简化运维管理和功能实现方式,并提供更可靠的数据服务和更丰富的接口支持,便于用户进一步的业务创新。

用好Hadoop不难

关键要走在事半功倍的道路上


相关内容推荐:“鸳鸯锅”玩转大数据

在线咨询
项目咨询
采购咨询专线400-884-6610
订阅偏好享优先通知
0元试用图片
热门评论
暂无相关评论
删除回复
回复
删除回复
更多回复
查看全部条评论
{{dataFromApi ? '您是否在找' : '其他企业都在看'}}
{{item.slogan}}
{{item.slogan}}
{{item.title}}
咨询客服获取特惠价{{item.sale}}{{item.price}}{{item.sale}} {{item.price}}
项目咨询
发表评论...
  • 在线客服
    联系客服
    (工作日 08:30-17:30)
  • 项目咨询
  • 采购咨询专线
    400-884-6610
    (工作日 08:30-17:30)
  • 售后咨询专线
    7*24小时客户支持
    400-886-8616
    400-886-8618
取消发送
取消发送
热门评论
删除回复
回复
删除回复
更多回复
暂无相关评论
发表评论...
发送
戴尔官方企采中心
删除该评论,是否确认操作?
取消
确认

参与问卷提交即有机会成为幸运用户,

赢取精彩礼品一份,寻找幸运的你,快来参与吧!

立即参与>>
5秒后自动关闭
取消
最近搜索
    热门搜索
    • AI PC
    • 2025新品
    • Dell Pro 笔记本
    • Dell Pro 台式机
    • Dell Pro Max 工作站
    • Dell Pro 显示器
    • 17G 服务器
    • 数据存储
    • 数据保护

    如果您对当前页面内容感兴趣,

    可填写“项目咨询单”,

    进行专业咨询及帮助。

    戴尔企采中心
    戴尔专线客服
    暑期大放价,焕新3.7折起!注册享免费抽奖、0元试用、千元好礼、万元服务、资产回收等。详情咨询在线客服或拨打400-884-6610
    请在这里输入内容
    发送
    管理您的Cookie
    戴尔使用不同类型的 Cookie 来优化您的体验并启用某些网站功能,改善您的整体网页浏览体验。请注意,如果阻止 Cookie,则可能会影响您的网站体验,并可能对我们可提供的服务或功能造成影响。
    基本

    允许用户在我们的网站上移动以及提供访问诸如您的个人资料和购买、登录凭据以及网站其他区域等功能的访问权限。

    营销

    用于了解我们网站上的用户行为,并展示与您的兴趣更相关的广告。

    统计

    通过收集和报告信息,帮助我们了解访问者如何与我们的网站互动。

    * 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。

    拒绝
    确认
    取消
    确认
    请确认您的邮箱地址,
    我们会发送下载链接至您的邮箱。
    请填写正确邮箱
    您的企业近期是否有采购 IT 产品的计划?
    请选择
    提交并获取下载链接
    提交成功,下载链接已发送到您的邮箱,
    请查收!

    戴尔发布针对AI领域服务器产品

    还剩2页未读

    图片标题

    戴尔发布针对AI领域服务器产品

    批量议价
    填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
    OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020
    为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠
    型号

    8G 1TB SAS H330 DVDRW 495W

    参考价格
    6499.006499.00咨询客服获取特惠价
    意向购买数量
    1
    * 公司名称
    请输入公司名称
    * 姓名
    请输入姓名
    * 手机
    请输入手机
    * 邮箱
    请输入邮箱
    * 需求描述
    请选择
    采购专线
    联系客服
    提交
    *验证码无效
    确认
    全新PowerEdge DSS8840
    DSS8440是一款2路4U服务器,旨在为机器学习应用提供极高的性能,配备多达10个加速器
    PowerEdge DSS840 型号1
    PowerEdge DSS840 型号2

    恭喜您,秒杀成功!

    后续工作人员会与您进行联系

    抱歉,您没有抢到!

    您还可以参与其他产品的秒杀活动哦

    请输入兑换码

    PowerVault ME4012
    限时免费升级 / 提速不加价 / 性能秒提7倍
    限时促销
    5秒后自动关闭

    感谢您的报名

    返回首页
    请输入验证口令
    复制以下链接观看视频
    复制
    Toast 内容
    补全信息
    请补全您的身份信息
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请准确填写您的邮箱
    完整报告即时发送到您的邮箱
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请选择标签,将有助于提供精准服务
    您对哪类产品感兴趣?
    • 云
    您将应用于哪个领域?
    • 大数据
    • 软件定义
    请输入您的企业邮箱与手机号,方便后续发送资料
    企业邮箱

    请输入企业邮箱

    手机号

    请输入手机号

    订阅成功

    我们将每月通过邮箱发送资料报告发给您

    成功图片
    关闭
    文章标题
    文章标题
    文章标题
    文章标题
    订阅您感兴趣的内容,我们将每月通过邮箱发送资料报告发给您
    开启订阅
    长按扫码关注戴尔企采网
    了解更多企采会员福利
    长按识别跳转小程序
    手机号绑定
    手机icon图标

    请输入手机号

    验证码icon图标
    获取验证码

    请输入验证码

    绑定手机号
    绑定手机号的三大理由
    1.网信办规定,互联网注册用户要提供基于移动电话号码等的真实身份。
    2.微信授权登录出现故障时,仍用手机号顺利登录,会员各项权益及活动不受影响。
    3.绑定手机号即可享受免费抽奖、0元试用、积分兑换好礼等会员权益。
    loading请稍后...
    订阅弹层
    订阅表单弹层
    邮箱:
    姓名:
    订阅成功弹层
    {{form.textBtnText}}
    {{form.textBtnText}}
    {{form.subBtnText}}
    去注册
    {{form.textBtnText}}
    获取“戴尔资产报告”
    请提供设备使用方的相关信息,以免影响后续保修
    立即获取
    获取“戴尔资产报告”
    您已提交成功,请您注意查收邮件,“戴尔资产报告”将在2个工作日以邮件的形式发送给您
    查看设备保修情况
    注册有礼
    去认证