首页
正文
2021/04/15

戴尔易安信数据湖解决方案|考虑建立数据湖?是时候了

戴尔官方企采中心

如果企业曾经对数字化转型

持有观望态度的话

那么相信经历过去一年

这样的疑虑都已被打消

实践表明

数字化转型越成熟

受到的影响越小

数字化转型的核心

就是以数据为中心

这也是为什么数据湖

在今天格外重要


在“十四五”规划纲要中,“数据”一词被提及几十次。从瓦特经济发展到比特经济,数据已经成为重要的生产资料。为了赢得未来竞争力、在突发事件到来时保持韧性,大数据时代企业需要借助数据湖挖掘全量数据价值。





数据湖:数据价值的“聚宝盆”                   


距离数据湖(Data Lake)的提出已有十一年了,相信大家对这个概念并不陌生。近两年随着大数据、云计算等技术的发展,数据湖开始真正从技术概念一步步走向实际应用。


先来看一下数据湖概念的提出者,Pentaho创始人兼CTO——James Dixon对其的描述:


“

如果把数据集市(Data Mart)看成是一个经过清洗、包装、结构化以后便于饮用的瓶装水仓库,那么数据湖就是一个更自然状态下的大水体。数据湖中的内容从源头流进湖中,用户可以在湖中进行检查、潜入或采集样本。

”


由此可见,数据湖强调的是对于业务数据“原汁原味”的保存,确保了数据的真实性和准确性。


以往人们都在强调数据量的几何式式增长,其实,随着暴增的数据量,需要存储的数据类型也愈来愈丰富。



多态数据结构:数据形态的多样性


传统的企业数据管理方案是建立数据仓库,相较于数据仓库只能处理结构化数据(如关系型数据库中的表),数据湖显得“包容”得多,它可以轻松收集各种数据,包括存储结构化数据,半结构化数据(如CSV、日志、XML、JSON),以及非结构化数据(如文本、图形、图像、音频、视频)。


国际数据公司IDC预测,到2023年,中国的数据量将达到40ZB,其中超过80%是非结构化数据。非结构化数据在共享、搜索和分析等使用过程中具有持续价值,它所反映的信息蕴含着诸多企业效益提高的机会。数据湖这种对多态数据结构的容纳能力正是未来企业不可或缺的。


正是基于大数据时代客户对非结构数据管理需要的洞察,此前,戴尔科技针对预测性大数据分析发布了横向扩展数据湖方案,帮助客户真正捕获大数据的价值,实现存储空间和性能的线性增长,从而保持更低的获取与管理的成本。


通过旗下PowerScale和ECS(Elastic Cloud Storage)等文件和对象存储产品,戴尔易安信多年来持续为各行业客户提供完整、可靠的数据湖解决方案。


以医疗机构为例,戴尔易安信数据湖解决方案可以同时支持PACS影像应用、心电超声应用、文件应用、移动办公应用、大数据科研等多种业务,而无需为每一种应用提供单独的存储平台,从而消除信息化建设过程中可能出现的数据孤岛。


▲医院数据湖平台示例图


除了把不同种类的数据汇聚到一起,数据湖的另一部分价值是不需要预定义的模型就能进行数据分析。


由于数据湖存储着来自业务线应用程序的关系数据,以及来自移动应用程序、IoT设备和社交媒体的非关系数据。捕获数据时,未定义数据结构或Schema。这意味着企业可以对数据使用不同类型的分析(如SQL查询、大数据分析、全文搜索、实时分析和机器学习)来获得信息。


数据湖适合以一致的方式利用大量数据,并使用算法驱动实时分析。如今,数据传输以及通信都需要实时运行,特别是气象测控、金融服务、网络监控等领域会产生大量的实时动态数据,对于持续生成动态新数据的大多数场景,采用流数据处理是有利的。



因此,能否对流数据进行有效分析处理也是企业未来面临的考验。戴尔科技流数据平台(Dell EMC Streaming Data Platform,简称SDP)的出现填补了流式数据领域的空缺。


SDP:流式数据领域的“垦荒者”


SDP是一套基于软件与参考硬件的弹性可伸缩平台,用于注入、存储和分析无界的流式数据。作为企业级的数据存储和计算一体化平台,SDP为用户提供了安全可扩展的平台,在平台内运行的每一个应用都同时支持实时数据和历史数据的访问,并且有统一的API支持。


▲SDP的整体架构示意图


随着核心、云和边缘不断产生新的数据,依靠在分布式存储方面深耕多年的经验,戴尔科技技术专家进一步提出深度定制数据湖的想法。这些创新想法将为用户更加灵活地在存储和计算之间寻找平衡,以适应不同的场景带来新的方向。





Flink×数据湖!干货先睹为快                  


4月17日,Apache Flink社区2021首场Meetup将于上海举行,技术大咖齐聚一堂全方位解析数据湖生产应用难题,届时戴尔科技技术专家也会带来关于数据湖的独家干货分享,亮点都为大家整理好了,一起来先睹为快!




嘉宾议题及观点


Iceberg和对象存储构建数据湖方案

孙伟

戴尔科技集团 高级软件研发经理


随着数据湖开始采用对象存储作为底层,戴尔科技技术专家发现当前对象存储和Apache Iceberg结合中存在的痛点。


比如二者的结合都要基于Hive等第三方组件来完成对接,缺少和企业级对象存储直接对接的能力。同时,结合方案在性能方面也存在瓶颈,在面对高性能场景时只能通过额外的缓存方案来弥补。


因此,戴尔科技技术专家研发出“Iceburg+S3”对象存储对接方案,该方案解除了对第三方组件的依赖,并改善了其中一些文件上传的性能瓶颈。


而在提供通用S3对象存储方案的基础上,戴尔科技技术专家进一步提出了基于戴尔科技ECS/ObjectScale对象存储的商业接口方案,使更加高性能的数据湖得以实现。


扫码进群发现更多精彩

▼▼▼


敬请关注本次Meetup,听取技术大咖的前沿妙论。期待戴尔科技技术专家在下一代流批一体的大数据平台上,贡献更好的商业和开源相结合的生态系统。



本文转载自戴尔科技集团公众号

相关内容推荐:2021,有关数据保护的 4 个认知|戴尔科技全方位守护您的数据


在线咨询
项目咨询
采购咨询专线400-884-6610
订阅偏好享优先通知
热门评论
暂无相关评论
删除回复
回复
删除回复
更多回复
查看全部条评论
{{dataFromApi ? '您是否在找' : '其他企业都在看'}}
{{item.slogan}}
{{item.slogan}}
{{item.title}}
咨询客服获取特惠价{{item.sale}}{{item.price}}{{item.sale}} {{item.price}}
项目咨询
发表评论...
  • 在线客服
    联系客服
    (工作日 08:30-17:30)
  • 项目咨询
  • 采购咨询专线
    400-884-6610
    (工作日 08:30-17:30)
  • 售后咨询专线
    7*24小时客户支持
    400-886-8616
    400-886-8618
取消发送
取消发送
热门评论
删除回复
回复
删除回复
更多回复
暂无相关评论
发表评论...
发送
戴尔官方企采中心
删除该评论,是否确认操作?
取消
确认

参与问卷提交即有机会成为幸运用户,

赢取精彩礼品一份,寻找幸运的你,快来参与吧!

立即参与>>
5秒后自动关闭
取消
最近搜索
    热门搜索
    • AI PC
    • 2025新品
    • Dell Pro 笔记本
    • Dell Pro 台式机
    • Dell Pro Max 工作站
    • Dell Pro 显示器
    • 17G 服务器
    • 数据存储
    • 数据保护

    如果您对当前页面内容感兴趣,

    可填写“项目咨询单”,

    进行专业咨询及帮助。

    戴尔企采中心
    戴尔专线客服
    您好,我们的在线客服人工咨询时间为工作日的 8:30-17:30,感谢您的咨询! 请留下您的联系方式,我们会在下个工作日第一时间与您取得联系,祝您生活愉快,工作顺利~
    管理您的Cookie
    戴尔使用不同类型的 Cookie 来优化您的体验并启用某些网站功能,改善您的整体网页浏览体验。请注意,如果阻止 Cookie,则可能会影响您的网站体验,并可能对我们可提供的服务或功能造成影响。
    基本

    允许用户在我们的网站上移动以及提供访问诸如您的个人资料和购买、登录凭据以及网站其他区域等功能的访问权限。

    营销

    用于了解我们网站上的用户行为,并展示与您的兴趣更相关的广告。

    统计

    通过收集和报告信息,帮助我们了解访问者如何与我们的网站互动。

    * 点击确认按钮或关闭Cookie弹窗代表您已同意以上内容。

    拒绝
    确认
    取消
    确认
    请确认您的邮箱地址,
    我们会发送下载链接至您的邮箱。
    请填写正确邮箱
    您的企业近期是否有采购 IT 产品的计划?
    请选择
    提交并获取下载链接
    提交成功,下载链接已发送到您的邮箱,
    请查收!

    戴尔发布针对AI领域服务器产品

    还剩2页未读

    图片标题

    戴尔发布针对AI领域服务器产品

    批量议价
    填写您的感兴趣的产品及个人信息,提交成功后会有专人与您沟通,为您提供专属底价。
    OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020OptiPlex 3050微塔式机和小型机Tower249020
    为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠为通用型商务应用程序设计的可靠
    型号

    8G 1TB SAS H330 DVDRW 495W

    参考价格
    6499.006499.00咨询客服获取特惠价
    意向购买数量
    1
    * 公司名称
    请输入公司名称
    * 姓名
    请输入姓名
    * 手机
    请输入手机
    * 邮箱
    请输入邮箱
    * 需求描述
    请选择
    采购专线
    联系客服
    提交
    *验证码无效
    确认
    全新PowerEdge DSS8840
    DSS8440是一款2路4U服务器,旨在为机器学习应用提供极高的性能,配备多达10个加速器
    PowerEdge DSS840 型号1
    PowerEdge DSS840 型号2

    恭喜您,秒杀成功!

    后续工作人员会与您进行联系

    抱歉,您没有抢到!

    您还可以参与其他产品的秒杀活动哦

    请输入兑换码

    PowerVault ME4012
    限时免费升级 / 提速不加价 / 性能秒提7倍
    限时促销
    5秒后自动关闭

    感谢您的报名

    返回首页
    请输入验证口令
    复制以下链接观看视频
    复制
    Toast 内容
    补全信息
    请补全您的身份信息
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请准确填写您的邮箱
    完整报告即时发送到您的邮箱
    * 姓名
    请输入姓名
    * 企业邮箱
    请输入企业邮箱
    * 公司全称
    请输入公司全称
    提交
    请选择标签,将有助于提供精准服务
    您对哪类产品感兴趣?
    • 云
    您将应用于哪个领域?
    • 大数据
    • 软件定义
    请输入您的企业邮箱与手机号,方便后续发送资料
    企业邮箱

    请输入企业邮箱

    手机号

    请输入手机号

    订阅成功

    我们将每月通过邮箱发送资料报告发给您

    成功图片
    关闭
    文章标题
    文章标题
    文章标题
    文章标题
    订阅您感兴趣的内容,我们将每月通过邮箱发送资料报告发给您
    开启订阅
    长按扫码关注戴尔企采网
    了解更多企采会员福利
    长按识别跳转小程序
    手机号绑定
    手机icon图标

    请输入手机号

    验证码icon图标
    获取验证码

    请输入验证码

    绑定手机号
    绑定手机号的三大理由
    1.网信办规定,互联网注册用户要提供基于移动电话号码等的真实身份。
    2.微信授权登录出现故障时,仍用手机号顺利登录,会员各项权益及活动不受影响。
    3.绑定手机号即可享受免费抽奖、0元试用、积分兑换好礼等会员权益。
    loading请稍后...
    订阅弹层
    订阅表单弹层
    邮箱:
    姓名:
    订阅成功弹层
    {{form.textBtnText}}
    {{form.textBtnText}}
    {{form.subBtnText}}
    去注册
    {{form.textBtnText}}
    获取“戴尔资产报告”
    请提供设备使用方的相关信息,以免影响后续保修
    立即获取
    获取“戴尔资产报告”
    您已提交成功,请您注意查收邮件,“戴尔资产报告”将在2个工作日以邮件的形式发送给您
    查看设备保修情况
    注册有礼
    去认证