突破叙事尺度 刻画极致人物 迷雾剧场《漂白》1月17日上线爱奇艺1月20日手机数码国补落地京东 超千万国补商品等你挑选超千万货品已备足 1月20日来京东购手机享国家补贴每件最高500元拥抱创新科技,探寻体育变革之路—— 第二届LALIGA EXTRATIME体育行业论坛在京成功举办斑马技术《2025全球消费者调查报告》:注重防损管理,增强顾客体验终端创企Nothing拟募资1亿美元 一加联合创始人创立恩智浦获欧洲投资银行 10 亿欧元贷款,用于在欧多国研发创新工作入手松下ZS99相机新品首选京东 售价2998元可先人一步入手1月20日打开京东搜索「1」 3C数码“疯狂星期一”爆款低至1元当代年轻人用上AI,从夸克开始消息称iPhone SE 4将有白色和黑色 预计3月份推出全球PC市场迎来温和复苏:2024年出货量增长1.3%,联想和苹果表现亮眼比亚迪已在韩国推出Atto 3 预计2月中旬开始交付发展新质生产力 赋能健康产品力 ——劲牌有限公司2024年度科技责任(成果)报告美光减产后 SK海力士也计划将上半年NAND闪存产量削减一成赵明离职信曝光:离开荣耀是人生中最艰难的决定消息称京东服饰换帅,阿里前高管担任负责人这年头,谁在互联网上学这么“硬核”的AI?开战2025,本地生活商家「另辟蹊径」年底Mini LED电视到底怎么选?认准这些新技术不踩雷!
  • 首页 > 数据存储频道 > 数据.存储频道 > 存储资讯

    戴尔易安信EC一个专为满足移动、云、大数据和社交网络应用程序需求而设计的云存储平台

    2021年12月28日 17:33:03   来源:戴尔易安信解决方案订阅号

      从一幅幅“像素风”的NFT虚拟图画,拍卖出了千万美元天价,到“元宇宙”大热,竟能引发虚拟世界“抢房买地”热潮,这是否预示着一个巨大的范式转变?

      登顶财富500强

      一个标志性时刻即将来临

      近日,IT媒体《eWEEK》发表一篇文章认为,在2020年,财富500强上的前十大公司中,有八家与石油或能源相关。这一事实清楚地表明了石油在当今世界的主导地位,即在过去100年来,石油是推动全球经济增长的核心驱动力

      然而这一情况即将发生转变。预计在2022年,按收入计算,亚马逊将登顶全球财富500强。这也许是一个标志性事件,意味着世界从以能源和石油为基础的经济转向数据驱动型经济

      文章表示,到2030年,包括苹果、特斯拉、谷歌在内,全球财富十大公司中,有8家可能是数据驱动型公司。正如中东和苏伊士运河在石油时代具有重要战略地位,数据也将数字时代重要的“战略资源”

      这也是如此之多的企业在数字化道路上狂飙突进的原因,掌握数据即是预见未来,才能在竞争中占领“制高点”

      数据价值如何挖掘

      当然,光有数据还不够,正如石油本身并没有什么作用,而是需要提炼、加工,才能把石油变作燃料、化纤、塑料等等。数据本身也没有价值,只有经过收集、整理和分析,将数据转化为见解,才能真正驱动商业价值

      在这里,“数据湖”三个字你一定不会陌生,这个最早在2010年由Pentaho创始人James Dixon提出,并这样解释这个概念“

      如果你将数据集市视为瓶装水的存储——经过清洗、包装和组织以方便消费,数据湖是一个处于更自然状态的大水体。来自源头的内容流补充到湖中,各类客户可以来湖中检测、探索以及获取样本。

      ”

      不幸的是,数据湖的发展并非一帆风顺,因为早期的概念里, 数据湖更多地是关于当企业在处理海量异构的数据时,如何在数据产生实际的应用价值之前,为海量数据构建一个易访问且成本低的存储方式。

      用户把数据扔进湖中,然后任其自生自灭,已经有多次公开的失败证明这种方法是错误的,一些早期采用者看到他们的数据湖迅速演变为管理不善或无人管理的数据沼泽

      随着时间的推移,今天用于实施数据湖的技术和方法已经趋于成熟。数据湖作为大数据和人工智能技术基础架构发展的趋势,不仅提供了海量数据的存储能力,同时也为上层的数据处理提供了高效统一的数据管理引擎。

      数据湖的主要特点:

      ▶ 第一:存储原始数据,这些原始数据来源非常丰富;

      ▶ 第二:支持多种计算模型;

      ▶ 第三:有完善的数据管理能力,要能做到多种数据源接入,实现不同数据之间的连接,支持Schema管理和权限管理等;

      ▶ 第四:灵活的底层存储,一般用s3、hdfs这种分布式文件系统,采用特定的文件格式和缓存,满足对应场景的数据分析需求。

      技术上,数据湖不仅包括Hadoop,还包括其他传统和新兴大数据技术。下图所示的是典型数据湖结构:在一个数据湖解决方案中,用户通过诸如Apache Flink等平台,通过自带的数据定义或者第三方框架的数据定义,对存储在存储层的数据进行管理,包括查询和修改等。

      其中,Apache Iceberg则是一个新兴的数据定义框架,它适配了多个计算引擎,并具备了极强的扩展性,使得存储层可以对其进行适配。

      与Apache Iceberg结合

      戴尔推出对象数据湖解决方案

      Iceberg与Delta、Apache Hudi并称为当前主流的三大开源数据湖方案。其特点是表元数据非常简单,仅仅包括当前表的名称和版本信息。所有的Schema和Properties都由Iceberg自身进行管理。

      并且,Iceberg支持多种表的操作,包括从表中查询数据、向表中插入数据、更新表中的数据、删除指定行的数据和删除指定条件的数据等。

      Iceberg架构

      而为了全面拥抱数据湖,戴尔易安信对象存储ECS与Apache Iceberg结合,推出对象数据湖解决方案。该方案实现了table-format的数据访问接口,在数据加速、小文件、多地部署以及存储效率上具备优越的特性。

      关于ECS

      戴尔易安信ECS是完全软件定义的云存储平台,专为满足移动、云、大数据和社交网络应用程序需求而设计,支持在商用硬件上大规模存储、操作和分析非结构化数据。

      数据湖在本质上,是一种企业数据架构方法,物理实现上则是一个数据存储平台。ECS对象存储作为数据湖底层存储方案,用此方案可以将数据湖的元数据和数据都直接对接对象存储,充分利用对象存储提供的原生优势,并且无需部署额外的元数据管理服务,提供了更大的部署便利性。同时利用Iceberg良好的Table Format语义,用于帮助用户组织数据。

      根据测试验证,单节点S3写性能10KB大小的数据能达到1万以上TPS,100MB大小的数据能达到1GB以上带宽。单节点 S3读性能10KB大小的数据能达到3万以上TPS,100MB大小的数据能达到5GB以上带宽。成为企业构建统一数据湖存储,并在其上构建多种形式分析的理想方案

      为了更好支持该解决方案的执行,还发布了相关白皮书,读者可复制下方链接至浏览器打开,下载白皮书,了解更多内容:

      https://www.delltechnologies.com/asset/zh-cn/products/storage/industry-market/apache-iceberg-dell-emc-ecs.pdf

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. H001]
    分享到微信

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。

    研究

    中国信通院罗松:深度解读《工业互联网标识解析体系

    9月14日,2024全球工业互联网大会——工业互联网标识解析专题论坛在沈阳成功举办。