• 首页 > 数据存储频道 > 数据.存储频道 > 存储资讯

    戴尔易安信EC一个专为满足移动、云、大数据和社交网络应用程序需求而设计的云存储平台

    2021年12月28日 17:33:03   来源:戴尔易安信解决方案订阅号

      从一幅幅“像素风”的NFT虚拟图画,拍卖出了千万美元天价,到“元宇宙”大热,竟能引发虚拟世界“抢房买地”热潮,这是否预示着一个巨大的范式转变?

      登顶财富500强

      一个标志性时刻即将来临

      近日,IT媒体《eWEEK》发表一篇文章认为,在2020年,财富500强上的前十大公司中,有八家与石油或能源相关。这一事实清楚地表明了石油在当今世界的主导地位,即在过去100年来,石油是推动全球经济增长的核心驱动力

      然而这一情况即将发生转变。预计在2022年,按收入计算,亚马逊将登顶全球财富500强。这也许是一个标志性事件,意味着世界从以能源和石油为基础的经济转向数据驱动型经济

      文章表示,到2030年,包括苹果、***、谷歌在内,全球财富十大公司中,有8家可能是数据驱动型公司。正如中东和苏伊士运河在石油时代具有重要战略地位,数据也将数字时代重要的“战略资源”

      这也是如此之多的企业在数字化道路上狂飙突进的原因,掌握数据即是预见未来,才能在竞争中占领“制高点”

      数据价值如何挖掘

      当然,光有数据还不够,正如石油本身并没有什么作用,而是需要提炼、加工,才能把石油变作燃料、化纤、塑料等等。数据本身也没有价值,只有经过收集、整理和分析,将数据转化为见解,才能真正驱动商业价值

      在这里,“数据湖”三个字你一定不会陌生,这个最早在2010年由Pentaho创始人James Dixon提出,并这样解释这个概念“

      如果你将数据集市视为瓶装水的存储——经过清洗、包装和组织以方便消费,数据湖是一个处于更自然状态的大水体。来自源头的内容流补充到湖中,各类客户可以来湖中检测、探索以及获取样本。

      ”

      不幸的是,数据湖的发展并非一帆风顺,因为早期的概念里, 数据湖更多地是关于当企业在处理海量异构的数据时,如何在数据产生实际的应用价值之前,为海量数据构建一个易访问且成本低的存储方式。

      用户把数据扔进湖中,然后任其自生自灭,已经有多次公开的失败证明这种方法是错误的,一些早期采用者看到他们的数据湖迅速演变为管理不善或无人管理的数据沼泽

      随着时间的推移,今天用于实施数据湖的技术和方法已经趋于成熟。数据湖作为大数据和人工智能技术基础架构发展的趋势,不仅提供了海量数据的存储能力,同时也为上层的数据处理提供了高效统一的数据管理引擎。

      数据湖的主要特点:

      ▶ 第一:存储原始数据,这些原始数据来源非常丰富;

      ▶ 第二:支持多种计算模型;

      ▶ 第三:有完善的数据管理能力,要能做到多种数据源接入,实现不同数据之间的连接,支持Schema管理和权限管理等;

      ▶ 第四:灵活的底层存储,一般用s3、hdfs这种分布式文件系统,采用特定的文件格式和缓存,满足对应场景的数据分析需求。

      技术上,数据湖不仅包括Hadoop,还包括其他传统和新兴大数据技术。下图所示的是典型数据湖结构:在一个数据湖解决方案中,用户通过诸如Apache Flink等平台,通过自带的数据定义或者第三方框架的数据定义,对存储在存储层的数据进行管理,包括查询和修改等。

      其中,Apache Iceberg则是一个新兴的数据定义框架,它适配了多个计算引擎,并具备了极强的扩展性,使得存储层可以对其进行适配。

      与Apache Iceberg结合

      戴尔推出对象数据湖解决方案

      Iceberg与Delta、Apache Hudi并称为当前主流的三大开源数据湖方案。其特点是表元数据非常简单,仅仅包括当前表的名称和版本信息。所有的Schema和Properties都由Iceberg自身进行管理。

      并且,Iceberg支持多种表的操作,包括从表中查询数据、向表中插入数据、更新表中的数据、删除指定行的数据和删除指定条件的数据等。

      Iceberg架构

      而为了全面拥抱数据湖,戴尔易安信对象存储ECS与Apache Iceberg结合,推出对象数据湖解决方案。该方案实现了table-format的数据访问接口,在数据加速、小文件、多地部署以及存储效率上具备优越的特性。

      关于ECS

      戴尔易安信ECS是完全软件定义的云存储平台,专为满足移动、云、大数据和社交网络应用程序需求而设计,支持在商用硬件上大规模存储、操作和分析非结构化数据。

      数据湖在本质上,是一种企业数据架构方法,物理实现上则是一个数据存储平台。ECS对象存储作为数据湖底层存储方案,用此方案可以将数据湖的元数据和数据都直接对接对象存储,充分利用对象存储提供的原生优势,并且无需部署额外的元数据管理服务,提供了更大的部署便利性。同时利用Iceberg良好的Table Format语义,用于帮助用户组织数据。

      根据测试验证,单节点S3写性能10KB大小的数据能达到1万以上TPS,100MB大小的数据能达到1GB以上带宽。单节点 S3读性能10KB大小的数据能达到3万以上TPS,100MB大小的数据能达到5GB以上带宽。成为企业构建统一数据湖存储,并在其上构建多种形式分析的理想方案

      为了更好支持该解决方案的执行,还发布了相关白皮书,读者可复制下方链接至浏览器打开,下载白皮书,了解更多内容:

      https://www.delltechnologies.com/asset/zh-cn/products/storage/industry-market/apache-iceberg-dell-emc-ecs.pdf

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    [No. H001]
    分享到微信

    即时探行数字人注册免费试用

    中兴二合一 5G 云电脑“逍遥”系列上架:一键切换双模式,

    5 月 10 日消息,据中兴通讯官微,中兴二合一 5G 云电脑“逍遥”系列已经在电商平台上架。其支持本地、云端双模式,可在电脑与平板模式之间一键切换。售价方面,型号为 W200DS 的产品首销价格为 1899 元。

    新闻探行AI智能外呼系统 节省80%人力成本

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT探行AI客服 24小时无休机器人接待

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费探行AI视频 快速生成真人营销视频

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究探行AI整体解决方案 全国招募代理

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。