听说你想把对象存储当 HDFS 用,我们这里有个方案... - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
CloudStorage
V2EX    推广

听说你想把对象存储当 HDFS 用,我们这里有个方案...

  •  
  •   CloudStorage 2021-11-25 10:43:44 +08:00 1645 次点击
    这是一个创建于 1421 天前的主题,其中的信息可能已经有所发展或是发生改变。

    传统的大数据集群往往采用本地中心化的计算和存储集群。比如在谷歌早期的 [三驾马车] 中,使用 GFS 进行海量网页数据存储,用 BigTable 作为数据库并为上层提供各种数据发现的能力,同时用 MapReduce 进行大规模数据处理。

    但随着互联网业务的发展,本地中心化的架构开始受到以下两个方面的挑战:

    • 数据增长越来越快,并且数据格式更加丰富多样,非结构化数据越来越多。传统的分布式存储引擎难以大规模存储和处理文本、音视频等非结构化数据。

    • 计算和存储强耦合在本地应用上,缺少弹性。强耦合的模式增加了企业成本,因为需要为计算或者存储的峰值需求准备资源。

    在大约 2015 年之后,由于对象存储具有极高的数据持久性,跨地域的容灾以及低成本等优势,AWS S3 等公有云对象存储服务逐渐替代了 HDFS ,成为越来越多企业的海量分布式存储引擎。

    尽管对象存储可以提供低成本的海量分布式存储,支持结构化、半结构化、非结构化数据的存储,由于对象存储和文件系统在元数据组织方式上的差异,导致原生的对象存储在传统文件系统元数据操作如 List 和 Rename 等操作上的性能差距较大。而在大数据场景下,整个 MapReduce 过程中往往会产生大量的 List 和 Rename 操作,相比原生的 HDFS ,在大数据分析效能会有明显的性能损失。

    为了满足客户基于对象存储的大数据分析的性能要求,腾讯云对象存储基于云 HDFS 的产品能力,推出了元数据加速特性,赋予对象存储以高性能的文件系统能力。 用户只需要在创建存储桶时开启元数据加速能力,即可使用文件系统语义访问对象存储,将对象存储的适用范围扩宽到大数据、高性能计算、机器学习,AI 等场景。

    元数据加速能力

    对象存储的文件元数据信息(比如文件名,文件的分块信息,文件分块所处的服务器信息等)存储在索引库表中。按照当前主流公有云对象存储的设计,会按照字典序返回文件索引信息;加上索引信息存储在 SSD 盘上,拉取索引信息的性能会受限于 SSD 盘单进程限制,因此每个存储桶的 List QPS 很难达到较高的数值。而原生对象存储中,Rename 操作实际上对应着一次文件 Copy 操作和一次 Delete 操作,MapReduce 过程中会存在大量 Rename 操作的性能并不高。

    针对这些问题,一个直观的解决方案是将元数据管理单独剖离出来,为上层计算业务提供兼容 HDFS 文件系统语义的访问能力,这就是对象存储的元数据加速能力。

    下图展示了元数据加速能力的一个简要示意图。区别于普通的对象存储,启用了元数据加速能力后,元数据相关的操作会路由到元数据加速层进行处理。

    有了元数据加速能力的加持,就可以直接将对象存储当做 HDFS 用,用文件系统语义来访问对象存储服务。一方面,这一能力极大地提升了 List 等大数据文件系统操作的性能;另一方面,也提供了 Rename 、Truncate 等典型的文件系统操作指令,提供了大数据生态兼容支持。

    如何使用

    您可以在控制台上非常便捷地为存储桶配置元数据加速能力。如下图所示,您可以在对象存储创建存储桶时开启元数据加速能力。

    开启元数据加速能力后,可以通过控制台、SDK 、API 或者 COSN 工具等方式上传文件( PutObject )、创建文件夹( CreateObject )、重命名文件( RenameObject )、追加写文件( AppendObject )或者截断文件( TruncateObject )等操作。

    性能表现

    上文提到元数据加速能力能够极大提升文件 List 和 Rename 等文件系统操作的性能。这一章节我们详细介绍具体的性能表现情况。

    我们使用 GooseFS 建立两个不同的命名空间,分别对接开启了元数据加速能力和未开启元数据加速能力的存储桶,分别 ls 和 ls -R 不同数量级的文件。本次测试主要验证元数据操作性能,因此文件大小统一设置为 0 B 。每组测试会多次测试取均值,主要评估指标为总延迟均值。

    详细的测试数据如下:

    元数据数量 指令类型 开启元数据加速能力 未开启元数据加速能力
    5W ls 4.359s 10.354s
    100W ls 7.065s 21.376s
    50W ls -R 4.359s 10.354s
    50W ls -R 7.065s 21.376s

    可以看到,相比起普通的对象存储服务,元数据加速能力可以至少一倍的 List 请求性能。

    而在 Rename 性能上,我们采用了同样的方式,多次重命名一个有 1000 个 100 KB 文件的目录,Rename 延迟测试数据如下:

    测试次数 开启元数据加速能力 未开启元数据加速能力
    1 1.016s 30.323s
    2 1.018s 29.789s
    3 1.011s 30.934s

    可以看到,相比起普通的对象存储服务,元数据加速能力可以数十倍地降低 Rename 请求延迟。

    写在最后

    元数据加速能力拓宽了对象存储服务的使用场景,在底层采用了云 HDFS 卓越的元数据管理功能,支持用户通过文件系统语义访问对象存储服务,系统设计指标可以达到 2.4Gb/s 带宽、10 万级 QPS 以及 ms 级延迟。存储桶在开启元数据加速功能后,可以广泛应用于大数据、高性能计算、机器学习、AI 等场景。 当前功能为公测能力,如需体验请加入对象存储服务群,联系我们开启。

    目前尚无回复
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     977 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 22:37 PVG 06:37 LAX 15:37 JFK 18:37
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86