求教:该如何把数据集喂给 pod 内的模型训练容器呢? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
TravisMtg
V2EX    Kubernetes

求教:该如何把数据集喂给 pod 内的模型训练容器呢?

  •  
  •   TravisMtg 2022-10-20 08:23:30 +08:00 via iPhone 2725 次点击
    这是一个创建于 1087 天前的主题,其中的信息可能已经有所发展或是发生改变。
    x 问题:在做一个类似 kubeflow 的 MLOPS 的东西,整了一个模型想在 k8s 跑跑看,目前训练过程已经放进 docker ,希望将数据集直接挂载到 pod 上。

    已经了解了 pv ,pvc 的概念,也在网上搜了一些教程,但是都是目前看到的都是用来持久化**生产**出来的数据的。不用 hostpath 这种方法,有办法直接把数据文件夹和 pod 绑定让 pod 内的容器消费吗?
    提前谢谢各位
    13 条回复    2022-10-21 10:04:13 +08:00
    jack80342
        1
    jack80342  
       2022-10-20 08:26:15 +08:00 via iPhone   1
    直接用 pv 、pvc 就可以,你是遇到什么问题了吗?
    TravisMtg
        2
    TravisMtg  
    OP
       2022-10-20 08:29:32 +08:00 via iPhone
    @jack80342 谢谢回复。我现在遇到的问题是不知道该怎么提前把数据放进 pv 当中。
    liunaijie
        3
    liunaijie  
       2022-10-20 08:36:06 +08:00   1
    用 docker -v 把你本地数据挂进 pod 的某个目录
    optional
        4
    optional  
       2022-10-20 08:36:21 +08:00 via iPhone   1
    使用 initialContainer 把数据下载进去,数据可以放 s3 等地方
    TravisMtg
        5
    TravisMtg  
    OP
       2022-10-20 08:47:55 +08:00 via iPhone
    @optional 谢谢解答,这个看起来就是我想要的
    julyclyde
        6
    julyclyde  
       2022-10-20 09:37:11 +08:00   1
    pv 也不是“只能被”容器访问的啊
    你也可以单独访问 pv 把内容放进去,然后再启动容器
    ccde8259
        7
    ccde8259  
       2022-10-20 10:01:34 +08:00 via iPhone   1
    这种场景为什么不用 HDFS+YARN……
    winglight2016
        8
    winglight2016  
       2022-10-20 10:05:35 +08:00   1
    数据在本地就 kubectl cp ,在云上就 curl/wget ,目的文件夹选 pvc 的挂载地址

    如果长期大量存储,还是推荐 oss ,毕竟会便宜一些
    sujin190
        9
    sujin190  
       2022-10-20 10:52:09 +08:00   1
    云平台的 k8s 都支持挂载自己的对象存储吧,比如阿里云的 ack 挂载 oss ,华为云 cce 挂载 obs ,如果数据在自己机器上的话装个 nfs ,pod 直接挂载 nfs 就行,当然这些都是网络访问的,你不单独购买的网络的话访问速度估计都不快,如果数据不经常变,比较好的是买块云磁盘,先挂载到某个机器上完成数据上传,之后卸载了 pod 再选择挂载该云磁盘就行,用 initialContainer 下载也行,不过数据比较多来回训练也太耗时了,而且你还的保证 pod 宿主机有足够硬盘才行
    yyttrr
        10
    yyttrr  
       2022-10-20 11:36:09 +08:00   1
    我们这边做法是训练前这一次的数据是确定的,存放在 oss 上,启动的时候有个 initContainer 负责把这个数据拉到一块盘上
    YouRTBUG
        11
    YouRTBUG  
       2022-10-20 13:25:45 +08:00   1
    kubernetes-csi 机制来导入外部存储, 我们的存储端是 ceph(s3), 所以用了 ceph-csi 通过 pod 里的 pv 和 pvc 概念挂载到 pod 中。
    pandaxin
        12
    pandaxin  
       2022-10-20 19:09:09 +08:00
    看下 juicefs
    zhujq
        13
    zhujq  
       2022-10-21 10:04:13 +08:00
    看下 juicefs
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5480 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 08:42 PVG 16:42 LAX 01:42 JFK 04:42
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86