迫于不想单纯运维 K8s ,想整一些云原生领域的新东西落地。总的基调是:( 1 )降低成本;( 2 )提升可纳管的计算种类;目前想到了( 1 ) BigData on K8s ,将 flink 、spark 、kylin 等类型大数据应用部署到 K8s 里面,初步实现在、离混部与潮汐计算;( 2 )有状态应用部署,将 Redis 、kafka 、ZK 等,还有个别的有状态的应用部署到 K8s 中来(这个挑战可能较大)。大家还有啥好的思路吗?

又想到了一点就是用kubevirt管理虚拟机,省去购买很多虚机,改为买物理机后自己虚拟化,这样也能节省成本。
1 workingpad2 Feb 7, 2024 kubeflow |
2 mightybruce Feb 7, 2024 趋势和你列举的一部分重合,另一部分不是云原生领域。 像有状态应用上 k8s 有一些是需要改造的,这部分属于中间件研发而非云原生。 比如 confluent 对应 kafka 就可以轻松上 k8s, 而 kafka 就没有。 kubeflow 这些属于 MLOps, 是需要懂 AI 专业领域来能搞的 今年最火的是平台工程以及 EBPF 整合 k8s,其次是 wasm 。 |
3 dululu Feb 8, 2024 楼主说的有状态应用部署,国内已经有个公司做了,看起来不错: https://apecloud.cn/ |
4 CivAx Feb 8, 2024 via iPhone 插一嘴,现在 kafka 已经无需依赖 zk 来托管 broker 信息了喔 |
5 zhoudaiyu OP PRO @mightybruce 是的,但是我们这的中间件团队没有这种开发能力,估计还得我们去找一些现成的 operator @workingpad2 这个在训练集群用起来了 @dululu 谢谢,但是我们估计不会采购,毕竟要降本增效 @CivAx 嗯嗯,但是我们用的还是 1.1.1 的,有一些老 |
6 ryanking8215 Feb 8, 2024 你说的是 bitnami 吗? |
7 CivAx Feb 8, 2024 @ryanking8215 #6 如果你问我的话,是,但与 Bitnami 无关。Kafka 有脱离 ZK 运行的 Raft 模式,而且最小只需要单个节点。 |
8 justdoit123 Feb 8, 2024 新手,弱弱问下。有状态应用部署在 k8s 中,为什么挑战会比较大? 指的是大规模、高可用 redis/kakfak/zk 集群吗? |
9 CivAx Feb 8, 2024 @justdoit123 #8 “无状态” 与 “有状态” 的通俗区别是,该应用的数据是否会因为应用退出而被删除。因为有状态应用的数据、配置、程序自身三者高度绑定(但目前 Cloud Native 的势头已经对这个情况大幅优化了)。 比如常见的 K8S 场景:Kafka 需要外挂数据卷,而 K8S Admin 选择分配 HostPath 的方式,那么 Kafka 的数据目录中的 properties 文件会包含 BrokerID 。如果有状态应用被 reschedule 了,很可能会导致 Broker-0 被分配到先前 Broker-3 的所在节点上,导致 BrokerID 读取不吻合,导致错误退出。 Stateful 在水平扩展时需要保证数据目录被妥当创建,同时程序或配置里要存在 “初始化新节点” 的逻辑,并且当服务节点宕机、迁移时要有完善的节点退出或数据重用逻辑(比如上面提到的 BrokerID 读取问题,以及 Galera Cluster 的数据落盘保证机制),这些数据与程序的硬绑定逻辑会让有状态应用比无状态应用更难随意调度。 |
10 yyttrr Feb 8, 2024 阿里云 24 年拳头产品是 ACS ,可以了解一下,看文档比 ASK 灵活不少 |
11 FabricPath Feb 8, 2024
|