
2025 年,ai ide/model 协作编程能力大幅度提升,作为后端开发,跟前端相比毫不了太多。做 ai 应用一年了,做了 rag 系统,机器学习图像识别项目,但面对核心的 ai/ml 算法设计部分不得要领。你们是如何与机器学习/ai 模型算法工程师协作以至于能承担部分工作增加核心竞争力的?
1 ranley123 19 天前 via iPhone 转大模型 infra ,不过现在这个光景很难了。两年前我后端直接转大模型训练 infra 。现在已经杀得一片红海,同组算是国内最顶尖的大模型 infra 团队,进来的全是清北上交的博士,cmu 的也比比皆是。 但是现在如果实在想转,可以看看大模型相关的存储网络等等基础架构相关的,甚至 GPU 和大模型相关的 k8s 团队也行。应该能吃到一些涨幅溢价,只不过都是大厂了。 |
2 jiangbingo OP @ranley123 前外企大厂被优化,现创业小公司待着,无论是后端开发还是测试开发,经过一年多深度 vibe coding 深深的感受到传统程序员的生命周期比预期的要短。 |
3 Elietio 19 天前 via Android 手头有个 NLP 的项目要做,完全零基础暂时先用 AI 干着。。。 |
&nsp; 4 ranley123 19 天前 via iPhone @jiangbingo 是的,我赞同你的观点。所以新时代多往 AI 和大模型靠靠,是能够延长的,甚至还有机会远程。个人经验也是如此。自从我入了 LLM infra ,至少前景和钱景上都得到了爆炸式提升 |
5 ranley123 19 天前 via iPhone @jiangbingo 外企大厂该不会是 ms 吧哈哈,如果是的话那就是前同事了。我觉得你可以学习一下大模型的原理,比如 transformer 和 attention 之类的,甚至包括一些推理的框架基本知识 kv cache 之类的,如果对训练感兴趣的话可以看看并行训练的基本框架,不过会比较困难。 |
6 ranley123 19 天前 via iPhone 或者自己写写 ai agent 以后找 agent 工作 |
7 richarddingcn 19 天前 @ranley123 ai infra 是写算子么?请教下大佬有啥学习渠道感谢 |
8 ranley123 19 天前 via iPhone @richarddingcn 不止算子了,infra 包括高端的并行训练框架,算子优化,还有一系列分布式稳定性框架,LLM 故障检测和处理,LLM 存储 hdfs 优化和网络 NCCL 啥的,一大堆 |
9 ranley123 19 天前 via iPhone @richarddingcn 框架基本不用想了,现在只有清北博士级别和妖孽硕士的才能进。其他的就按照正常的基础架构+LLM 知识学习找点实习吧 |
11 jiangbingo OP @BlAO 我提大佬回答下,既然工作 5 年多,你没感知到除了核心深度学习算法部分,其他都是应用吗?既然是应用层,逻辑思维,业务理解,行业选择更重要。 |
12 BlAO 18 天前 via Android @jiangbingo 深有感触,感谢前辈的回答 |
13 ranley123 18 天前 via iPhone @BlAO 其他方向说实话今年开始要求也非常高了,除了要求对应的基础架构非常专业,也需要对 LLM 有了解。但是还是比核心算法的要求没有那么逆天,不过至少都要 985 本了,top2 本博也很常见 |
14 BlAO 17 天前 via Android @ranley123 大佬,这么说普通学历想转你说的大模型相关的存储网络,GPU ,k8s 团队也很难吃到涨幅溢价咯,是不是只能做下 agent ,rag 类的应用开发了,看来和普通后端区别不大 |
15 jiangbingo OP @ranley123 不是 ms 这么牛的外企。多谢你的建议。 |
16 ranley123 13 天前 via iPhone @BlAO 其实做 agent 也可以努力往推理靠靠,如何做到推理更快,需要的内存更少也是技术活,因为这个就需要你主动学习类似 kvcache 之类的技术,一点一点往大模型推理浸透,这样也属于加强了个人技术壁垒和业务深度,跟普通做做 agent 有本质区别。 |
17 ranley123 13 天前 via iPhone @jiangbingo 可以看下我最新的一条,如果是普通学历做 agent ,可以往推理技术靠靠 |
18 ranley123 13 天前 via iPhone 总结一下: 学历好:从基础技术出发,直接走训练或推理框架。 学历普通:从 agent 出发,向推理优化学习。如后训练微调技术,推理时长背景的语义压缩,kv cache 技术,etc 。之后一定是大模型的应用时代,如何推理得更便宜,更快, 一定是 agent 和应用工程师应该学习的东西 |
19 ranley123 13 天前 via iPhone 还有高并发下的推理调度策略等等,所涉及的工程技术非常多,我只是举个例子。也许现在你们做的 agent 或者还在小公司,觉得杀鸡焉用牛刀。但是多提前储备,跳槽到大公司会非常有用。 |
20 jiangbingo OP 感谢大佬 @ranley123 专业和富有耐心的建议。 |