作为后端开发工程师,你们有中途转向机器学习/深度学习的吗? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
jiangbingo
0.01D
V2EX    程序员

作为后端开发工程师,你们有中途转向机器学习/深度学习的吗?

  •  
  •   jiangbingo 19 天前 1050 次点击

    2025 年,ai ide/model 协作编程能力大幅度提升,作为后端开发,跟前端相比毫不了太多。做 ai 应用一年了,做了 rag 系统,机器学习图像识别项目,但面对核心的 ai/ml 算法设计部分不得要领。你们是如何与机器学习/ai 模型算法工程师协作以至于能承担部分工作增加核心竞争力的?

    ranley123
        1
    ranley123  
       19 天前 via iPhone
    转大模型 infra ,不过现在这个光景很难了。两年前我后端直接转大模型训练 infra 。现在已经杀得一片红海,同组算是国内最顶尖的大模型 infra 团队,进来的全是清北上交的博士,cmu 的也比比皆是。
    但是现在如果实在想转,可以看看大模型相关的存储网络等等基础架构相关的,甚至 GPU 和大模型相关的 k8s 团队也行。应该能吃到一些涨幅溢价,只不过都是大厂了。
    jiangbingo
        2
    jiangbingo  
    OP
       19 天前
    @ranley123 前外企大厂被优化,现创业小公司待着,无论是后端开发还是测试开发,经过一年多深度 vibe coding 深深的感受到传统程序员的生命周期比预期的要短。
    Elietio
        3
    Elietio  
       19 天前 via Android
    手头有个 NLP 的项目要做,完全零基础暂时先用 AI 干着。。。
    ranley123
    &nsp;   4
    ranley123  
       19 天前 via iPhone
    @jiangbingo 是的,我赞同你的观点。所以新时代多往 AI 和大模型靠靠,是能够延长的,甚至还有机会远程。个人经验也是如此。自从我入了 LLM infra ,至少前景和钱景上都得到了爆炸式提升
    ranley123
        5
    ranley123  
       19 天前 via iPhone
    @jiangbingo 外企大厂该不会是 ms 吧哈哈,如果是的话那就是前同事了。我觉得你可以学习一下大模型的原理,比如 transformer 和 attention 之类的,甚至包括一些推理的框架基本知识 kv cache 之类的,如果对训练感兴趣的话可以看看并行训练的基本框架,不过会比较困难。
    ranley123
        6
    ranley123  
       19 天前 via iPhone
    或者自己写写 ai agent 以后找 agent 工作
    richarddingcn
        7
    richarddingcn  
       19 天前
    @ranley123 ai infra 是写算子么?请教下大佬有啥学习渠道感谢
    ranley123
        8
    ranley123  
       19 天前 via iPhone
    @richarddingcn 不止算子了,infra 包括高端的并行训练框架,算子优化,还有一系列分布式稳定性框架,LLM 故障检测和处理,LLM 存储 hdfs 优化和网络 NCCL 啥的,一大堆
    ranley123
        9
    ranley123  
       19 天前 via iPhone
    @richarddingcn 框架基本不用想了,现在只有清北博士级别和妖孽硕士的才能进。其他的就按照正常的基础架构+LLM 知识学习找点实习吧
    BlAO
        10
    BlAO  
       18 天前 via Android
    @ranley123 请问大佬,这些方向都很吃学历吗?我后端 5 年多,普本+非全硕
    jiangbingo
        11
    jiangbingo  
    OP
       18 天前   1
    @BlAO 我提大佬回答下,既然工作 5 年多,你没感知到除了核心深度学习算法部分,其他都是应用吗?既然是应用层,逻辑思维,业务理解,行业选择更重要。
    BlAO
        12
    BlAO  
       18 天前 via Android
    @jiangbingo 深有感触,感谢前辈的回答
    ranley123
        13
    ranley123  
       18 天前 via iPhone
    @BlAO 其他方向说实话今年开始要求也非常高了,除了要求对应的基础架构非常专业,也需要对 LLM 有了解。但是还是比核心算法的要求没有那么逆天,不过至少都要 985 本了,top2 本博也很常见
    BlAO
        14
    BlAO  
       17 天前 via Android
    @ranley123 大佬,这么说普通学历想转你说的大模型相关的存储网络,GPU ,k8s 团队也很难吃到涨幅溢价咯,是不是只能做下 agent ,rag 类的应用开发了,看来和普通后端区别不大
    jiangbingo
        15
    jiangbingo  
    OP
       16 天前
    @ranley123 不是 ms 这么牛的外企。多谢你的建议。
    ranley123
        16
    ranley123  
       13 天前 via iPhone
    @BlAO 其实做 agent 也可以努力往推理靠靠,如何做到推理更快,需要的内存更少也是技术活,因为这个就需要你主动学习类似 kvcache 之类的技术,一点一点往大模型推理浸透,这样也属于加强了个人技术壁垒和业务深度,跟普通做做 agent 有本质区别。
    ranley123
        17
    ranley123  
       13 天前 via iPhone
    @jiangbingo 可以看下我最新的一条,如果是普通学历做 agent ,可以往推理技术靠靠
    ranley123
        18
    ranley123  
       13 天前 via iPhone
    总结一下:
    学历好:从基础技术出发,直接走训练或推理框架。
    学历普通:从 agent 出发,向推理优化学习。如后训练微调技术,推理时长背景的语义压缩,kv cache 技术,etc 。之后一定是大模型的应用时代,如何推理得更便宜,更快, 一定是 agent 和应用工程师应该学习的东西
    ranley123
        19
    ranley123  
       13 天前 via iPhone
    还有高并发下的推理调度策略等等,所涉及的工程技术非常多,我只是举个例子。也许现在你们做的 agent 或者还在小公司,觉得杀鸡焉用牛刀。但是多提前储备,跳槽到大公司会非常有用。
    jiangbingo
        20
    jiangbingo  
    OP
       13 天前
    感谢大佬
    @ranley123 专业和富有耐心的建议。
    BlAO
        21
    BlAO  
       12 天前 via Android
    @ranley123 感谢大佬耐心又专业的建议
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5193 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 43ms UTC 08:29 PVG 16:29 LAX 00:29 JFK 03:29
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86