大模型学习路径求大佬指导! - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
jrlee1204
1D
V2EX    程序员

大模型学习路径求大佬指导!

  •  
  •   jrlee1204 34 天前 2305 次点击
    这是一个创建于 34 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人目前情况:从事后端开发工作,工作涉及过一点 Agent 的知识,对于 MCP 、RAG 有一些模糊的认识

    希望达到的目标:学习一些关于大模型相关的知识,模型微调(对这个比较感兴趣,需要学习哪些东西?)、部署、大模型应用开发,快速入门到能找到工作的水平

    问题:哪些知识是必须的?有没有比较完整的学习路线?对于底层比较原理性的东西是否可以先跳过,工作后再深入学习?

    请各位大佬多多指教!

    13 条回复    2025-09-08 17:34:36 +08:00
    TimePPT
        1
    TimePPT  
    PRO
       34 天前
    不建议看 fine tuning 相关的内容,这个基本上不属于工程范畴。如果硬学,可以从理解 LORA 开始……
    Prompting 相关的可以看这个 https://www.promptingguide.ai/zh
    模型部署没啥难的,现在各家云平台基本上很成熟的 pipeline 了,且大厂有自己的 pipeline 技术栈和要求,找几家云服务厂商看下官方部署文档就 ok 了
    TimePPT
        2
    TimePPT  
    PRO
       34 天前
    @TimePPT 还有微调要真想玩玩,记得 Azure / Amazon AWS 都有专门的模型微调平台,或者 OpenAI 自己部分模型支持微调,直接后台或者调接口就行。
    想上手训模型微调模型,可以试着看看 pytorch / transfermers 的文档,看看能不能看进去,遇到不懂的概念再顺手查?
    iOCZS
        3
    iOCZS  
       34 天前
    这类书籍多得汗牛充栋了吧
    emSaVya
        4
    emSaVya  
       34 天前
    不明白后端去做 mlops 会有啥收益吗?你做后端产品做出增量来了 好歹有点 kpi 收益。你做 mlops 有啥收益啊 做得好功劳是模型/策略/算法的 服务挂了 锅是你的。
    nayenizhenmei
        5
    nayenizhenmei  
       34 天前
    我也一直找不到学习的路径和开源项目,我也知道一些书籍有,但更想看一些网络上的帖子教程
    huangyezhufeng
        6
    huangyezhufeng  
       34 天前
    “底层比较原理性的东西是否可以先跳过”
    个人认为可以的

    “模型微调”需要学习的东西
    我建议看 Natural Language Processing with Transformers ,Huggingface 工程师写的,可以跟着敲代码,也没那么多底层细节。适合 Learning by doing.

    后面想补 LLM 底层原理知识,可以看 Build a Large Language Model (From Scratch)和 Super Study Guide: Transformers & Large Language Models.

    如果对深度学习基础不熟,可以先从一些基础的知识学起。比如读一下 Neural Networks and Deep Learning(NNDL)。

    https://datahonor.com/blog/2025/02/20/dl_book/ 这里简单写了上面几本书和其他一些相关书籍的书评,也可以参考看下。
    jrlee1204
        7
    jrlee1204  
    OP
       33 天前
    @huangyezhufeng 大佬说的很详细,感谢
    jrlee1204
        8
    jrlee1204  
    OP
       33 天前
    @TimePPT 好的,感谢大佬,我去看看
    sc13
        9
    sc13  
       32 天前
    我是做 Java 的,这块出了 spring ai ( JavaAI 框架),然后阿里巴巴也出了 spring ai alibaba 。如果你是写 Java 的,可以可以这个项目,阿里内部也在推这个框架了,因为阿里有大量的 Java 程序员可以直接上手,不用切换语言,大厂背书以后发展应该还是可以的。
    jrlee1204
        10
    jrlee1204  
    OP
       32 天前
    @sc13 之前做过 Java 后端开发,SpringAI 也听说过,可以研究研究
    WithoutSugarMiao
        11
    WithoutSugarMiao  
       31 天前
    https://v2ex.com/t/1150043 看看这个帖子呢 哥们
    jrlee1204
        12
    jrlee1204  
    OP
       31 天前
    @WithoutSugarMiao 看到了,老哥在那个帖子的回复对我很有帮助,感谢
    maximdx
        13
    maximdx  
       31 天前
    Dive into Deep Learning (DIDL)
    https://d2l.ai/index.html
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1100 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 23:16 PVG 07:16 LAX 16:16 JFK 19:16
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86