
1 ymcz852 1 天前 身为前端开发,最近也在想这个问题也想转型。查了一下,如果是 AI agent 应用开发,似乎也还是后端开发的一种,不知道是不是这么说,对于前端来说也不好转 |
3 fe619742721 1 天前 |
4 sharpy 1 天前 agent 开发有什么特别的? |
5 ymcz852 1 天前 @xing666 @fe619742721 是的,我也是想着转全栈的,我个人本身也开发过 SSR Node 项目,但不是那种纯后端生态的项目 只是在想 AI agent 开发的岗位会招聘后端开发的人,前端开发的程序员没那么容易“入场” |
6 nickyadance23 1 天前 CRUD 是有状态的,用户起码有些独特的数据存你这,Agent 开发类似新时代的工具箱? |
7 linxl 1 天前 有啥教程看没,被 AI 的各种技术吓到了 |
11 evan1 OP PRO @nickyadance23 #6 我理解着都是写业务流程。 |
16 123zouwen 1 天前 楼上都在说什么, 业务最重要啊, 不在于你是什么岗位. 真的有专门做 Agent 开发的吗? 我们都是把自己的产品功能迭代为接入 AI,在这个过程中自然就做了 Agent. 又不是几年前,Agent 没有什么高深的技术,能开发的框架一大把. 重点是你的业务怎么和它整合, 有什么价值点 |
17 rick2c 1 天前 agent 全栈开发,没有想的那么难特别是有 ai 加持,难的是面试要求有垂直经验,这才是最难受的 |
18 123zouwen 1 天前 如果你真的去面试或者转岗所谓的 Agent 开发, 大概率是失败 开发不做业务,那就是自杀. 如果一个公司招人去搞 Agent 接入他们的业务, 当他们发现业务 Agent 无法产生盈利,那危险的就是你了. 正常公司让现有技术搞搞 Agent 就够了, 想不通为什么要专职找人, 很有可能是他们不懂这一块,并且公司抱有不切实际的幻想 |
20 leegradyllljjjj 1 天前 via iPhone 这玩意儿也就有钱的公司能玩玩,普通公司连 ide 都是用盗版的,薪水买 token 买工具都不够 |
21 WithoutSugarMiao 1 天前 我就是 Agent 开发啊。原来做 python 后端,23 年末 RAG 刚火,在原公司做了一年 RAG ,之后入职 AI 公司做 Agent 。去年年末离职,刚准备入职下个工作,也是专职 Agent 开发。具体可以看我帖子 https://v2ex.com/t/1182394 。 |
22 WithoutSugarMiao 1 天前 @123zouwen #16 我目前专职做了两年以上的 agent 开发了。去年末从上家离职,最近刚确定 offer 准备入职。面试的岗位也全是专职 agent 开发。 “Agent 没有什么高深的技术” 你这句话 让我有点绷不住。 |
23 WithoutSugarMiao 1 天前 @linxl 教程可以看我历史帖子。 |
24 kenshinhu 1 天前 @WithoutSugarMiao 做 Agent 开发的过程中是怎样学习的,主要是先看 Agent 框架还是从需求入手? |
25 123zouwen 1 天前 @WithoutSugarMiao 看了你的贴子 “Agent 没有什么高深的技术” 这句话我的意思是, Agent 是纯工程化的实践方案,没有什么技术壁垒,现有的后端都可以做. 你列举出的 LLM 能力拦截垃圾邮件 / RAG 项目, 说实话没有看到什么亮点功能. 在我司不同的业务部门内部都做的有自己的 Agent,而且是和自己的业务深度结合, 完全都是自己现有员工实现的, 不同技术栈都有: spring AI / didy 二开 / langchain 等等. |
26 WithoutSugarMiao 1 天前 @123zouwen #25 随便给你个场景,上个项目实际中遇到的。甲方是个化工公司,帮他们做老客户激活平台,主线功能就是 从个性化唤醒词到聊天获取销售线索。 遇到一个情况,LLM 分不清楚化工原料到具体产品的映射怎么办? 举个例子 化工原料 乙烯 能生产处 聚乙烯 使用聚乙烯 能做出塑料袋。 怎么让 LLM 理解这些? RAG ? 微调?提示词? 上下文? 模型理解了之后,有没有用 bad case ,有的话要怎么优化? 我在帖子里说的“拦截垃圾邮件 / RAG 项目” ,是 23 年 11 月份 到 24 年 11 月 这段时间的项目,当时的技术栈处于 RAG 刚兴起,agent 还没怎么热,大家都在提示词工程到上下文工程的转变上。其实在前面我应该表达时间段了,可能我没写清楚,我的问题。(我补充一下,虽然是比较早的项目,但是也遇到些比较有意思的问题,但是评论里我就不展开了,因为能写很多内容。) 当然我不是故意怼你的意思。我是觉得你是对 Agent 开发这个行业了解太少了,这也不怪你,毕竟也是 2025 年才刚兴起的。你如果感兴趣,我推荐你 我学习过的几个课程 你可以系统性学习一下。 1. 台湾国立大学李宏毅的 2025 年[最新课程]( https://www.youtube.com/playlist?list=PLJV_el3uVTsMMGi5kbnKP5DrDHZpTX0jT),被誉为中文 AI 圈神课。 2. 看完李宏毅的,可以看斯坦福的[CS336]( https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_),从 0 开始构建语言模型。 3. 辅助的论文阅读,可以关注李沐的这个频道( https://www.youtube.com/playlist?list=PLFXJ6jwg0qW-7UM8iUTj3qKqdhbQULP5I),他的分段精读 transformer ,我看了好多遍。 4. 不喜欢理论只喜欢实践,也可以看看国内写的这个[hello-agents]( https://datawhalechina.github.io/hello-agents/#/) 还有一些比较零碎的资料或者偏实践的,我在之前帖子里有写,就不放了。 总之,agent 开发,我作为从业者的看法是,已经从 2025 年初的探索阶段,过渡到成体系的标准应用了。至于你说的框架,额,怎么说呢?可能你们企业内用的多些,但是商业级的项目一般不会直接用框架。 |
27 yungyu 1 天前 @WithoutSugarMiao #26 你说的这些 case ,要么就是一招鲜吃遍天(优化 context),要么你其实也没有啥招,只是不停调试看效果。 就目前来说,基于 LLM 的 agent 开发,技术门槛主要是 开源开套件的熟练度吧,langchain 、langgraph 、dify 这些。 |
28 dawnzhu 1 天前 @WithoutSugarMiao 看了你的帖子,目前 Agent 开发会涉及到模型微调吗? |
29 WithoutSugarMiao 1 天前 @yungyu 你说的完全风马牛不相及,你也没点进去我在回复中提到的课程,李宏毅的课 [第八讲:通用模型的终身学习] 你可以先看下。一句话总结,我部署了微调后的小模型进行专门的用户关注点预测,作为一个 function call 来给大模型使用。 我从 1 月份到现在 面试了十多家,拿了三个 offer ,你说的这些框架在面试中完全无人在意,或者说根本不会在意这些框架本身(但是现在大部分的商业级 agent 构建,确实有借鉴最初 langchain 的几大组件)。比如最开始 langchain 最火,你用了,然后 langgraph 又火了,你换不换,autogen 又火了继续换吗?现在 claude / openai 的 SDK 最火 又接着换?那如果后续还有其他框架比这俩 SDK 还火,怎么办呢? agent 开发的门槛,并不在你说的框架熟练度和前面那个哥们说的 业务适配什么的。给你分享点我常遇到的问题。 你能讲讲 transformer 架构吗? gpt 和 transformer 有啥区别啊?为什么 temperature 会影响输出? RAG 方面,你怎么做的分块?为什么考虑使用这种分块方式?如何优化召回率?使用 rerank 了吗?能说几个比较有新意的 rerank 方法吗?向量数据库怎么选啊?为啥用 milvus ?稀疏向量和稠密向量啥区别啊? RAG 和微调啥区别啊?你数据集怎么弄的啊?你微调的关键参数都有啥啊?你如何评估微调效果呢? agent 有什么构建模式吗?输出 token 超出了模型限制怎么办呢? 好多好多问题呀,我的感觉是基本围绕着四个方向,基础、RAG 、微调、Agent ,一次正经的面试中,这几个方向是一定一定都会被问到的。 |
30 WithoutSugarMiao 1 天前 @dawnzhu 一定会,我建议你看看 我在帖子里写的项目,阿里云的那个课程或者 hello-agents 。几乎所有的 agent 课程里必然会设计到微调,涉及到大模型的理解。 |
31 dawnzhu 1 天前 @WithoutSugarMiao 对大模型理解认同,如果调外部 API 的话不涉及到微调吧? hello-agents 最后是讲到了 Agentic RL,目前还没碰到需要微调的场景 |
32 WithoutSugarMiao 1 天前 @dawnzhu #31 很正常 因为 AI 的能力太强,如果是小规模应用,完全没有微调的必要,就像 @123zouwen 回复的一样,如果你想在自己的公司使用,那么你懂公司的业务,用通过的 LLM ,用现成的 MCP 、skill ,完全 cover 的住。 但是这个东西的复杂度曲线 就像传统项目一样,你在公司用 你不用考虑 QPS 上来了怎么办,并发度高怎么办,分布式同步怎么办。因为公司就那些人。但是你要想做个企业级项目,比如豆包,比如千问, 那要考虑的东西就多太多了。微调只是最基础的部分。 还有一点就是,可能很多人觉得微调很难,又要理解模型,又得调整参数。实际上现在微调的门槛很低,LLM 发展这几年,早就有傻瓜式微调框架了。甚至一行代码不用写,你都能调出来一个差不多的模型。 |
33 liu731 PRO 不认同,Agent 能玩的转的只有那些肯付费(订阅 || 本地部署)、肯创新、业务逻辑清晰的公司 |
34 NizumaEiji 1 天前 agent 是未来 但是未来的 agent 可不一定需要人来写 |
35 dawnzhu 1 天前 @WithoutSugarMiao 之前做过几次微调,微调也有很多框架上手难度不高。26 年明显感觉到 Agent 相关岗位多了起来,基本跟传统开发差不多但是也要了解很多新的概念、知识、方式等。后续觉得还是做 Agent (业务)性价比高一点 |
36 dawnzhu 1 天前 @NizumaEiji 未来可能不需要,到达未来的路上目前看是需要的 |
37 bianxiuyan1993 1 天前 全栈或者 agent 工程师,做构建? |
38 listenerri 1 天前 一旦有这种想法:转型做某方向开发,那就表示思维逻辑还是不对 放弃古法编程转型做 Viber 还差不多 |
40 yungyu 1 天前 @WithoutSugarMiao #29 3 个 offer 不能说明啥啊 我也不是说你不厉害,我只是说 agent 开发并不神秘或者门槛很高。 确实也就是结合自身具体业务 依赖成熟 infra 做 crud |
41 jsq2627 1 天前 行业还在快速发展,也许 LLM 基模进步足够大后,将来也不需要那么多 Agent 开发了。持观望态度 |
42 gitlight 1 天前 我对 Agent 开发的看法就是下一个移动端,一拥而上然后人走茶凉 Agentic 基建的开发现在看是如火如荼,但是我觉得大部分开发都是脚手架级别的,会被快速淘汰,真正有意义的是两个方面:推理端 Infra 优化、Agent 交互标准化。 对于 Agent 能力来说,需要关注的是与现实交互的部分,一侧是长链条的工具调用,这个依赖于面向现实交互的 RL 后训练,另一侧则是对核心 AGENT LOOP 的思考。我觉得现在大部分 Agent 范式,最后只会留下 Reasoning-Action 这个最简单的范式,使用它来组成树形结构的 Multi-Agent ,除此之外,其余的能力都会被内化到大模型本身,考虑更复杂的范式没有意义。 对有工作经验的开发来说,冲击最大的是特定领域的业务逻辑再也没法成为我们的护城河了,智能变成了一种大宗商品,业务逻辑也是一样,最终会变得可复用。所以如何选取难以被 AI 取代的赛道,我现在也没有好想法。另外,AI 一定会重塑软件开发的生命周期。 我在读书的时候是做 NLP 命名实体识别的,那个时候 NLP 是最难就业的方向,但是自从 LLM 出来之后,这个领域的小模型就全被自回归模型刷榜了,但是在实际的业务中,BERT 依然有它自己的价值,就算自回归 Scaling up 上了 33b ,它也不一定会在特定领域比老的 roberta 效果好。更何况目前有各种 0.6b 0.8b 的小模型,还能搞各种 Embedding 模型。现在简直是搞 nlp 最好的时代。 我觉得焦虑太多也没什么用,只能拥抱 AI 。我对自己的要求是,在平时做业务开发的同时,保持对 nlp 前沿的关注,Pytorch 不能丢了。。 PS:看到楼上有人 po 自己的 Agent 开发涉及的工作,我个人也分享一下: 1. 关于微调:SFT 小模型大部分时间来说没什么用,而且常常会带来灾难性遗忘,用来注入格式规范倒是有点用,RL 是个有趣的方向,但是不好做; 2. RAG:目前最接近工程的地方,分块策略会做大量 Ditry Work ,现在对这一块我深恶痛绝,Agentic RAG 彻底摆脱分块 embedding 是未来; 3. 上下文工程看起来容易,想做好简直痛苦,这块也是 Ditry Work ,而且找不到凸优化之类的方法来做指导方向 |