这个大三学生的项目会颠覆现有的 agent 吗? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
shoushen
V2EX    分享发现

这个大三学生的项目会颠覆现有的 agent 吗?

  •  
  •   shoushen 1 月 25 日 1634 次点击
    这是一个创建于 34 天前的主题,其中的信息可能已经有所发展或是发生改变。

    今天在 b 站上刷到这个视频,感觉有点意思,大家研究看看: https://www.bilibili.com/video/BV1RMzuBjEym https://github.com/buyinakili/AIOS-PDDL-with-evolution-and-auditing

    我认为,这是个很有前途的想法。项目本质是在大模型和自然语言之间增加一个领域语言的符号约束层,从而最大程度消除大模型的缺点,发挥它的优点。另外,还可以继续扩展思路:

    1 、加入更多的领域语言; 2 、为配合大模型,设计专门的领域语言; 3 、设计如任务规划领域语言、逻辑推理领域语言、数学计算领域语言。

    目前的 agent 其实存在一个很大的问题,就是没有考虑到计算机执行的现实环境。自然语言的不精确问题,无法和现有的计算机环境兼容,而通过增加一个领域语言约束层就可以极大的缓解这个问题。

    4 条回复    2026-01-26 23:45:32 +08:00
    tetora
        1
    tetora  
       1 月 25 日
    就是在原有 agent 的情况下再包一层有限制的指令吗?有一个问题就是类似 linux 这种一切皆文件的情况会怎样
    shoushen
        2
    shoushen  
    OP
       1 月 26 日
    @tetora 现在的 agent 的思考、推理、规划、工具调用等等都是通过人类的语言进行的,本质上就是不承认大模型是有能力边界的。

    比如工具调用,实现的原理是这样的:
    1 、在系统提示词增加:请使用 get_weather("city_name")查询天气。
    2 、当用户问:北京的天气?
    3 、大模型返回:get_weather("北京")
    4 、agent 查询天气函数,返回:晴天。
    5 、大模型返回:北京是晴天。
    =======
    类似的,其他大模型能力也都是基于人类的语言来实现的。这就带来很大的问题,因为人类语言发明出来是给人用的,不是给计算机用的,就会导致生成的结果是不准确,不能类似程序可以 debug 。
    使用领域语言,就可以实现:
    1 、大模型返回的是精确的结果;
    2 、提示词的长度更小;
    3 、大模型的结果是可以验证的,符合语法规范的;
    4 、agent 的技能可以进行版本管理的;
    5 、生成的结果更容易被人类验证、修改,从而每个用户的问答都可以用来进一步训练大模型;
    6 、实现大模型的“自我学习”,可以让他自己根据领域语言编写各种“答案”,然后自己验证、优化;
    7 、以上提升,不是仅仅在工具调用上,而是在思考、规划、推理、计算等能力上都可以得到优化和提升;
    =====
    总之:
    就是将大模型的推理、计算、规划等过程,不再直接使用自然语言输出,而是使用专用的领域语言增加一个抽象层,大模型将推理过程、计算机过程、规划过程全面的符号化,再由专门的工具进行计算、执行。
    achangzhou
        3
    achangzhou  
       1 月 26 日
    古早的时候,类似 ASP/PHP ,把语言和 代码 混合在一起的方式,借用扩展这个形式就可以了呗!
    shoushen
        4
    shoushen  
    OP
       1 月 26 日
    @achangzhou 很好的想法。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2952 人在线   最高记录 6679       SelectLanguage
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 07:30 PVG 15:30 LAX 23:30 JFK 02:30
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86