
对于现在的 Agent 来讲,理解 API 天然的就比理解 UI 更方便,更省 Tokens ,那么是不是以后 API 会变成一等公民,软件的设计应该是 API-First ,UI 反而是次要的。
如果以这个思路出发,超媒体驱动的 RESTful API 有没有机会再次登上历史舞台呢?一几年我在学习 REST 的时候就觉得超媒体这个设计不适合那个时代,那么现在是否时机到来了?
1 WithoutSugarMiao 9 小时 22 分钟前 不知道诶,上周公司内部头脑风暴,有个运营小姐姐突然发现,我们的 openclaw ,好像可以直接使用 API ,然后他们把现有的 swagger 文档的主要 API 都添加了额外描述给 openclaw 用。然后现在正在进行专门给 openclaw 用的 API 的开发。 |
2 FinnBai OP @WithoutSugarMiao #1 现在的模式里,agent 对软件的使用最好的办法就是对软件的 api 进行 skill 化,通过一个描述完整的 api 去理解软件会比通过 ui 方便的多。这方面有类似 openapi-to-skills 这种项目 |
3 YanSeven 9 小时 6 分钟前 API 和 UI 都是一等公民。 只要人和时间的接口仍然是眼耳鼻舌身意,而不是直接接入插头电信号。那么和用户直接打交道的 UI 永远都是重要的。 后台的任务那肯定是 API ,MCP 啥啥啥的。 |
5 WithoutSugarMiao 9 小时 1 分钟前 @baiyi 我太理解你说的啥意思,但是通过你发这个项目里的示例有点明白了。貌似和我同事在做的事情差不多吧。 |
6 FinnBai OP @YanSeven #3 如果是再科幻一点,Agent 能做到的更多一些,是否会有一个助手类的 Agent 会成为人与互联网交互的仅有的几个入口,甚至是唯一入口。那么此时,UI 的定义权就不在软件厂商手里,而是在这个 Agent 手里了。 举个点外卖的例子,现在点外卖需要使用各个外卖软件的 UI ,如果可以通过“助手”点外卖,会让“助手”猜测以及结合需求帮助推荐想吃的菜单,那么这个“助手”应该要提供的是这个用户更习惯的 UI ,甚至如果用户喜欢,提供一个转盘类的 UI ,让用户抽菜单。 如果是这样,软件厂商真的是需要提供 API 了。 |
7 cairnechen 8 小时 28 分钟前 @YanSeven UI 是产品经理和设计师用来表达用户意图的工具,以后各个 agent 可以直接理解用户口述内容,用户只需要表达,agent 识别意图并规划任务执行,UI 的作用可能就变成提供输入便利增加确定性以及缓解用户黑盒焦虑了(实际上现在已经在这么干了) |
8 FinnBai OP 关于超媒体驱动的 API ,我再多阐述一下我自己的理解: 超媒体驱动的 API 来源于我对 REST 的理解,REST 架构准则是用于指导创建现代 Web 架构的基石,超媒体在其中发挥了重要的作用。 当我们点开一个网站时,能够从主页上的各种超媒体链接进入到另一个网页,从而完整的理解整个系统或者说整个网站。换到 API 上,把我们换成 Agent ,Agent 也应该可以从一个 API 提供出来的超媒体链接出发,完成的理解整个系统。 过去这种 API 是没有什么太大意义的,因为读取 API 的机器或系统不够智能,不能理解超链接没有自主性能够通过超链接理解整个系统。但现在 Agent 具备了这种可能性。 也许 REST API 会是后 Skill 时代的产品,不再需要通过创建一个 Skill 来指导 Agent 去使用一个暴露了 API 的软件系统,Agent 可以通过这个暴露的 API 去自行理解系统。 |
9 YanSeven 8 小时 14 分钟前 @cairnechen 除了提前预设和规范化表达用户的意图,UI 还负担呈现结果的任务啊。Agent 智能体通过接入语音和文字就能完全理解用户的意图之后,那么剩余的 UI 的核心任务应该就是呈现结果,可视化结果,以及补充语音和文字之外的交互能力。 |
10 cairnechen 8 小时 1 分钟前 @YanSeven 这个我不太确定诶,现在类似 ChatGPT 、Claude 、Gemini 会话中呈现出的一些结果形态(表格、卡片、链接等等),是被 UI 设计师设计好的吗,还是 LLM 自行决定的(或者工程师有限的提示词干预?) |
11 iorilu 8 小时 1 分钟前 api 当然好 问题是公司不开放阿 最简单得, api 发微信, 你看微信干不干 当然了, 有一个可能, 就是付费开 api, 比如用啥龙虾等等, 想自动化操作什么东西, 就得用 api, 比如自动收发微信, 给钱就行 |
12 FinnBai OP @iorilu #11 是的,这才是核心问题,跟原来反爬一样,都是保护自家公司利益,不会轻易开放的。而且我估计微信也不会轻易放弃自己作为“入口”的可行性。 |
13 AoEiuV020JP 7 小时 44 分钟前 我看好, 重点是网站/服务商提供的服务会越来越方便 AI 使用, 我听说甚至已经在尝试让 http 支持 AI 付费访问了, |
14 FinnBai OP @AoEiuV020JP #13 这发展的也太快了,我去找找案例 |
15 iorilu 7 小时 12 分钟前 @AoEiuV020JP 应该得, 只要付钱得, 厂商应该会跟进 而且确实自动化是趋势了 像微信一直严防死守不想让大家自动化控制, 后面估计也会放开, 很可能微信会出一个 vip 会员 买了后就能用 api 控制, 话说回来, 这样腾讯就发了阿, 就算 5%开通, 那也是天文数字 |
16 uds9u32br 7 小时 9 分钟前 感觉是 AGENT 和现实世界交互的能力。 |
17 Valid 7 小时 2 分钟前 只要接口就好了,鉴权和风控都会朝着 ai 这块去发展 |
18 luemail2023 6 小时 35 钟前 其实也可以是 CLI ,Obsidian 已经在做了 |
19 Samwulol 3 小时 29 分钟前 via Android 看你业务赚谁的钱,赚人的钱就是 ui first ,赚公司的钱就是 api first |
20 heyzng 3 小时 27 分钟前 @luemail2023 CLI+1 |
21 sampeng 1 小时 25 分钟前 via iPhone 还第一等公民…你要知道 cf 这类 cdn 的防 ai 卖多贵你就晓得了。每天成千上万的爬虫。我实在忍不住给字节发了个邮件求他你要爬我可以,但你能不能每天几百万的爬啊 |
22 mizuhashi 1 小时 23 分钟前 @FinnBai 我 hypermedia 是合 agent 的,因 hypermedia 的一要求是,返回的 html 就包含了交互所需的所有信息,不像 api 那需要 schema 的知。另外器最初就叫 user-agent |
23 docx 1 小时 14 分钟前 via iPhone 从 Claw 让互联网厂商愿意开放 API 这一点来说,算是一大功劳 |
24 kkwa56188 24 分钟前 API 为什么要跟 UI 较劲, 都不是同一个东西. 是不是在公司里职位争宠? |
25 zerovoid 6 分钟前 豆包手机通过 UI 操作 APP ,都被各路封杀了,你认为人家 APP 网站会开放 API 给你调用吗, 解析自己微信本地聊天记录的工具,都直接被腾讯给律师函了, 当然,大势所趋,人类通过 UI 操作的时代终将结束, 哪怕你不让我用 AI 操作,以后我直接叫机器人帮我手动操作总行吧, 那看来机器人才是未来的世界的入口啊。 |