大模型能输入一个 Prompt 以后,后面都只消耗输入输出的 token 吗(不包含对话历史或 Prompt 的再次消耗) - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
hzdt
V2EX    OpenAI

大模型能输入一个 Prompt 以后,后面都只消耗输入输出的 token 吗(不包含对话历史或 Prompt 的再次消耗)

  •  
  •   hzdt 338 天前 1555 次点击
    这是一个创建于 338 天前的主题,其中的信息可能已经有所发展或是发生改变。

    RT ,目前我是拿大模型当工具用,我想让它记住一个提示语,后面我只管提出问题,它回答我就行,消耗的只是提出问题和回答问题的 token

    目前如果想这么做

    要么记住所有的对话历史,每轮对话都要消耗以前对话历史的 token

    或者每次都带上 Prompt ,白白消耗 token

    请问有什么方式能解决吗

    12 条回复    2024-11-05 21:33:06 +08:00
    liu731
        1
    liu731  
    PRO
       338 天前
    叫它总结就好了,没必要每条历史消息传过去
    hzdt
        2
    hzdt  
    OP
       338 天前
    @liu731 这样是不是需要每次都要带上 Prompt ?目前我就是不想每次都带上
    liu731
        3
    liu731  
    PRO
       338 天前
    @hzdt 如果你说的 Prompt 是 ChatGPT 中的 role: system ,那确实必须要带。
    gitlight
        4
    gitlight  
       338 天前
    gemini,openai 和 claude 都支持 prompt caching 功能,缓存过的 token 价格更便宜 https://www.anthropic.com/news/prompt-caching
    hzdt
        5
    hzdt  
    OP
       338 天前
    @liu731
    @gitlight 好的,谢谢各位
    landerwong99
        6
    landerwong99  
       338 天前
    @gitlight 意思是:传还是避免不了的,但是价格可以便宜些?
    hzdt
        7
    hzdt  
    OP
       338 天前
    @landerwong99 是的,国内的话 deepseek 好像有类似的功能,大厂的搜了没找到
    taotaodaddy
        8
    taotaodaddy  
       338 天前
    你这个需求用类似 next chat,chat box 都能实现:
    提示词放入系统提示词
    然后把"保留对话轮次"设置为 1 应该就可以了
    hzdt
        9
    hzdt  
    OP
       338 天前
    @taotaodaddy 这样提示词还是会每轮都会消耗 token 吧?只是业务逻辑调整了下
    taotaodaddy
        10
    taotaodaddy  
       338 天前
    @hzdt 是的
    目前各 AI 应该是没有“内存”,所有信息都来自于你发过来的 content ,所以总是要发的
    PositionZero
        11
    PositionZero  
       338 天前
    @gitlight 国内的 DeepSeek 也支持这个功能
    https://api-docs.deepseek.com/zh-cn/news/news0802
    gitlight
        12
    gitlight  
       338 天前
    @PositionZero 刚才还在用这个功能,对于蒸馏小模型来说简直不要太好用
    [url=https://imgse.com/i/pAsrBi8][img]https://s21.ax1x.com/2024/11/05/pAsrBi8.png[/img][/url]
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     893 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 22:14 PVG 06:14 LAX 15:14 JFK 18:14
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86