大家用哪家大模型的 api? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
azev
V2EX    问与答

大家用哪家大模型的 api?

  •  
  •   small class="gray">azev 2025 年 3 月 10 日 3169 次点击
    这是一个创建于 323 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前发现 Gemini 和 Grok 的页面对话速度非常快 不知道 api 情况如何?

    20 条回复    2025-03-12 11:21:27 +08:00
    ration
        1
    ration  
       2025 年 3 月 10 日
    免费就用这两个,对话速度还行
    BearCookie
        2
    BearCookie  
       2025 年 3 月 10 日
    火山
    knightdf
        3
    knightdf  
       2025 年 3 月 10 日
    grok api 还不能用 3 ,所以目前 API 用的 deepseek ,不过很少用 API ,都是用网页版
    mumbler
        4
    mumbler  
       2025 年 3 月 10 日   1
    这两家都不算快,要快用 groq ,秒出,免费额度也挺多
    Comyn
        5
    Comyn  
       2025 年 3 月 10 日 via iPhone
    deepseek claude
    tool2dx
        6
    tool2dx  
       2025 年 3 月 10 日
    api 肯定用 deepseek ,你找不到更便宜的了。
    layxy
        7
    layxy  
       2025 年 3 月 10 日
    腾讯元宝目前足够用了,没有单独使用 API 场景,ai 编程有插件
    Sting1226
        8
    Sting1226  
       2025 年 3 月 10 日
    最快不过 gorq 。
    andrew2558
        9
    andrew2558  
       2025 年 3 月 10 日
    deepseek 便宜吗?现在 deepseek 比 gemini 都贵了
    ThinkStu
        10
    ThinkStu  
       2025 年 3 月 10 日
    混元 TurboS ,快/聪明/便宜
    clementewy
        11
    clementewy  
       2025 年 3 月 10 日
    @tool2dx gemini 也很便宜的
    Donaldo
        12
    Donaldo  
       2025 年 3 月 10 日
    英伟达的 送了点免费额度 巨快。。
    Leeeeex
        13
    Leeeeex  
    PRO
       2025 年 3 月 10 日 via iPhone
    @mumbler #4 好像是 100w 吧 用完不就没了吗
    al0ne
        14
    al0ne  
       2025 年 3 月 10 日
    Gemini 便宜量大 还支持多模态,文本/图片/PDF 啥的都能丢进去
    mumbler
        15
    mumbler  
       2025 年 3 月 10 日
    @chanChristin #13 每天 qpd 有限制,总量没有限制
    coefu
        16
    coefu  
       2025 年 3 月 10 日
    本地部署 qwq 32b fp16 强的一笔。
    pkoukk
        17
    pkoukk  
       2025 年 3 月 10 日
    claude
    YJi
        18
    YJi  
       2025 年 3 月 10 日
    今天刚接了 Qwen-Long ,阿里家的好像只有这个可以传文件上去解析。
    hkiJava
        19
    hkiJava  
       2025 年 3 月 12 日
    @coefuqin #16 是 ollama 量化版部署的嘛
    coefu
        20
    coefu  
       2025 年 3 月 12 日
    @hkiJava int 4 24g vram 刚刚够跑,但是上下文和推理过程长点就要更多了。fp16 我还没试,估计要准备 96g vram 。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5289 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 39ms UTC 08:38 PVG 16:38 LAX 00:38 JFK 03:38
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86