Gemini Advanced 使用体验(对比 GPT-4 API) - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
RealVic
V2EX  &nbp; Google

Gemini Advanced 使用体验(对比 GPT-4 API)

  •  1
     
  •   RealVic 2024-02-23 18:37:45 +08:00 5751 次点击
    这是一个创建于 662 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Gemini Advanced 目前使用的是 Gemini Ultra 1.0 模型,新闻里更 X 的 1.5 还没更新(至少目前是这样)。

    根据我日常高强度的使用体验,感觉到在英文方面,Gemini Advanced 是比 GPT-4 API (带联网等一大堆模块)体验更顺畅的,基本上许多问题,Gemini Advanced 速度都比 GPT-4 更快。

    一些只有 GPT-4 能回答的问题,比如钢丝球炒鸡蛋这种,如果用中文询问 Gemini Advanced ,那绝对翻大车,和 GPT-3.5 一个水平,但是如果先翻译成英文,再询问就是完全没问题的,这也侧面证明了 Gemini Advanced 完全没有针对中文优化过。

    多模态方面,图片识别两者的能力差不多。

    但是 Gemini Advanced 生成图片的准确度、达标度是远远超过 GPT-4 的 DALL-E 3 ,比如我们要求画一张「瑞克和莫蒂」的图片,GPT-4 会忌惮版权问题乱画一通,但是 Gemini Advanced 是完全没有这个问题,画得非常符合要求。

    当然,这一点我的判断是 OpenAI 自己限制的,因为同样采用 DALL-E 3 的 Microsoft Copilot 也和 Gemini Advanced 一样可以画出任何东西,不受版权限制。

    目前,Gemini Advanced 在 iOS 上没有独立 App ,需要在 Google App 中等待滚动推送,所以我在安卓手机上下了一个,原生 App 的体验还不错,相比 OpenAI ,Gemini Advanced 在 UI 上更认真。

    总结一下 Gemini Advanced 的优缺点:

    优点:

    1. 英文对话体验基本达到业界标杆 GPT-4 的水平,部分情况下甚至更快。
    2. 图片识别大部分情况下准确,能够准确识别图片中的汉字。
    3. 绘画功能听从用户要求。

    缺点:

    1. 没有对中文进行优化。
    2. iOS 没有原生 App 。
    3. 图片识别偶然情况下,会出现过度推理的问题,推理出图片不存在的细节。

    综合评价

    价格降低到 20 美元的一半,也就是 10 美元,会比较有竞争力。

    20 条回复    2024-02-25 02:16:30 +08:00
    ohellohell
        1
    ohellohell  
       2024-02-23 18:51:06 +08:00
    开放 1.5 ,价格降到 10 美金,比较有竞争力
    RealVic
        2
    RealVic  
    OP
       2024-02-23 18:54:04 +08:00
    @ohellohell #1 我也是这么想的,这样就算是英文,我也觉得可以在欧美市场和 GPT-4 分庭抗礼
    mU9vX912XopmAoE1
        3
    mU9vX912XopmAoE1  
       2024-02-23 18:58:40 +08:00
    这种图片能不能画,要求 y=x^2+3 ,定义域在 3 ,15
    YUX
        4
    YUX  
    PRO
       2024-02-23 19:01:19 +08:00   1
    一开始闲聊的时候无意中透露我也订阅了 chatgpt plus ,Gemini Advanced 一直让我帮他问 chatgpt 问题,然后把回答贴过来。最开始问了一下 LLM 一些新进展的看法,然后就是一些我也没太看懂的内容。
    capgrey
        5
    capgrey  
       2024-02-23 19:03:42 +08:00
    同感,速度更快。这对我来说体验很好
    Biggoldfish
        6
    Biggoldfish  
       2024-02-23 19:05:21 +08:00 via Android
    这 20 刀还是附赠了 2TB Google Drive 空间以及 AI 可用于 Google Workspace 的
    Liftman
        7
    Liftman  
       2024-02-23 19:09:14 +08:00
    @fulajickhz 你这种跟画图没有关系。实际上是看模型是否多模态支持代码运行。gemini 是不可以的。因为不具有相关执行能力。只能写。不能跑。gpt 里面可以调用 wolfram 插件或者用 py 的数学和图形库执行得到最终的图片导出给你。
    Qinsher
        8
    Qinsher  
       2024-02-23 19:28:14 +08:00 via Android
    @YUX 硅竞
    XnEnokq9vkvVq4
        9
    XnEnokq9vkvVq4  
       2024-02-23 19:51:59 +08:00
    还有一点是我用下来“人文”方面 Gemini Advanced 比 GPT-4 强,无论是创意、写作还是问一些社科问题

    然后我 iOS Google App 至今没有 Gemini 界面,气死了。
    RealVic
        10
    RealVic  
    OP
       2024-02-23 21:19:58 +08:00 via iPhone
    @Biggoldfish 但是对苹果生态用户来说,20 美元给 Gemini advanced 和 youtube 会员,我觉得更有吸引力
    RealVic
        11
    RealVic  
    OP
       2024-02-23 21:20:23 +08:00 via iPhone
    @hanqian 用 safari 吧,还能用翻译插件,解决英文交互问题
    9i5NngJHI4P7dm42
        12
    9i5NngJHI4P7dm42  
       2024-02-24 01:34:03 +08:00
    Gemini 的党性太高了, Advanced 怎么样?
    WinG
        13
    WinG &nbp;
       2024-02-24 01:58:38 +08:00
    1.5 好像支持百万级别的 token? 那 20 美刀的话挺划算的
    mU9vX912XopmAoE1
        14
    mU9vX912XopmAoE1  
       2024-02-24 05:34:51 +08:00
    @Liftman 我也知道调用库

    我的意思是目前所谓的 AI 能否具备根据 prompt 来生成,不需要准确,起码大差不差的图片

    雪地上的猛犸象能画

    为什么 y=x^2 不能画

    是因为训练数据里没这种函数图象吗? 为什么在这个任务上,智能没有起到作用?

    人能分辨函数图象和雪地上的猛犸象,为什么 AI 不行?
    RealVic
        15
    RealVic  
    OP
       2024-02-24 06:53:01 +08:00
    @fulajickhz #14 y=x^2 智谱可以画,这个本质上不是什么难事,只要把 y=x^2 用 Python 表达出来,然后根据代码生成图像就可以了,相当于帮你写个 MATLAB 运算
    andrew2558
        16
    andrew2558  
       2024-02-24 10:08:03 +08:00
    @RealVic 请问怎么开通的,我开通提示:
    Sorry, Gemini Advanced isn't available for you
    Gemini Advanced is not yet available in some countries, for work accounts, or for users under a certain age.
    请问应该怎么操作?
    Liftman
        17
    Liftman  
       2024-02-24 21:51:57 +08:00
    @fulajickhz 那如果你要差不多的话,是可以画的。。。gemini 可以生成类似的函数图。但是只能说是像某个函数的函数图。。但是肯定不是这个准确的函数图。。。因为

    1.他的训练集里面没有全天下所有的函数图。这也不可能做到。毕竟函数的精度是无限的,可能性也是无限的。
    2.函数图可以作为他的训练内容。但是是作为一个整体的。不管什么函数图。他都可能认为是同一个东西。
    3.这些所有的文生图模型都是模拟的视觉成像。

    总之你可以理解为。。生图的过程是开始有一个大概的模糊的样子。然后慢慢扩散成清晰的图片。但是扩散的过程充满了随机性。但是整体趋势是被模型训练过的内容进行控制的。。。一句话就是。文生图=尽可能的长得像仅此而已。
    RealVic
        18
    RealVic  
    OP
       2024-02-24 22:47:14 +08:00 via iPhone
    @andrew2558 用美国付款资料就可以了
    mixz
        19
    mixz  
       2024-02-25 02:01:31 +08:00
    请教个问题,gemini 的 api 是支持联网搜索的吗?
    stimw
        20
    stimw  
       2024-02-25 02:16:30 +08:00 via Android
    我觉得速度快是不是可能,有一部分原因是,没完全开放使用。。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5481 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 01:43 PVG 09:43 LAX 17:43 JFK 20:43
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86