r1mix: R1 思维链让普通 AI 更聪明 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
faceair
V2EX    分享创造

r1mix: R1 思维链让普通 AI 更聪明

  •  6
     
  •   small class="gray">faceair
    faceair 193 天前 6279 次点击
    这是一个创建于 193 天前的主题,其中的信息可能已经有所发展或是发生改变。

    经常体验不同大模型的朋友都知道,deepseek r1 的思维链质量非常高,脑子非常聪明并且情商高,但在实际使用的时候:

    1. 指令遵循的能力较差,不能完全按照要求输出
    2. 写作辞藻非常华丽和刻意,写出的文字总能一眼 R1,阅读体验和沉浸感感都比较差

    其他的普通模型,在指令遵循和写作文风上都有更优异的表现,但是脑子又弱一点。

    根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力 就可以达到 SOTA 级别的效果,而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。

    我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。

    最近我们做了一个 r1mix 的模型混合的网站,可以让你用 deepseek-r1 去加持任意的模型,不管是在写代码、写作其他各自通用任务上都有绝佳的表现。

    常见的推荐组合是:

    1. r1v3:新版 DeepSeek-V3 显著增强了代码能力和文学创作能力,在加持 DeepSeek-R1 后可以在最优的价格下实现 SOTA 级性能。
    2. r1claude:Claude 系列模型的代码能力是当前的 No. 1 ,在加持 DeepSeek-R1 后可以以更优的价格达到 Claude 3.7 Sonnet Thinking 的效果。
    3. r1grok:Grok-3 的文学创作能力是 Top 级别的,在加持 DeepSeek-R1 后故事的剧情会更加合理,表达也更富有层次感。
    4. r1gemini:Gemini 2.0 系列知识面非常广泛、能力也很全面,在加持 DeepSeek-R1 后可以轻松应对各种复杂需求。

    常见的模型都有,可以根据需求自己任意组合。也可以绑定你的 openrouter 账号,使用 openrouter 上的免费模型的时候我们不收费。

    https://r1mix.ai

    19 条回复    2025-04-02 16:01:29 +08:00
    maximdx
        1
    maximdx  
       193 天前
    有意思,这种多个模型搭配使用的原理是什么?
    faceair
        2
    faceair  
    OP
       193 天前   2
    @maximdx #1 先调用思考模型,获取到思维链以后停止请求,把思维链拼到原始请求里请求第二个模型
    DigitaIOcean
        3
    DigitaIOcean  
       193 天前
    有趣,关注
    xyfan
        4
    xyfan  
       193 天前
    LLM 的客户端 chatwise 好像也增加了类似的功能,调用一个模型的 thinking ,并应用于另一个模型
    listenfree
        5
    listenfree  
       193 天前
    按你这样说,qwq32B+qwen2.5code 也是 SOTA 级别哟,就是不知道如何流程化试用
    faceair
        6
    faceair  
    OP
       193 天前
    @listenfree #5 我们暂时没有 qwen2.5 code 模型的供应,你可以绑定你的 openrouter 账号,然后两个模型名用加号连接就可以调用了
    iyaozhen
        7
    iyaozhen  
       193 天前
    我充值试了下,感觉还行。不过也没解决 R1 本身的幻觉问题,就是 R1 强是强,但是不太稳定
    ovtfkw
        8
    ovtfkw  
       193 天前 via iPhone
    @faceair #2 就这?岂不是很简单
    pakro888
        9
    pakro888  
       193 天前
    市场上早已经有人开发出来了:
    1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合)
    2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源)
    rqYzyAced2NbD8fw
        10
    rqYzyAced2NbD8fw  
       192 天前
    @xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做,莫名其妙的垃圾功能做一堆,还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发
    SkywalkerJi
        11
    SkywalkerJi  
       192 天前 via Android
    主楼说的模型特点是中文写作吗,还是说外文也一样。
    Lee90
        12
    Lee90  
       192 天前
    邮箱登录好评
    paopjian
        13
    paopjian  
       192 天前
    赛博换脑, r1 的思维脑接上 claude 的嘴
    Seayon
        14
    Seayon  
       192 天前
    Cline 在写代码的时候也是先 PLAN 后 ACT ,我现在都用 deepseek-r1 去 思考计划,然后切换到 claude 再去 ACT
    anjingdexiaocai
        15
    anjingdexiaocai  
       192 天前 via Android
    这就是 deepClaude 吧,很早就有了
    hugowangnz
        16
    hugowangnz  
       192 天前
    @LanhuaMa 太对了,这么流行的功能不做,目前只能自己写函数支持思维链显示了
    LinSP
        17
    LinSP  
       192 天前
    这不是变形版蒸馏
    flcwk
        18
    flcwk  
       191 天前
    @faceair 对的,相当于用思考模型做规划,然后让实践能力强的模型进行操作,之前的 deepclaude 和 deepgemini 都是这个思路,进一步的可以引入多个思考模型进行专家会审,效果更佳
    faceair
        19
    faceair  
    OP
       191 天前
    @flcwk #18 多思考模型的话算是 agent 的思路了,做 API 的话延迟太大了 token 数跟效果也成正比的话,用户不买账
    关于     帮助文档     自助推广系统     博客 &nbs;   API     FAQ     Solana     2687 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 46ms UTC 15:06 PVG 23:06 LAX 08:06 JFK 11:06
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86