有什么办法能量化 AI 超分辨率模型效果吗?例如 waifu2x 有非常多个版本,几年前原版效果很一般,现在感觉几个模型优化的方向都不一样没办法直接对比,测试了很多遍感觉原版效果反而最好 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
drymonfidelia
V2EX    程序员

有什么办法能量化 AI 超分辨率模型效果吗?例如 waifu2x 有非常多个版本,几年前原版效果很一般,现在感觉几个模型优化的方向都不一样没办法直接对比,测试了很多遍感觉原版效果反而最好

  •  
  •   drymonfidelia 2025 年 1 月 3 日 1599 次点击
    这是一个创建于 441 天前的主题,其中的信息可能已经有所发展或是发生改变。

    另外 Stable Diffuse WebUI 自带那个是不是不支持 alpha 通道,透明的图每次让它超分完都变成黑底

    10 条回复    2025-01-05 17:03:33 +08:00
    tool2dx
        1
    tool2dx  
       2025 年 1 月 3 日
    以前测试过一次,感觉 swinir 挺好,日常一直在用

    /t/975483

    效果不太好量化,一般来说模型越大效果越好,swinir 那个模型 100M 左右。B 站和 waifu2x 的模型都太小了。SD 那个属于重新绘图的范畴了,严格意义上不算超分,更像是仿写。
    drymonfidelia
        2
    drymonfidelia  
    OP
       2025 年 1 月 3 日 via iPhone
    @tool2dx 我指的是 SD webui 里 Extras 下面的 Upscale ,R-ESRGAN 4x+ Anime6B 这个模型,最近好像挺火,实测效果感觉没有别人说得那么牛逼
    drymonfidelia
        3
    drymonfidelia  
    OP
       2025 年 1 月 3 日 via iPhone
    @drymonfidelia 包括 ESRGAN 那个 demo 的效果我也无法复现,实测和 waifu2x 效果很接近,issue 里有同样无法复现 demo 效果的人,作者无回应
    tool2dx
        4
    tool2dx  
       2025 年 1 月 3 日
    @drymonfidelia sd webui 里也有 swinir, 就是最下面那个 SwinIR_4x ,在 anima6B 下面。

    以前单独测试过 ESRGAN ,模型有过拟合的问题。训练过的二次元图片效果巨好,没训练过的,就和 waifu2x 拉不开明显差距。

    中庸之道就是选 swinir 了,不是最好,也不至于垫底。
    drymonfidelia
        5
    drymonfidelia  
    OP
       2025 年 1 月 3 日
    @tool2dx swinir 我也测试过,感觉总体来说是原版 waifu2x 才是中庸之道,esugan 第一眼看上去不错但是仔细看涂抹过于严重,圆柱形的物体都让它干成圆锥了
    swinir 感觉是没给二次元图片优化过的样子,杂讯比 esugan 很多,但是偏写实的图还原地比 esugan 好很多
    waifu2x 没有什么亮点,大部分场合效果比较一般
    之前有个 https://waifu2x.booru.pics/ reddit 上的人都说不错,之前我也偶尔用过几次,本来也想测试下,结果上去看在不到一周前就永久关服了
    drymonfidelia
        6
    drymonfidelia  
    OP
       2025 年 1 月 3 日
    @drymonfidelia 另外两个模型好像都无法处理透明的 png ,waifu2x 是支持的
    drymonfidelia
        7
    drymonfidelia  
    OP
       2025 年 1 月 3 日
    @drymonfidelia 不确定是不是 webui 的问题,没搜索到
    Tohrusky
        8
    Tohrusky  
       2025 年 1 月 4 日
    试试看 [Final2x]( https://github.com/Tohrusky/Final2x) 呢,可以处理 alpha 通道,也支持 swinir esrgan hat dat 等[主流模型]( https://github.com/Tohrusky/Final2x/blob/main/src/renderer/src/utils/ModelOptions.ts)
    snylonue
        9
    snylonue  
       2025 年 1 月 4 日 via iPhone
    ssim 这个指标怎么样
    drymonfidelia
        10
    drymonfidelia  
    OP
       2025 年 1 月 5 日 via iPhone
    @Lychee0 试用了,切换模型要点开设置测试起来不够方便,建议加个一键用多个模型超分辨率的功能方便对比效果
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2866 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 31ms UTC 13:22 PVG 21:22 LAX 06:22 JFK 09:22
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86