如何用最优方法压缩同一个视频的音轨文件和视频文件 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
kouhe3
V2EX    问与答

如何用最优方法压缩同一个视频的音轨文件和视频文件

  •  < href="Javascript:" Onclick="downVoteTopic(915048);" class="vote">
  •   kouhe3 2023-02-10 23:03:54 +08:00 via Android 1401 次点击
    这是一个创建于 972 天前的主题,其中的信息可能已经有所发展或是发生改变。

    文件夹 project里 3 个文件:

    audio.webm (opus 。仅音频). video.webm (vp9 ,仅视频)

    out.mkv (opus,vp9 。合并完成)

    audio , video 文件是 ytdlp 从 YouTube 下载的. out.mkv 是合成的。

    目标:创建一个压缩包 . 包含 3 个文件。

    难点:压缩的时候,需要知道 audio 和 video 的数据与 out.mkv 是重复的。


    楼主的尝试: 用 7z 命令行。

    7z a folder.7z project.

    结果:folder.7z 非常大。可以判断 7z 没有识别出 audio video 和 out.mkv 的数据是重复的。

    如何调参?让压缩包的大小与 mkv 差不多?

    11 条回复    2023-02-12 10:09:38 +08:00
    duke807
        1
    duke807  
       2023-02-10 23:12:27 +08:00 via Android
    你是怎么合并的,有没有用 ffmpeg 编码方式指定 copy ?
    kouhe3
        2
    kouhe3  
    OP
       2023-02-10 23:12:46 +08:00 via Android
    @duke807
    Juszoe
        3
    Juszoe  
       2023-02-10 23:55:51 +08:00
    我比较好奇为什么要保留三个文件,只留 out 不行吗
    kouhe3
        4
    kouhe3  
    OP
       2023-02-11 00:36:52 +08:00 via Android
    @Juszoe 为了测试 delta 压缩
    sugarsalt
        5
    sugarsalt  
       2023-02-11 01:00:13 +08:00   1
    普通压缩软件是无法分辨源和合成的视频里有重复数据的,因为视频容器里并不是一整块视频,一整块音频。
    在合成 mkv 的时候,并不是简单的把源视频和音频各复制一遍再加个文件头,而是把源视频和音频都切成小块然后交错着按顺序排列在一起。
    如果你非要能够识别,需要专门写压缩解压程序,使其能先把各个轨道拆开抽出来,做比较,判断有没有重复,并且解压的时候还要能合并回去。
    kouhe3
        6
    kouhe3  
    OP
       2023-02-11 10:47:20 +08:00 via Android
    使用 git 可以压缩出和 mkv 大小一样的 pack.

    操作如下:cd 到 project.
    git init
    git config pack.window 1
    git config pack.compresion 1
    git add .
    git gc
    得到了 mkv 差不多大小的 pack.
    kouhe3
        7
    kouhe3  
    OP
       2023-02-11 11:12:42 +08:00 via Android
    https://transfer.hostux.net/get/Dw1wGW/bundle.bundle

    打包的 git 仓库从这里下载
    sugarsalt
        8
    sugarsalt  
       2023-02-11 16:46:42 +08:00
    @sugarsalt #5 收回我之前说的胡话
    我自己试了一下,从油管下得 video 22.2MB ,audio 7.23MB ,用 mkvtoolbox 生成 mkv 29.4MB ,另外生成一个 mp4 29.4MB ,共 88.4MB
    四个文件用 bandizip 压缩 7z ,最大压缩等级得到 28.4MB 的压缩包,正常压缩得到 49.3MB ,快速压缩得到 86.4MB
    明显是可以识别重复数据的。用官方 7zip 来也一样的结果。
    所以楼主试试 7z 不同的压缩级别看看呢?

    我还试了一下 winrar 就识别不出来,选择最大压缩+1024MB 的字典压出来还有 84.2MB 。。
    kouhe3
        9
    kouhe3  
    OP
       2023-02-11 19:15:20 +08:00 via Android
    @sugarsalt

    我加了 -mx9. 但是压缩出来的文件还是非常大。

    复现步骤:
    使用 ytdlp 下载一个视频。加 k 保留音轨和视频轨

    ytdlp -k https://m.youtube.com/watch?v=kx5-VXpTeU8

    使用 7z 压缩, 加 mx9.

    7z a yasuo.7z . -mx9 -t7z

    Archive size: 137701863 bytes (132 MiB)
    Everything is Ok
    sugarsalt
        10
    sugarsalt  
       2023-02-12 09:40:54 +08:00
    @kouhe3 #9 哦,我之前下的是 mp4 ,不是 vp9 编码的 webm ,所以可能和编码格式有关?
    kouhe3
        11
    kouhe3  
    OP
       2023-02-12 10:09:38 +08:00 via Android
    @sugarsalt 我们需要一些 delta 压缩,才能压缩出小体积
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5691 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 06:30 PVG 14:30 LAX 23:30 JFK 02:30
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86