分享一下目前的开源工作,针对 ACGN 领域的 CoT 翻译模型以及适配的推理前端,可以简单的在本地翻译字幕和电子书和任意文本原样输出。目前 ACGN 领域 Sota 的翻译效果。 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
soundrain
V2EX    分享创造

分享一下目前的开源工作,针对 ACGN 领域的 CoT 翻译模型以及适配的推理前端,可以简单的在本地翻译字幕和电子书和任意文原样输出。目前 ACGN 领域 Sota 的翻译效果。

  •  1
     
  •   soundrain
    soundstarrain 2 月 27 日 1293 次点击

    首先,简单介绍一下工作。这是一个针对轻小说,galgame 等 ACGN 领域文本翻译而训练的翻译模型。相比其他的翻译模型的主要优点是:

    1. 采用了任务针对性的 CoT 过程,针对任务的困难点(如人称,主被动,场景等进行了针对性设计)
    2. 采用平均长度 1500 字以上的长段落进行训练,以获得更好的上下文能力
    3. 在训练集的选择中尝试引入了前沿的核心集选择算法进行筛选。

    模型具体情况: 目前训练了 8b 和 14b 两个参数的模型,共使用 8xH100 全量微调约 2 天。底模是 Sakura-Qwen3-Base ,在此感谢 sakura 和 qwen 的贡献为本工作节省了大量 PT 和 CPT 的时间。

    模型的具体效果, 可以参考我们在这里的测试,使用 COMET (wmt22-comet-da) 指标测试了共 200 个段落级别的数据,效果优于 Gemini3.0pro 以及 claude4.5opus 等 sota 闭源商业模型。用户的反馈结果和实际检查下来也很不错,在 ACGN 领域有着很强的翻译效果,并且还有一点,没有审查,可以翻译某些不可言说的东西()

    我会放一段具体的翻译结果对比到评论区供大家参考。


    然后再简单介绍一下针对翻译模型适配开发的推理前端。(虽说是针对本模型设计但是现在功能已经很全面了)

    可以一键安装然后将日文 epub/txt/srt/ass 等文件翻译,原格式输出。配置简单,并且内置几乎完全可自定义的功能。

    顺带一提使用第三方 API 也是可以用这个 GUI 进行翻译的,具体就不多说了贴几张图吧

    6 条回复    2026-02-28 21:38:33 +08:00
    soundrain
        1
    soundrain  
    OP
       2 月 27 日
    以下是为了大家方便参考翻译能力,选择了 3 个比较难的段落,对比 murasaki14b 和 gemini-3-pro proview 的翻译水平( g3p 是公认的处理跨语言任务最强的通用模型之一)

    1raw:そもそも魔法という事象が、者の精神域に内在する想子(プシオン)の波形を、外部世界に存在する事象改のための起式として定された情体に投射し、その果として世界そのものが保有する元力——すなわち、物理法という名の固な性——を一的にしつことで成立する「欺の奇」であるとするならば、彼女が今、目の前で展している象は、魔法というカテゴリに押しめるにはあまりにもであり、むしろ世界そのものの定を根底からきえる「造」の域に片足を突っんでいると言わざるを得ないだろう。通常、代魔法の理体系において重要されるのは、いかに率よく想子を消し、いかに迅速に事象への干力を最大化するかという一点に尽きるが、彼女の式には、までのプロセスにおけるとしか思えない式的修が重にも施されており、それがなる装ではなく、因果律という名のを一つずつ丁に解きほぐし、物理法の反作用(バックラッシュ)を者ではなく「世界そのもの」に肩代わりさせるための、めて魔的かつ天才的な安全装置(セフティ)として能しているという事にづいた瞬、背筋をりつかせるようなが私の全身をけ巡ったのである。それは、例えるなら、泥棒がをけて入るのではなく、家のそのものをきえて「最初から扉はいていた」という事にすり替えるような、神への冒にも等しい所だった。
    gemini3pro:归根结底,如果将“魔法”这一现象,暂时定义为“术者将内在精神领域的想子( Psion )波形,投射到作为外部世界事象改写程序的启动式这一信息体上,并通过暂时欺骗世界本身所持有的复原力即名为物理法则的顽强惯性从而成立的‘欺瞒之奇迹’”,那么她此刻在眼前展开的现象,若硬要塞进“魔法”这个范畴里,未免显得过于异类。倒不如说,她已经一只脚踏进了从根本上改写世界定义的“创造”领域。
    通常,在现代魔法的理论体系中,最受重视的一点无非是如何高效地消耗想子、以及如何迅速地最大化对事象的干涉力。然而,她的术式在发动前的过程中,施加了一层又一层看似纯属多余的仪式性修饰。当我意识到这些并非单纯的装饰,而是为了将名为因果律的锁链逐一细致地解开,并将物理法则的反作用( Backlash )并非转嫁给术者、而是转嫁给“世界本身”来承担的、极度恶魔却又天才般的安全装置( Safety )时,一股令人背脊发冻的战栗瞬间传遍了我的全身。
    打个比方,这就好比小偷不是撬锁进屋,而是直接改写了房子的设计图,将事实替换成了“门从一开始就是开着的”,这简直是等同于亵渎神明的所作所为。
    murasaki14b:如果说,魔法这一现象本质上是术者将内在精神领域中的想子( Psion )波形,投射到外界用于改变事象的预设信息体即启动式上,并通过暂时欺骗世界本身所拥有的复原力(即名为物理法则的坚固惯性)而成立的“欺瞒之奇迹”;那么,她现在于眼前展开的现象,便显得过于异质,无法被强行归入“魔法”这一范畴,甚至不得不让人认为,她已经有一只脚踏入了从根本上改写世界定义的“创造”领域。通常在现代魔法的理论体系中,最受重视的便是如何高效地消耗想子、如何迅速地将对事象的干涉力最大化,然而她的术式中,却叠加了数层在发动过程看来纯粹是浪费时间的仪式性修饰。然而,当我意识到那并非单纯的装饰,而是为了将名为因果律的锁链逐一细致地解开,并让物理法则的反作用力( Backlash )并非由术者、而是由“世界本身”代为承担,作为极度恶魔化且天才的“安全装置”发挥作用时,一股令人脊背发凉的战栗瞬间席卷了我的全身。那简直就像是贼人并不通过撬锁入室,而是改写了房屋的设计图,将其篡改为“门从一开始就开着”的事实。这简直是等同于对神明的亵渎。
    soundrain
        2
    soundrain  
    OP
       2 月 27 日
    2raw 局のところ、がその手を差し伸べなかったのは、彼女を救うことによって生じるリスクを恐れたからでも、あるいは自分自身の力さを痛感していたからでもなく、ただに、そうしてかを救おうとする自分自身の姿が、かつて自分が最も蔑していた「物の主人公取りの善者」そのものであるという事を、越しにせつけられるような烈な既感と自己嫌に耐えられなかったからに他ならないのではないか、という疑念がにへばりついてれない。もちろん、そんなものは後付けの言いにぎず、本当はただ、彼女が望ので泣き叫ぶ姿をることで、自分だけが不幸なのではないという歪んだ安堵感を得たかっただけなのかもしれないし、あるいは、そうやって自己分析をり返すことで「自分は自分の卑劣さを理解している理性的な人だ」という免罪符を意のうちに行し、良心の呵から逃れようとしているだけなのかもしれませんが、いずれにせよ、あの瞬、彼女の瞳から光が消え失せ、望という名の暗い深がその奢な身体をみんでいくのをただ傍していたという事は、どれだけ言を尽くして正当化しようとも、あるいはどれだけ自虐的な理で自分を断罪しようとも、して覆ることのない、という人の本的なさを明する定的なとして、これからの人生においての喉元に突きつけられける利な刃となるだろう。
    gemini3pro:其实我当时之所以没有伸出援手,既不是因为害怕救她会带来风险,也不是因为深感自己的无力,我脑海中盘踞着一个挥之不去的疑念:归根结底,我只是无法忍受那种强烈的既视感与自我厌恶那一刻,试图去拯救谁的自己,仿佛隔着镜子让我看到了曾经最被我轻蔑的“自以为是故事主角的伪善者”的丑态。
    当然,这不过是事后的借口罢了。或许我内心深处只是想通过看着她在绝望深渊中哭喊的样子,来获得一种“不幸的并不只有我一人”的扭曲安堵感;又或者,我是想通过这种不断的自我分析,在无意识中给自己发放一张写着“我是个能理解自身卑劣之处的理性之人”的免罪符,好让自己从良心的苛责中逃脱。
    但无论如何,在那一瞬间,她眼中的光芒熄灭、名为绝望的黑暗深渊将其纤细的身躯吞没,而我只是在一旁袖手旁观这一事实,无论我用多少言语去正当化,亦或是用多么自虐的逻辑来审判自己,都绝不会被推翻。它将成为证明“我”这个人类本质上何其丑恶的决定性证据,在今后的人生中,化作一把锐利的尖刀,永远抵在我的喉头。
    murasaki14b:归根结底,我之所以没有向她伸出援手,既不是因为害怕救赎她所带来的风险,也不是因为痛感到了自身的无力,而仅仅是因为,我无法忍受那种强烈的既视感与自我厌恶仿佛自己试图拯救他人的姿态,通过镜子映照在自己眼中,与过去最为鄙夷的“自以为是故事主角的伪善者”完全重合。当然,这些都只不过是为了事后找的借口,真相或许只是我单纯想通过目睹她在绝望深渊中哭喊的模样,来获得一种“并非只有自己不幸”的扭曲安堵感;又或许我只是在通过反复的自我剖析,在无意识中给自己颁发一张名为“我是一个理解自己卑劣之处的理性之人”的免罪符,从而逃避良心的呵责。但无论如何,那一瞬间,她眼中的光芒消失,名为绝望的漆黑深渊将她纤弱的身体吞没,而我只是在旁冷眼旁观。这一事实,无论我用多少言语去正当化,抑或是用多么自虐的逻辑来断罪自己,都绝不会被推翻。它将成为证明我这个人的本质丑恶的决定性证据,化作一柄锋利之刃,将在我此后的人生中,一直抵在我的咽喉之上。
    soundrain
        3
    soundrain  
    OP
       2 月 27 日
    3raw 帝国四五八年に勃した北部における大模攻、後に「屑の三日」と称されることになるその凄惨な消耗が、なる土的野心を背景とした侵略行ではなく、帝国内部で腐しきっていた合体が抱えるな在を一し、同に次世代型自律兵器のデタを集するために仕まれた、めて冷かつ算高い「在分」であったという事は、当最前で肉挽きのような火に晒され、泥と血にれて死んでいった数万の将兵たちにとっては、知る由もない、あるいは知ったところで到底受け入れいのような真であったにいない。だが、史のというものは常に慈悲なものであり、彼らの牲の上に成り立った「平和」という名の砂上の楼が、国邦とのにばれた不可侵条という薄によって辛うじて持されている状をみれば、あの戮を「必要」と断じてらない中央の官僚たちの傲慢な理も、国家という巨大なシステムを持するためには、あるの正当性をびてしまうという、吐きを催すようながそこには横たわっている。局、英雄として祭り上げられた彼らの族に支われたのは、国という名の切れと、名誉という形のない虚だけであり、そので莫大な利益を上げた需企が、今や帝国の政治定すら左右するほどの力を有しているというこの国の造的欠こそが、次なる悲のをにきけているのだ。
    gemini3pro:帝国历四五八年爆发的北部战线大规模攻势,也就是后世称之为“废铁的三日”的那场凄惨消耗战,其真相并非单纯是基于领土野心的侵略行为,而是帝国内部早已腐败透顶的军工复合体为了清空过剩库存,并同时收集次世代自律机动兵器实战数据而策划的一场极度冷酷且充满算计的“库存处理”。这一事实,对于当时在最前线暴露于绞肉机般的炮火中、满身泥泞与鲜血死去的数万将兵而言,是无从知晓,即便知晓了也绝对无法接受的噩梦般的真相。
    然而,历史的齿轮总是无情的。鉴于建立在他们牺牲之上的这座名为“和平”的空中楼阁,如今仅仅是靠着与邻国联邦签订的互不侵犯条约这层薄冰才勉强维持,那么中央官僚们将那场杀戮断言为“必要之恶”的傲慢逻辑,为了维持国家这一巨大系统的运转,竟然也带上了一种正当性这令人作呕的现实便横亘于此。
    最终,作为英雄被供奉起来的死者,其遗属所得到的只有名为国债的纸片和名为荣誉的无形虚饰;而在其背后攫取了莫大及其利益的军需企业,如今甚至拥有了左右帝国政治决策的权力。这个国家的这种结构性缺陷,正是确凿无疑地播撒着下一场悲剧种子的元凶。
    murasaki14b:帝国历四五八年于北部战线爆发的大规模攻势,其后被称为“废铁之三日”的那场惨绝人寰的消耗战,实则并非单纯基于领土野心的侵略行为,而是一场极其冷酷且算无遗策的“清理库存”。其真实目的,是为了扫清帝国内部已腐败透顶的军需复合体所积压的过剩库存,同时收集次世代型自律机动兵器的实战数据。对于在当时最前线被如绞肉机般的炮火肆虐、死于泥泞与血泊中的数万将士而言,这真相无从知晓,抑或是即便知晓了也绝难接受,那必然是如噩梦般的现实。然而,历史的齿轮总是冷酷无情的。考虑到目前与邻国联邦之间,那座建立在牺牲之上的、名为“和平”的砂上楼阁,正由名为“互不侵犯条约”的薄冰勉强维系着,那么将那场杀戮剧断定为“必要之恶”也毫不避讳的中央官僚们的傲慢逻辑,为了维持名为国家的巨大系统,也确实带上了某种正当性这种令人作呕的现实横亘在那。最终,被捧为英雄的遗属们,所得到的仅仅是名为国债的纸片,以及名为名誉的无形虚饰。而在背后攫取巨额利益的军需企业,如今已拥有足以左右帝国政治决定权的权力。这个国家的结构性缺陷,正确实地不断撒下下一场悲剧的种子。
    Tohrusky
        4
    Tohrusky  
       2 月 27 日
    ### Reviewer 2

    Paper Summary:
    This post introduces Murasaki, an open-source CoT translation model tailored for the ACGN domain, complete with an out-of-the-box local inference GUI.

    Summary Of Strengths:
    The project demonstrates exceptional practical utility.

    Summary Of Weaknesses:
    Where is the technical report?

    Comments Suggestions And Typos:
    Have you considered or experimented with Reinforcement Learning (RL) post-training methods, such as GRPO or PPO?

    Confidence: 3
    Soundness: 3
    Excitement: 4
    Overall Assessment: 2.5 = Borderline Findings
    soundrain
        5
    soundrain  
    OP
       2 月 28 日
    @Tohrusky

    To Reviewer 2:

    General Response:
    We sincerely thank Reviewer 2 for their valuable time and for recognizing the "exceptional practical utility" of our work. We address your insightful comments below:

    Response to Weaknesses (Where is the technical report?):
    We thank the reviewer for pointing this out. Due to the strict 0-page limit of this forum "conference," the technical report was unfortunately omitted. Furthermore, as this is a passion-driven community project rather than a formal academic paper, we leave the writing of a formal technical report to "Future Work." For now, all technical details are provided in the form of the ultimate pseudocode: the open-source repository itself.

    Response to Comments (Regarding RL post-training):
    We highly appreciate the reviewer's brilliant and constructive suggestion! We have indeed considered Reinforcement Learning. However, rather than GRPO or PPO, our primary focus is on DPO (Direct Preference Optimization).
    Given our compute constraints (and to avoid the high blood pressure caused by exploding loss curves in PPO), DPO offers a much more elegant and stable path for translation alignment. Especially when it comes to preserving the model's ability to translate certain "unspeakable things," DPO seems perfectly suited for aligning with human preferences.

    Conclusion:
    We hope our rebuttal fully addresses your concerns. If so, we humbly request the reviewer to consider raising the Overall Assessment score to 4.0 (Strong Accept)! Please, my graduation (crossed out) my hobby depends on it!
    Tohrusky
        6
    Tohrusky  
       2 月 28 日
    @soundrain
    ### Reviewer 2

    All my concerns have been addressed. I will happily raise my OA score to 5 (Consider for Award). Good Luck!
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     955 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 21:38 PVG 05:38 LAX 14:38 JFK 17:38
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86