我使用的是 [沉浸式翻译] 这个浏览器扩展。然后使用的某个 AI 的 api 。
我想请教一下各位,他是一段一段的发送给 AI 翻译,还是整篇发给 AI 进行翻译?
如果是整篇翻译,很容易超出 AI 的限定长度。
如果是一小段一小段的发给 AI 翻译,怎么能保证上下文连贯,语义一致并且意思相通呢?
1 z7356995 2024-09-12 18:16:56 +08:00 via Android 应该是一段一段的,如果你看油管上的视频英语字幕,你会发现上下句之间并不能连接翻译, |
![]() | 2 xu33 2024-09-12 18:18:30 +08:00 这个应该不是 ai 翻译的吧,感觉翻译质量很差,和 gpt 甚至 kimi 之类的都没法比 |
![]() | 3 shebaoting OP 如果是一段一段,做到上下文语义连贯就是个很麻烦的事情了。 |
![]() | 4 shebaoting OP @xu33 可以在设置里面设置你喜欢的 ai 。用自己的 api 密钥。 |
![]() | 5 xu33 2024-09-12 18:20:31 +08:00 @shebaoting 原来如此,我试试 |
![]() | 6 ao99 2024-09-12 18:22:18 +08:00 不知道具体怎么实现的,如果想实现上下文连贯的话可以几段一起翻译,然后每次总结下之前的翻译内容,当做上下文给下次翻译输入 |
7 IDKAFK 2024-09-12 18:26:44 +08:00 我记得是可以自定义段落数和文本长度的 |
![]() | 8 XIU2 2024-09-12 18:26:51 +08:00 你可以看一下另一个功能类似但开源的 fishjar/kiss-translator 代码是怎么实现的。 我记得这个作者好像也在 V2EX ?反正我也是在 V2EX 里发现这个项目的。 |
9 moudy 2024-09-12 18:33:23 +08:00 @shebaoting #3 有没有可能重叠发送呢?发送段落 1 2 3 4 5 , 显示 1 2 3 4 5 。 在发送 4 5 6 7 8 , 显示 6 7 8 ? |
10 iX8NEGGn 2024-09-12 18:52:23 +08:00 设置里不是有说明吗,可以一段一个请求的,也可以多段一个请求,多段的时候用提示要求返回固定的格式,但这对模型的指令遵循性要求比较高。 |
11 msrcatn203 2024-09-12 19:11:24 +08:00 内置 prompt 呗 有个上下文长度加上要求流利自然什么的 GPT 翻译不都是这么做的吗 |
![]() | 12 aitianci 2024-09-12 19:37:04 +08:00 ![]() 作者有个新闻项目叫 Buzzing ,那个项目的 TG 群可以问他 |
13 GrayXu 2024-09-12 21:24:03 +08:00 可以一段发,也可以小 batch 发。对应不同的 prompt ,你看设置就知道了。 |
14 lmdown 2024-09-12 23:32:11 +08:00 ai 会自动关联上文啊 |
![]() | 15 baidishenjian 2024-09-13 16:38:14 +08:00 肯定不是整篇,而是一段一段处理的,如果是整篇都没有办法和对应的文本对齐啊。沉浸式翻译不是一段中文一段英文吗,那应该就是那一堆英文送进去得到一段中文,然后把中文附加到段落后面。整个流程应该不复杂,遍历网页上的标签( p div span )然后把段落中的文本翻译,然后附加到句子后面。我之前做过有点类似的功能插件 https://github.com/woniu9524/dingdang-extension |
![]() | 16 lovelive1024 2024-09-14 09:07:13 +08:00 可以分成多段一起发,比如 { 第一段:xxx 第二段:xxx 第 N 端:xxx } 放在一起发过去,写好 prompt 就行了 |
![]() | 17 iorilu 2024-09-14 09:31:52 +08:00 ![]() 很简单 先分段 然后将每段发给 ai , 做两件事 1. 翻译 2. 总结 然后发下一段时, 带上前 1,2 段的总结, 让 ai 参考翻译下一段 |