混阅,使用充足的中文 context 实现英语词汇增长 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
lemonTreeTop
V2EX    分享创造

混阅,使用充足的中文 context 实现英语词汇增长

  •  
  •   lemonTreeTop 2024-05-14 09:19:20 +08:00 3883 次点击
    这是一个创建于 583 天前的主题,其中的信息可能已经有所发展或是发生改变。

    简介

    混阅,一个将中文网页文章转换为中英混合形式的阅读工具,使用充足的中文 context 实现英语词汇增长。利用先进的 LLM 技术,将文章中的词语替换为恰当的 English words ,支持混合、原文和对照阅读模式

    直接体验

    开发理念

    在二语习得(second language acquisition),中英混合使用的现象叫做 code-mixing ,它是一种有效的语言学习策略,使用已知语言作为脚手架,是一种基于自然主义的学习方法

    中文母语者的英语学习最大阻碍是中文,但最强辅助也是中文。经常用中文比附英文,容易产生中式英语 Chinglish 。而使用 code-mixing 策略则会不断与英文比较和联系,从而自然地吸收新词汇,促进语言习得

    更新日志

    • 支持微信扫码登录
    • 优化文章转换

    已知问题

    转换基于大语言模型技术,可能部分句子有不预期结果,持续迭代优化中

    第 1 条附言    2024-05-14 19:12:21 +08:00

    v1.0.6

    1、支持短文本转换,无需登录,快来玩吧

    43 条回复    2024-05-15 18:19:56 +08:00
    cJ8SxGOWRH0LSelC
        1
    cJ8SxGOWRH0LSelC  
       2024-05-14 09:22:08 +08:00   2
    这样不就变成香港人了么。
    codyyyds
        2
    codyyyds  
       2024-05-14 09:51:32 +08:00
    chrome 就有一款 马大哈翻译 插件,就是这种思路
    yp965FjL630VP3s2
        3
    yp965FjL630VP3s2  
       2024-05-14 09:51:34 +08:00
    感觉蛮有意思的,回帖支持一下。
    benzlucy
        4
    benzlucy  
       2024-05-14 10:01:11 +08:00
    适合我
    inhzus
        5
    inhzus  
       2024-05-14 10:12:24 +08:00
    有点意思。建议中英混排中英文之间加上空格...
    MozzieW
        6
    MozzieW  
       2024-05-14 10:27:48 +08:00
    体验了一下,我感觉我英文和中文都不会了,系统直接错乱。
    下面是我体验的内容:
    ```
    为什么随着年龄增长,我们感觉时间似乎流逝得更快 [译]
    1/ This feeling makes me very fascinated.

    作为个 36 岁的人,我感觉一年的时间比我还是个 child 或 teenager 时要 short 得多。

    这似乎是宇宙间的不公我们的 lifespan 更短了,而每一年过得也 faster 了。

    2/ 但为什么 would 这样呢?

    我初步认为,这是进化如何 shape 我们的大脑成为一个高效 storage device 的 unfortunate side effect 。

    3/ 我们的大脑本质上是一个 prediction machine 。

    它的 main 任务是构建一个 world 模型,以此来获得生存和繁衍的优势。

    4/ 能预测 phenomena 意味着能 control 它,从而拥有 power 。因此,我们的 brain 痴迷于 predicting 事物的 trajectory 。
    ```
    Solix
        7
    Solix  
       2024-05-14 10:29:05 +08:00 via iPhone
    牛逼,大厂就是这么说话的哈哈
    yaoyaomoe
        8
    yaoyaomoe  
       2024-05-14 10:49:43 +08:00 via iPhone
    's yuyan システム 鲁棒性很强的()
    Actrace
        9
    Actrace  
       2024-05-14 10:57:06 +08:00   1
    其实学习语言的最佳办法是从简单语境开始应用语言。
    几乎所有的语言学校都是这么做的。
    前期如果是语义不通,可以借助母语来理解,但是中后期基本不需要了。

    楼主,你的点子配合你的头像。
    简直完美。
    lemonTreeTop
        10
    lemonTreeTop  
    OP
       2024-05-14 11:02:10 +08:00
    @inhzus 空格为了分割词语,中英之间天然就分割了,不需要空格
    eaststarpen
        11
    eaststarpen  
       2024-05-14 11:06:32 +08:00
    一个想法, 在英语里混合中文或许更好
    lemonTreeTop
        12
    lemonTreeTop  
    OP
       2024-05-14 11:10:26 +08:00
    @MozzieW 这里文章都是按照中文语法的,整篇中文是主要内容,某几个个单词不会可以跳过,不影响阅读,大脑自己会脑补
    zthxxx
        13
    zthxxx  
       2024-05-14 11:11:03 +08:00
    这混阅排版看着太丑了
    crokily
        14
    crokily  
       2024-05-14 11:55:58 +08:00   1
    能像马大哈那样开发成 chrome 插件来使用吗?马大哈插件的使用方式很好,但是替换方式太生硬了,纯粹是关键词替换,语义并不通顺,类似‘你好> 你 good' ……混阅的替换就很恰当。但单独一个网页手动工具使用起来还是不如插件直接替换的方便
    pheyer
        15
    pheyer  
       2024-05-14 12:49:52 +08:00
    不太能接受这种模式,学英语初期可以以中文为拐杖,到后期这个拐杖绝对要抛掉才行,类似于小孩刚开始学走路时用学步车,后面就不再需要了
    idealhs
        16
    idealhs  
       2024-05-14 13:13:33 +08:00
    @StinkyTofus 香港人又如何,人家英语也挺好
    idealhs
        17
    idealhs  
       2024-05-14 13:14:19 +08:00
    @lemonTreeTop #10 建议加空格,参考本站会自动加。中英之间加空格是优雅的标准。
    drawstar
        18
    drawstar  
       2024-05-14 15:11:57 +08:00
    @pheyer 等差不多了 自己扔掉就好了
    lemonTreeTop
        19
    lemonTreeTop  
    OP
       2024-05-14 15:33:05 +08:00
    @crokily #14 插件实现方式的确方便,相关技术我还不是很熟悉,转换用到 AI 大语言模型,需要一定成本,计费方式可能要好好想想
    lemonTreeTop
        20
    lemonTreeTop  
    OP
       2024-05-14 15:39:50 +08:00
    @pheyer #15 以多数人英语阅读量之低,根本轮不到拼后期
    lstz
        21
    lstz  
       2024-05-14 16:32:00 +08:00 via Android
    这样做对 vocabularies 增长 would be helpful indeed ,但对于英语 comprehensive 能力来说起效甚微,英语语法与中文是有差别的

    我建议这会是更好的通过调整语法就和我这句话一样
    gdfsjunjun
        22
    gdfsjunjun  
       2024-05-14 16:41:54 +08:00
    有意思,不过建议中英文之间加个空格。
    gdfsjunjun
        23
    gdfsjunjun  
       2024-05-14 16:43:21 +08:00
    看语序,我感觉就是中文替换个别词到英文。只适合记单词。
    由于不是英文语序,所以语法之类就没有啦。
    iprime
        24
    iprime  
       2024-05-14 16:44:19 +08:00
    不伦不类,就算能学一个单词又能如何?

    如果习惯了这种思维模式,将会是场灾难。英语和中文都变得半瓶水。
    cmdOptionKana
        25
    cmdOptionKana  
       2024-05-14 16:56:14 +08:00   1
    改成 “装 B 话生成器”,走娱乐路线,可能会更受欢迎
    lemonTreeTop
        26
    lemonTreeTop  
    OP
       2024-05-14 17:07:46 +08:00
    @lstz 语法问题我也是有解决方案的,先用中夹英比较容易上手的方式实现词汇扩展,后面再解决语法问题。这是以前开的帖子讨论 t/943426#reply68 ,就是你说的形式
    lemonTreeTop
        27
    lemonTreeTop  
    OP
       2024-05-14 17:11:55 +08:00
    @iprime 不要把人的脑子想得那么笨,香港人就是这种思维模式,他们的英语和中文都变得半瓶水了吗,现在 LLM 可以轻松输出 code-mixing 的形式是一场灾难吗
    lemonTreeTop
        28
    lemonTreeTop  
    OP
       2024-05-14 17:13:54 +08:00
    @cmdOptionKana 在计划开发可以直接提交文本转换的功能
    lstz
        29
    lstz  
       2024-05-14 17:29:10 +08:00 via Android
    @lemonTreeTop 有考虑商业化组队吗?
    lemonTreeTop
        30
    lemonTreeTop  
    OP
       2024-05-14 17:40:20 +08:00
    @lstz 网站底部有个微信群聊,感兴趣可以进群然后加我聊聊
    enjoyCoding
        31
    enjoyCoding  
       2024-05-14 17:46:51 +08:00
    听 op 的描述觉得很好啊, 但是点进去读一下莫名觉得很搞笑很开心是怎么回事呢? 文章我保存了 等不开心的时候拿出来看看试试效果, 感谢楼主
    enjoyCoding
        32
    enjoyCoding  
       2024-05-14 17:48:31 +08:00
    给楼主一个网站的建议: 点进文章里面把浏览器 tab 的名字改一下, 因为我写了个小插件保存网页, 文件名是用 tab 的 title 保存的, 现在所有文章都是一个名字
    2exhjx
        33
    2exhjx  
       2024-05-14 19:13:39 +08:00
    很好的思路,不过目前以及有相关实现了
    “沉浸式翻译” 目前 chrome 应用商店显示有超过 800,000 的用户,可以自由选择各种语言,接任意 AI 接口
    lemonTreeTop
        34
    lemonTreeTop  
    OP
       2024-05-14 19:13:42 +08:00
    @cmdOptionKana 支持短本文转换啦,来体验下
    walkingDoge
        35
    walkingDoge  
       2024-05-14 19:19:23 +08:00
    感觉好有趣,可以根据不同的 level 来设置英语的比例和难度
    2exhjx
        36
    2exhjx  
       2024-05-14 19:22:20 +08:00
    感觉类似于 自定义设置 Prompt 让 GPT 翻译
    chutsetien
        37
    chutsetien  
       2024-05-14 19:35:23 +08:00   2
    @lemonTreeTop

    > 他们的英语和中文都变得半瓶水了吗

    是的。香港、新加坡、大马,都是如此。而且他们早就发现了这一问题,还试图找到解决方法(比如新加坡就曾官方推行过好几轮每次为期长达几年的「讲正确英文」行动以及与之相反的「讲正确的华文」倡议),但无一例外地都失败了。

    新加坡由于曾经强推英文,甚至搞出某种「新加坡英语」(不是民间乱讲的「新加坡式英语」,这已经算得上是 creole 了,而就是指被官方采用的「正确的英语」),就……给人一种不会讲英语非要强行说的感觉。比如机场里的「行李取回」(baggage reclaim), 我记得看到有人晒出来过他们竟然叫 ‘belt’ (带子)。你这……就算你想说的是那个具体的实在物品「转盘」也应该是 ‘carousel’ 啊。

    以及千万不要把香港人的英文想得有多好。你如果在海外稍微混一点 hong kong diaspora 就能知道了。

    很多人甚至成了一个非常悲哀的「无母语的人」。我的律师是一个马来华人,在英国生活已经几十年了,但 1. 英文真的……非常一般般,无论是说还是写,都是一般般; 2. 汉语官话能听,但讲的时候非常非常非常吃力; 3. 自己本来应该的母语(某种汉语族下的其他语言,记不清是客家话还是什么了)更是退化到了还不如汉语官话的水准。
    blackboom
        38
    blackboom  
       2024-05-14 20:46:31 +08:00 via iPhone
    有用
    mauve
        39
    mauve  
    PRO
       2024-05-14 23:07:54 +08:00
    支持,英文进阶到某个水平后,词汇量反倒成为了瓶颈,这样的工具确实能带来一些词汇水平上的提升。
    后期如果有支持浏览器插件的计划的话,希望能做一个油猴版本,即使代码混淆过也没事。
    lemonTreeTop
        40
    lemonTreeTop  
    OP
       2024-05-14 23:18:09 +08:00
    这种自发形成的语言融合当然有问题,因为没有正确用词,将错就错,所以在英语习得的道路上越走越远。所以我就必须得保证用词准确率,用上了 LLM 方式实现转换。中英混合不是最终的形式,而是词汇扩展的一种有效手段
    lemonTreeTop
        41
    lemonTreeTop  
    OP
       2024-05-14 23:24:03 +08:00
    @chutsetien 这种自发形成的语言融合当然有问题,受文化惯性影响,因为一开始没有正确用词,将错就错,所以在英语习得的道路上越走越远。所以我就必须得保证用词准确率,用上了 LLM 方式实现转换。中英混合不是最终的形式,而是词汇扩展的一种有效手段
    KgM4gLtF0shViDH3
        42
    KgM4gLtF0shViDH3  
       2024-05-15 10:16:03 +08:00
    为什么随着年龄增长,们感觉时间似乎流逝得更快,这篇文章很有用。
    lemonTreeTop
        43
    lemonTreeTop  
    OP
       2024-05-15 18:19:56 +08:00
    @2exhjx #33 沉浸式翻译不是在保留原文的吗,对照看
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     951 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 22:35 PVG 06:35 LAX 14:35 JFK 17:35
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86