关于精确统计你的词汇量/单词量,我有一个也许有趣的想法 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
Aether
V2EX    奇思妙想

关于精确统计你的词汇量/单词量,我有一个也许有趣的想法

  •  6
     
  •   Aether 2017-12-12 19:40:31 +08:00 6927 次点击
    这是一个创建于 2878 天前的主题,其中的信息可能已经有所发展或是发生改变。
    搜索“精确统计词汇量”,大多都是“词汇量测试”,或者“如何提高词汇量”这种。但这都不是我感兴趣的。

    我最感兴趣的还是:“我的词汇量到底有多少?”
    我感到,现在还没有一个工具里可以认真严肃地做到这一点。

    所以我计划开发一个软件(第一期包括 WEB 和 iOS )实现以下的思路:
    1、粘贴输入一段文本,或者通过 URL 抓取正文;
    2、点击你不认识的单词,标记为“不认识”;
    3、读完以后,将剩下的提交为“已认识”。

    经过一些阅读训练之后,可以越来越精确地反馈你的真实词汇量。

    我已经做好了一个 DEMO。通过大约 10-12 篇的单词,帮助我清理出 3000 个已知单词,也让我记住了不少新单词。立马能想起来的比如,fir,来自一篇讲述小兔子的历险记。outright,来自一首著名的诗。还有不少虽然说不出来,但是看见以后能马上想起来。因为这些单词都和一个故事 /场景牢固地绑定起来,形成了更为强烈的情感连接。

    下面是 DEMO 的一个示例界面:


    下面是我的一个阅读界面,展示了我读完以后的状态:
    (对,有些害羞,我的确头一次发现,我可以读完《卖火柴的小女孩》的原文。不一样的感受。)


    我自己的感觉是,一个人的认知能力是有限的。因为受到生词的影响,阅读时的“认知力”被分流了。而一旦有一个辅助系统来接管“生词”这件事,无形中,“阅读力”似乎被提高了,使我可以更聚焦在阅读本身上面。(这只是我的个人猜测)。

    此外,有了这些数据,我希望系统可以自动向我推荐适合阅读的文本(跳一跳就可以达到的,比如,5%-10%的生词量),然后通过反复曝光来提升我的阅读能力、语感和词汇量。

    如果你对这个想法也感兴趣,请发给我一封邮件:aetherwu * gmail.com ,加入到我的测试列表。

    这个想法对很多擅长阅读的大拿们显然是画蛇添足,若有打扰,还望忽略本帖。
    对这个想法有其他想法或者批评的,也还望多多指教。
    感谢。
    第 1 条附言    2018-01-02 13:03:13 +08:00


    发来邮件的朋友也有很多了,邮件沟通变得不是很方便,所以新建立一个微信群。欢迎新老朋友在群里提出使用上的问题、新功能需求,以及相互推荐值得阅读的文章。
    39 条回复    2023-04-02 20:37:18 +08:00
    SkyeX
        1
    SkyeX  
       2017-12-12 19:56:39 +08:00
    不错,不过读一篇文章,我不会的单词得提供翻译把?
    zeanzhou
        2
    zeanzhou  
       2017-12-12 20:39:43 +08:00
    感觉蛮有意思的,应该会有用
    之前用百词斩背过单词,他会提供一些图片和对应的例句辅助记忆,不过其实有时候我觉得他给的图片和例句还是蛮牵强的,不如在文章里看到来的印象深刻,高中的词汇量完全是做阅读做出来的 hh
    SuperMild
        3
    SuperMild  
       2017-12-12 20:56:38 +08:00
    good idea !
    mkstring
        4
    mkstring  
       2017-12-12 20:59:51 +08:00
    good idea !
    Aether
        5
    Aether  
    OP
       2017-12-12 22:09:39 +08:00
    @SkyeX 会的,点击一下就在底部浮动出翻译面板。
    @zeanzhou 对,我也用过百词斩。但弱场景的很快就忘了。
    sharkli
        6
    sharkli  
       2017-12-12 22:12:23 +08:00
    我不在意自己的单词量。
    通过你这个方式 能以后自动帮我把文章里面我可能不认识的单词标记出来,加上释义会比较有用。
    Aether
        7
    Aether  
    OP
       2017-12-12 22:48:58 +08:00
    @sharkli 对,这也是初衷之一。
    codermagefox
        8
    codermagefox  
       2017-12-12 22:55:06 +08:00
    主意很棒,赞一个。就是很奇怪为啥今天才有人想到...这个需求和做法应该已经十多年了?
    xml123
        9
    xml123  
       2017-12-12 22:55:52 +08:00
    有安卓版吗
    huijian222
        10
    huijian222  
       2017-12-12 23:26:41 +08:00
    第一:用户是否有耐心能读完这么多篇,如果有 业界是否有更有效的检测方式。
    第二:KINDLE 的生词本和辅助外语习得能力跟你的描述非常接近。
    solobat
        11
    solobat  
       2017-12-13 00:13:02 +08:00
    Chrome 里有这样的扩展,叫「单词发现者」。就是用户可以划定一个单词范围,比如 4000 以外的词汇都标出来。一开始我也觉得有意思,后来用着发现,对生词的识别需要先将单词还原成原形态,比如去掉复数、过去式、进行时等等,不然换了一种形式,原来的熟词又会被标成生词,这就尴尬了。还原单词形态这个,貌似是难点。
    YvesX
        12
    YvesX  
       2017-12-13 01:57:24 +08:00
    已经有很多外语阅读材料学习 app 了,你的想法适合做成其中一部分。单独拎出来好像不是很有必要。
    WildCat
        13
    WildCat  
       2017-12-13 02:16:27 +08:00
    不错,配合机器学习或者 word embedding 可能可以更有趣。
    CommitOne
        14
    CommitOne  
       2017-12-13 08:13:51 +08:00
    感觉可以啊,期待成品,上面说的时态变化的问题确实,不过有的词典不是有时态变化吗?
    nameryan
        15
    nameryan  
       2017-12-13 09:24:50 +08:00
    不错的 idea,感觉和时下流行的人工智能机器学习结合起来可能更有噱头,但实际应用场景有点局限,可能可以作为英语评测机构的一种方法?或者还有其他推广的场景? 暂时好像还想不到。
    dday
        16
    dday  
       2017-12-13 09:28:19 +08:00
    顶,已发邮件~
    Macbooker
        17
    Macbooker  
       2017-12-13 09:31:38 +08:00
    @codermagefox 难道现在市面上测单词量的不是抽样?测越多肯定越准,但太多也没意义,知道个大概水平就够了。
    最准的当然是拿一个词典挨个测
    sephrioth
        18
    sephrioth  
       2017-12-13 09:42:48 +08:00
    手动赞!
    minamike
        19
    minamike  
       2017-12-13 10:04:10 +08:00
    扇贝阅读?
    beball
        20
    beball  
       2017-12-13 10:43:15 +08:00
    不错的计划,已发邮件
    chuanqirenwu
        21
    chuanqirenwu  
       2017-12-13 10:43:24 +08:00
    想法很好的,配合机器学习,人工智能,推荐系统,可以做很多 in 垂死听的事情。请问 web 版在哪? ios 版可以在 appstore 下到了么。
    vipper
        22
    vipper  
       2017-12-14 07:51:48 +08:00 via iPhone
    不错,已邮件
    swx934
        23
    swx934  
       2017-12-14 16:34:53 +08:00
    这个功能扇贝阅读就有了.
    Tiakon
        24
    Tiakon  
       2017-12-17 02:16:41 +08:00
    不错,已邮件
    Damaidaner
        25
    Damaidaner  
       2017-12-18 10:51:25 +08:00
    不错,支持 LZ,期待正式上线!
    zzj0311
        26
    zzj0311  
       2017-12-19 15:04:46 +08:00 via Android
    意义在哪里。。扇贝刷个一万三四还能拿去吹个逼,能看懂不就行了~
    Axurez
        27
    Axurez  
       2017-12-21 16:05:12 +08:00
    听起来很像我在做的一个东西……我写了一篇文章介绍 https://zhuanlan.zhihu.com/p/31874729
    上线的地址在 https://www.eliseos.org/zh/babel/learn
    Axurez
        28
    Axurez  
       2017-12-21 16:10:38 +08:00
    @sharkli 你可以试试我这个(信息在楼上)

    目前只能严格标记认识、不认识的,没有推荐和联想。释义可以加,但是得自己加,可能可以考虑挂一个开源的词典(不知道有没有)。
    Gothack
        29
    Gothack  
       2017-12-21 18:25:11 +08:00
    赞,已邮件
    sharkli
        30
    sharkli  
       2017-12-21 20:00:25 +08:00
    @Axurez 多谢
    javaluo
        31
    javaluo  
       2017-12-21 22:07:12 +08:00 via Android
    就是这个想法呀,苦于不会写程序
    4396NeverBeSlave
        32
    4396NeverBeSlave  
       2017-12-22 08:22:06 +08:00
    想问下楼主有没有安卓版的?
    tvallday
        33
    tvallday  
       2017-12-25 01:46:10 +08:00 via Android
    一个单词可以有很多种意思的。你以为你懂了某个单词,其实换一句话你就不懂了。最好不要以认识不认识来主观计算自己的词汇量。玩玩可以,但是不是很科学。
    Aether
        34
    Aether  
    OP
       2018-01-02 12:55:52 +08:00
    发送过邮件的各位朋友都已经加入到 TestFlight 了。
    @dday
    @Gothack
    @Tiakon
    @vipper
    @dday
    @beball


    很抱歉现在还只是在实验这个想法,如果大家都觉得有趣,会做安卓版本的。
    @4396NeverBeSlave
    @xml123

    对,之后的辅助方式可能是各式各样的。
    @sharkli

    对,有一点点难度,但应该不是很难,一定会做。
    @solobat


    我也不知道啊(捂脸,可能是太懒了……)
    @codermagefox

    对,很棒的网站!很开心原道有相同想法而且能手动实现的朋友:D
    @Axurez
    Aether
        35
    Aether  
    OP
       2018-01-02 12:56:58 +08:00
    @tvallday 这里的认不认识并不是你是否背下了一个含义,而是看你在阅读过程里是否能理解这个单词的实际意思。如果看不懂肯定会点击查询一下。
    jyf
        36
    jyf  
       2018-01-02 14:35:16 +08:00
    网易有道以前就有个插件可以干这种事
    jagger2048
        37
    jagger2048  
       2018-07-30 11:16:44 +08:00
    想知道题主这个项目的后续发展如何。假设已经能够统计出用户较为精确的词汇量(项目的核心),要怎么通过这个获取而来的数据做文章?是做推荐阅读,还是单纯地提供一个接口供其他项目使用?
    Aether
        38
    Aether  
    OP
       2018-07-30 11:41:36 +08:00
    @jagger2048 推荐阅读对我来说现在还有点难度,属于技术树缺失。目前可能优先计划一个 Feed 阅读器……
    Winner4good
        39
    Winner4good  
       2023-04-02 20:37:18 +08:00
    项目还在做吗
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5031 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 42ms UTC 05:42 PVG 13:42 LAX 22:42 JFK 01:42
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86