[小论文神器] 基于 30w 文献数据的论文自动生成工具,设置主题、文风与字数即可,段落可无限更新 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
n3r0
V2EX    分享创造

[小论文神器] 基于 30w 文献数据的论文自动生成工具,设置主题、文风与字数即可,段落可无限更新

  •  
  •   n3r0 2020-02-06 21:34:20 +08:00 9045 次点击
    这是一个创建于 2082 天前的主题,其中的信息可能已经有所发展或是发生改变。

    迭代了一个多月,目前对常见类目的文章生成效果较好。对大量数据进行了一些简单的机器学习和过滤,主要是通过题目和关键词来匹配段落。

    使用非常简单,设定参数三步生成,然后针对段落进行调整到满意为止。

    设定参数 图 1:设定参数

    调整段落 图 2:调整段落(底下一排圆形按钮为 切换,更新,增减当前段落)

    一些特性:

    • 自适应移动&桌面端
    • 夜间模式切换
    • 生成文章几乎无重复
    • 高级版无限精确关键词
    • 标准格式 doc 文档下载

    欢迎使用!

    连接:小论文神器

    推荐给各位的同时,也想探讨一个问题:论文的自动生成可以走什么样的思路?是否可以把文章结构抽出来,只要给予核心的思想,就能生成格式和内容上都可行的文章。有些人或许有想法,但不擅于写文章。后面我想逐渐向这方面靠拢,毕竟以目前的方法,优化再好也只能是个参考。

    Thx

    26 条回复    2020-02-12 02:13:54 +08:00
    easylee
        1
    easylee  
       2020-02-06 21:57:21 +08:00
    n3r0
        2
    n3r0  
    OP
       2020-02-06 22:04:06 +08:00   1
    @easylee 这种情况,一般是某些关键词匹配到的数据没有优化好♂可以重新生成试试,或者替换相关段落。

    数据量太大,过滤了好多遍还是有漏网之鱼,头痛啊。
    sevenQu
        3
    sevenQu  
       2020-02-07 11:47:07 +08:00   1
    太狠了,我收藏了,其实我觉得可以换一个思路,不一定要直接生成全文。按更细的粒度需求生成文章的某个段落,我觉得就挺好,省的自己去想这段套话怎么写,哈哈
    cxsz
        4
    cxsz  
       2020-02-07 11:52:11 +08:00   1
    挺好玩的,支持一下
    n3r0
        5
    n3r0  
    OP
       2020-02-07 13:21:10 +08:00
    @sevenQu 有道理,目前整篇文章就是按段落为单位生成的,只是还没有具体做一些区分,后面应该可以把正文再分成几个部分,然后按套路生成
    mosbic
        6
    mosbic  
       2020-02-08 16:59:36 +08:00
    可以开始编了(^-^)V
    hhxiaolei
        7
    hhxiaolei  
       2020-02-08 18:39:22 +08:00
    能否开放 api?
    n3r0
        8
    n3r0  
    OP
       2020-02-08 20:20:11 +08:00
    @hhxiaolei 目前还不行,一是考虑到自己服务器可能支撑不了,二是目前的数据整理的太乱放出去有点丢人,还在进一步的优化当中。日后如果效果比较稳定了,可以开放一些高级接口,直接获取相关的段落。
    n3r0
        9
    n3r0  
    OP
       2020-02-08 20:21:21 +08:00
    @mosbic 会努力让它编的越来越好
    hhxiaolei
        10
    hhxiaolei  
       2020-02-08 20:55:39 +08:00
    @n3r0 怎么联系您
    n3r0
        11
    n3r0  
    OP
       2020-02-08 21:57:44 +08:00
    @hhxiaolei 网站的菜单,关于作者,里面有工作邮箱。抱歉不想留在公共场合,容易被爬虫广告邮件骚扰
    luo7
        12
    luo7  
       2020-02-09 02:37:06 +08:00   1
    我的天啊这真的是神器
    Dreax
        13
    Dreax  
       2020-02-09 04:51:08 +08:00
    tql
    dick20cm
        14
    dick20cm  
       2020-02-09 22:04:03 +08:00   1
    楼主挺厉害的,我记得几年前听说亚研院有做过类似工作,但可能因为各种原因并没有变成真正的产品
    n3r0
        15
    n3r0  
    OP
       2020-02-10 09:29:10 +08:00
    @dick20cm 之前我只查到过 MIT 有做过英文假论文的生成,这个倒是不清楚,回去了解一下,感谢
    我觉得对真正的产品考验最大的,应该还是通用性,单一类目的生成还是比较容易的。
    tfdetang
        16
    tfdetang  
       2020-02-10 10:41:53 +08:00
    楼主可以说下思路吗? 是基于 gpt-2 训练的吗?
    n3r0
        17
    n3r0  
    OP
       2020-02-10 13:09:20 +08:00
    @tfdetang 不是。目前的效果还不够理想,等优化的差不多了可以放出来交流一下♀
    现在只能说是,“人工”的部分还大于“智能”
    tfdetang
        18
    tfdetang  
       2020-02-10 16:09:14 +08:00   1
    @n3r0 好的啊,到时可以交流下。 其实 NLP 的东西,都是先人工再智能的。 一上来就智能的除非 PPT
    cainiuwow
        19
    cainiuwow  
       2020-02-10 22:14:13 +08:00 via Android   1
    哈哈,挺有意思的,刚试了一下,根据手里的诉讼案件,整理了几个关键词,然后生成论文,节省了一部分找资料的时间。
    粗略看了一下,有些内容还是可以直接作为论述观点的。nice~
    n3r0
        20
    n3r0  
    OP
       2020-02-11 09:40:36 +08:00
    @cainiuwow 能帮上忙就太好了一度因为它直接生成的效果不稳定打算放弃,后面还是加了个段落替换功能,感觉做个参考还可以。现在每天小几百人访问,也挺有成就感的,哈哈。
    337136897
        21
    337136897  
       2020-02-11 10:11:57 +08:00   1
    楼主你为什么不早个好几年开发出这玩意
    cainiuwow
        22
    cainiuwow  
       2020-02-11 14:57:06 +08:00 via Android   1
    @n3r0 哈哈,楼主要加油啊,如果建立群的话记叫我。这个虽然暂时不能直接作为论文使用,但是参考意义是很大的,能给很多的思路和想法。还有 3000 字有点少,如果能多一点就好了。
    n3r0
        23
    n3r0  
    OP
       2020-02-11 20:29:17 +08:00
    @cainiuwow 哈哈哈谢谢,字数限制主要是为了用户体验,理论上几万字都没问题,但是目前的生成速度太慢了。
    等后期再优化的好一点,会考虑哒
    clemente0620
        24
    clemente0620  
       2020-02-11 21:07:53 +08:00
    挺好玩的 但是有些生成的论文会牛嘴不对马尾? 想知道是用的 AI 神经网络做的算法吗?还是单纯的标题+关键词关联
    n3r0
        25
    n3r0  
    OP
       2020-02-11 22:33:49 +08:00
    @clemente0620 数据的前期处理用了机器学习,文章生成是直接按照类目+关联度的算法从数据库取的内容,没有 AI,不然计算量太大了承受不起。
    Telegram
        26
    Telegram  
       2020-02-12 02:13:54 +08:00 via iPhone
    一查重,死翘翘,重复率可能 80%以上
    关于     帮助文档     自助推广系统     博客     API   &nsp; FAQ     Solana     5201 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 40ms UTC 03:53 PVG 11:53 LAX 20:53 JFK 23:53
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86