平台是如何知道是 AI 生成的文章? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
firhome
V2EX    程序员

平台是如何知道是 AI 生成的文章?

  •  
      firhome 2024-07-24 11:58:50 +08:00 3653 次点击
    这是一个创建于 443 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如某乎 能提醒是 ai 答题。

    看到别处的讨论:“ai 加速了互联网的速度,但是也制造了大量垃圾信息”,

    百度 和 谷歌貌似都加入了关于 ai 内容的判断?

    https://www.vincentschmalbach.com/google-now-defaults-to-not-indexing-your-content/

    想问一下各位,是否知道平台判断的标准?能否破解识别是 ai 生成?

    22 条回复    2024-07-26 17:36:03 +08:00
    SiWXie
        1
    SiWXie  
       2024-07-24 12:01:35 +08:00 via iPhone   1
    很简单,文本二分类问题,训练就好了,正确率颇高
    Rheinmetal
        2
    Rheinmetal  
       2024-07-24 12:16:15 +08:00
    21 年前的数据基本可靠 然后就好办了
    mirrornighth
        3
    mirrornighth  
       2024-07-24 12:23:02 +08:00
    直接将问题提给 gpt 然后比对回答?
    deplives
        4
    deplives  
       2024-07-24 12:29:56 +08:00   1
    ai 生成的内容还是有很显著的特点的,训练一个模型去判断正确率应该很高的。
    rekulas
        5
    rekulas  
       2024-07-24 13:12:51 +08:00   1
    上面几楼的思维还停留在 22 年吧?现在 ai 内容要么很难识别(微调过的,不是直接生成),要么把人类的误认为 ai 写的,而且越往后难度越大,openai google 这些大佬都做不出来精确识别的
    rekulas
        6
    rekulas  
       2024-07-24 13:13:50 +08:00
    另外知乎这个提示 ai 的也很水,经常把人写的也给你提示 ai 说白了识别到就是瞎猫碰上死耗子
    e3c78a97e0f8
        7
    e3c78a97e0f8  
       2024-07-24 15:04:54 +08:00 via iPhone
    @rekulas 不能精确识别和不能识别是两回事
    ChristopherCheng
        8
    ChristopherCheng  
       2024-07-24 15:42:47 +08:00   1
    我觉得这种识别很傻逼,也没有必要。
    因为针对任何问题的回答最重要的就是能不能解决问题,之所以 AI 写作存在就是因为大部分人不会提问,提问的是宽泛的问题,而不是具体的问题,这就给了 AI 自说自话的机会。
    人类越会提问,提出的问题越具体,就能实际看出 AI 到底是个什么水平。
    反过来说,如果一个平台充斥着大量乏乏而谈的回答,既可以说是真人回答的,也可以说是 AI 创作的,这个平台本身价值也不大了,比如知乎。
    murmur
        9
    murmur  
       2024-07-24 15:43:34 +08:00   1
    为什么要判断,ai 写的比小编写的好多了
    ray2023
        10
    ray2023  
       2024-07-24 16:21:31 +08:00
    这个不是答题者自己配置的吗, 在创作声明那里能选择"包含 AI 辅助创作"
    lichdkimba
        11
    lichdkimba  
       2024-07-24 16:32:50 +08:00
    训练一个 ai 来判断 ai 的文章,再训练一个用来判断 ai 判断 ai 文章准确性的 ai
    InkStone
        12
    InkStone  
       2024-07-24 16:51:18 +08:00
    LLM 本身就有判断 LLM 生成文章的功能。

    不过之前就有过邪道,在富文本里用人类看不到的形式写下对 LLM 的 prompt ,引导它在分类时输出“是人类写的”这样的结果。
    archxm
        13
    archxm  
       2024-07-24 16:55:01 +08:00   1
    反正知乎上,排版清晰,图文并茂,基本就是垃圾营销文了。
    管他是不是 ai 生成呢。
    我在想,能不能把 ai 融入 adblock
    rekulas
        14
    rekulas  
       2024-07-24 18:01:54 +08:00
    @e3c78a97e0f8 如果要咬文嚼字,确实可以这样理解,但你如果实现一个准确度 50%左右的硬币正反面预测器,这跟随机有什么区别吗,而现在所谓的 ai 预测就是这样的,基本跟随机没多大区别
    hxscript
        15
    hxscript  
       2024-07-24 20:40:51 +08:00
    AI 不 AI ,可能不是 google 评价内容的好坏的标准;有很多做 SEO 的就是 AI 生成的,照样几百万流量。

    关键是,内容对用户有没有价值、google 是否认为这个页面提供的信息,对整个 google 系统,是有信息增量的( Information gain )
    zhishi69
        16
    zhishi69  
       2024-07-24 22:09:35 +08:00
    我也在思考这个问题,知乎在 gpt 刚出后没多久就有检测的系统,只要是 gpt 原封不动搬过去的,知乎可以检测的到,现在论文也可以检测到 AIGC 率,gpt 写的论文检测系统就会查到
    potatowish
        17
    potatowish  
       2024-07-24 22:49:08 +08:00 via iPhone
    @hxscript 最近 google 自己都在搜索结果里加 AI 搜索内容
    R4rvZ6agNVWr56V0
        18
    R4rvZ6agNVWr56V0  
       2024-07-25 04:54:01 +08:00
    检测的要点:行文准确无误。
    Prompt 对抗:适当加入语句不通顺的口语化表述方式、emoji 表情以及混乱的标点符号。
    EndlessMemory
        19
    EndlessMemory  
       2024-07-25 10:14:19 +08:00
    gan 网络
    enjoyCoding
        20
    enjoyCoding  
       2024-07-25 17:04:16 +08:00
    知乎是有创作声明的, 写文章和回答问题得时候要表明包含 AI 生成内容, 其他平台不了解
    e3c78a97e0f8
        21
    e3c78a97e0f8  
       2024-07-26 13:34:06 +08:00
    @rekulas “而现在所谓的 ai 预测就是这样的,基本跟随机没多大区别”这个说法并不对。我都能一眼看出来很多文本是 AI 生成的,要训练一个 precision 在 50%以上的模型不是什么难事。
    rekulas
        22
    rekulas  
       2024-07-26 17:36:03 +08:00
    @e3c78a97e0f8 如果你指的是 55%的话,目前来说还是有可能达到的,但想达到 60 甚至 70 就很难了,因为一旦识别敏感度调高,对人类作品的误判率极速上升,以至于很难进行商用,我为什么敢这样说,因为试过用各种各样的 ai 鉴别,要么识别率低,要么误判率高,而且 ai 水平还在不断进步,难搞
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2618 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 33ms UTC 15:18 PVG 23:18 LAX 08:18 JFK 11:18
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86