微信的 robots.txt 是否涉嫌违反《反垄断法》? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
captray
V2EX    问与答

微信的 robots.txt 是否涉嫌违反《反垄断法》?

  •  1
     
  •   captray 2020-12-25 10:34:32 +08:00 6969 次点击
    这是一个创建于 1765 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近搜东西时,发现微信的 robots.txt 文件禁止了除首页和几个页面的爬虫索引: https://mp.weixin.qq.com/robots.txt

    User-Agent: * Allow: /$ #关于此指令解释在链接 [2] 文末 Allow: /debug/ Allow: /qa/ Allow: /wiki Allow: /cgi-bin/loginpage Allow: /cgi-bin/wx Disallow: / 

    作为中文互联网最大的内容平台之一,微信竟然只对其他搜索引擎开放了几个页面[1],如果需要搜微信公众号的文章必须得在微信内,或者腾讯系搜索引擎搜狗内进行搜索,这是否已经涉嫌违反了《反垄断法》?

    [1] https://www.google.com/search?q=site:mp.weixin.qq.com

    [1] https://www.baidu.com/s?wd=site%3Amp.weixin.qq.com

    [2] https://developers.google.com/search/reference/robots_txt

    30 条回复    2020-12-26 12:58:14 +08:00
    PureWhiteWu
        1
    PureWhiteWu  
       2020-12-25 10:36:25 +08:00   4
    不涉嫌。
    这是知识产权问题。
    lakehylia
        2
    lakehylia  
       2020-12-25 10:44:21 +08:00   3
    不涉嫌,这是 WWW 的设计问题,robots.txt 就是一个行业自律协议而已,没有法律效力的。
    takemeaway
        3
    takemeaway  
       2020-12-25 10:49:35 +08:00   14
    微信本身就涉嫌垄断了,还需要管 robots 文件?
    captray
        4
    captray  
    OP
       2020-12-25 10:55:55 +08:00
    @lakehylia
    @PureWhiteWu
    了解,谢谢回答

    @takemeaway
    确实,感觉目前我国的反垄断法条还需进一步改进哈
    helionzzz
        5
    helionzzz  
       2020-12-25 10:57:45 +08:00
    一个日活 12 亿的软件本身已经处在实质垄断的地位了,不缺你一个行业自律 txt
    Jooooooooo
        6
    Jooooooooo  
       2020-12-25 10:58:10 +08:00
    那淘宝也应该开放百度抓取?
    longaiwp
        7
    longaiwp  
       2020-12-25 10:58:37 +08:00   4
    这个文件完全没有任何违规,但是微信垄断也不需要这个文件来证明,我们从它的行为已经能判断出它垄断了。
    PureWhiteWu
        8
    PureWhiteWu  
       2020-12-25 11:05:32 +08:00
    @lakehylia robots.txt 有法律效力。
    captray
        9
    captray  
    OP
       2020-12-25 11:16:39 +08:00
    jfdnet
        10
    jfdnet  
       2020-12-25 11:20:36 +08:00
    @longaiwp
    微软垄断官司当年不是打了好多年 差点被分拆 也极大影响了微软的产品策略 不然可能都不会错过移动时代。
    luoqeng
        11
    luoqeng  
       2020-12-25 11:35:34 +08:00   1
    南山必胜客了解下
    natashahollyz
        12
    natashahollyz  
       2020-12-25 11:41:14 +08:00
    第一 wx 本身就是垄断了,和 robots 无关

    第二 你家不让人进,这不是很正常吗?
    duhongle
        13
    duhongle  
       2020-12-25 12:43:39 +08:00
    robots 可以遵守也可以不遵守。。。关键是你爬取微信文章使用。。。微信直接搞死你
    EminemW
        14
    EminemW  
       2020-12-25 13:16:31 +08:00 via iPhone
    想啥呢?
    maichael
        15
    maichael  
       2020-12-25 13:28:09 +08:00
    @luoqeng #10 现在南山必胜客也没用了,阿里遭了下一个就是腾讯,这些互联网大公司这段时间会一个接一个被砍几刀。
    glennv2ex
        16
    glennv2ex  
       2020-12-25 13:31:02 +08:00
    robots 就是个君子协议
    passerbytiny
        17
    passerbytiny  
       2020-12-25 14:12:44 +08:00 via Android
    如果微信公众号占有市场主导地位,那么这么做是垄断的。在这一点上确实没垄断,因为微信公众号在内容平台市场不具有主导地位,事实上也不可能有任何商业公司能够主导国内的内容平台市场。
    prodcd
        18
    prodcd  
       2020-12-25 14:56:20 +08:00
    https://www.taobao.com/robots.txt

    User-agent: Baiduspider
    Disallow: /

    User-agent: baiduspider
    Disallow: /
    xhpan10
        19
    xhpan10  
       2020-12-25 17:20:20 +08:00
    是垄断了。。用户发的文章,他不能去强制决定这篇文章不能被其它搜索引擎收录
    x86
        20
    x86  
       2020-12-25 17:26:50 +08:00 via iPhone   1
    写爬虫还理直气壮了咋不要求微信给你个 api 直接调呢
    aegon466
        21
    aegon466  
       2020-12-25 17:30:10 +08:00
    @x86
    juziss
        22
    juziss  
       2020-12-25 19:21:57 +08:00
    @x86 这个跟对方的反爬机制太强了,直接投诉对方的行为是一样的
    Cielsky
        23
    Cielsky  
       2020-12-25 20:11:02 +08:00 via Android
    @xhpan10 用户可以自己选择多处发表吧
    zhoushiya
        24
    zhoushiya  
       2020-12-25 20:30:17 +08:00
    求问如果直接在 robots.txt 里写了禁止爬虫的目录,比如后台 admin 目录。。。但是通过网址直接打开 http://xxx.com/robots.txt 不就看到了后台的地址?
    mmdsun
        25
    mmdsun  
       2020-12-25 22:17:01 +08:00 via Android
    腾讯:只要我招聘国家退休官员够多,永远别想搞我反垄断。(梗来源于腾讯招要求)
    watzds
        26
    watzds  
       2020-12-25 22:23:13 +08:00 via Android
    说得好!淘宝禁止百度爬商品带的头
    Urutora
        27
    Urutora  
       2020-12-25 23:55:47 +08:00 via iPhone
    整天盯着蚊子吸你血,吸血鬼当没看见,服了。行政机关的垄断算不算垄断呢?怎么没人不服?
    iamsad3508
        28
    iamsad3508  
       2020-12-26 08:27:17 +08:00 via Android
    1.法律.txt 不改也行
    2.以前有 MSN,QQ 不构成垄断。现在有钉钉,说不定还是不能构成垄断呢
    3.360 的案子好像是说明 robot 还是有一些效力的吧?
    94
        29
    94  
       2020-12-26 12:55:01 +08:00 via iPhone
    @zhoushiya
    Disallow: /,然后 allow 你想要开放的目录就可以了,方向思考一下呗
    zhoushiya
        30
    zhoushiya  
       2020-12-26 12:58:14 +08:00
    @dfkjgklfdjg #29 明白了,先禁用所有,然后打开指定目录,多谢
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2143 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 16:09 PVG 00:09 LAX 09:09 JFK 12:09
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86