爬虫究竟是合法还是违法的?爬虫的法律红线到底在哪里呢? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
patz
V2EX    外包

爬虫究竟是合法还是违法的?爬虫的法律红线到底在哪里呢?

  •  
  •   patz 2020-09-11 12:41:14 +08:00 1216 次点击
    div class="outdated">这是一个创建于 1925 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我有 5 年多的软件开发经验,是一名全栈软件工程师,主要帮助客户开发定制 ERP 、产品管理系统、自动化程序、桌面软件等程序。

    最近在谈的外包项目,有几个是爬虫的, 犹豫要不要接,因为最近听说做爬虫有法律风险。我研究了网络安全法,还有咨询了些同行, 说一般只是开发程序,不售卖数据,就没问题? 是这样的么?网络安全法感觉定义很模糊,它强调的用户隐私数据一般我们也爬不了(因为不在公开数据里面),除非 hack 进别人的服务器。


    我现在比较纠结, 因为我在在数据采集和爬虫软件开发方面有丰富经验, 大大小小做过 100 多个项目, 采集过的信息很广, 包括电商数据、企业数据、社交平台数据、招聘数据、和其他互联网数据等,这个市场也很大,不做感觉很可惜。
    14 条回复    2020-09-12 20:05:58 +08:00
    bytenoob
        1
    bytenoob  
       2020-09-11 13:18:50 +08:00
    robots.txt
    fank99
        2
    fank99  
       2020-09-11 14:26:26 +08:00
    按 robots.txt 来什么都别爬了。
    个人认为不碰个人数据、版权数据、基本问题不大。
    去年遭的一大波爬虫公司,都是爬个人信息给小贷做金融风控的。
    v2hh
        3
    v2hh  
       2020-09-11 14:34:08 +08:00
    一个朋友所在的公司爬直播数据的,昨天中午开始联系不上,到晚上了报警说是已经关起来了。
    cao2ji
        4
    cao2ji  
       2020-09-11 15:44:40 +08:00
    这个咋说呢,我这个圈子搞爬虫外挂抢 JD SN TM 还有全国商超的人太多太多,都是明目张胆的打广告,没听说谁被搞过,懂得低调规避。按说应该没啥问题,当然理论上是有法律风险的
    wysnylc
        5
    wysnylc  
       2020-09-11 16:13:27 +08:00
    去别人家门口捡垃圾可以,去别人家里捡垃圾就不行
    wandehul
        6
    wandehul  
       2020-09-11 16:28:55 +08:00
    涉及个人信息的,肯定不可以,公开的可怕,例如什么什么裁判文书之类的额。
    overthemoon
        7
    overthemoon  
       2020-09-11 17:04:21 +08:00
    个人信息,商业信息
    TimeRain
        8
    TimeRain  
       2020-09-11 17:25:12 +08:00
    违法不违法要看对方怎么说,爬取公开数据非用户隐私也有可能违法
    zhiwu
        9
    zhiwu  
       2020-09-11 17:31:40 +08:00
    我记得有一家被抓了,是因为爬的智联招聘的接口都报 500 了,笑死了。你轻点来不行?
    niselover
        10
    niselover  
       2020-09-11 17:38:33 +08:00
    楼主交个朋友 wechat: d2FuZ3NhbnhpYQ==
    patz
        11
    patz  
    OP
       2020-09-11 20:17:18 +08:00
    @niselover 你好,你发的貌似被屏蔽了, 你试试家我 yuandong_zhong
    patz
        12
    patz  
    OP
       2020-09-11 20:18:35 +08:00
    @v2hh 我去,你朋友出来了么? 具体因为什么原因被关? 直播数据也不行?
    winnerczwx
        13
    winnerczwx  
       2020-09-12 10:00:41 +08:00
    @patz 估计反编译了人家 app, 拿到了加密算法, 这就不算公开数据了吧
    v2hh
        14
    v2hh  
       2020-09-12 20:05:58 +08:00
    @patz 被 AL 告了,他们爬的是淘宝直播数据,三天后才能探视
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2428 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 45ms UTC 15:18 PVG 23:18 LAX 07:18 JFK 10:18
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86