爬 zf 的信息公示的数据有法律风险吗 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dongisking
V2EX    问与答

爬 zf 的信息公示的数据有法律风险吗

  •  
  •   dongisking 2020-03-05 11:55:23 +08:00 6683 次点击
    这是一个创建于 2045 天前的主题,其中的信息可能已经有所发展或是发生改变。

    无意发现了某个城市的 zf 查询的信息接口,果然一看直接把整个表的数据都返回了,一共 30 多个字段毫无保留地保存到本地了!!网站提供的信息只有五六个,但是通过猜字段发现了特别多有用的数据,可以提供更强大的数据查询。如果做成工具牟利会被抓吗?

    第 1 条附言    2020-03-05 14:30:17 +08:00

    看了大家的回复,再看看这个思考了一下

    52 条回复    2020-03-07 22:53:25 +08:00
    Vegetable
        1
    Vegetable  
       2020-03-05 11:58:58 +08:00
    爬取没问题,盈利有问题
    back0893
        2
    back0893  
       2020-03-05 11:59:28 +08:00
    没有 zf 的信息公示本身就是公开数据
    temporary
        3
    temporary  
       2020-03-05 12:10:09 +08:00   1
    感觉他公开的字段没问题 但是你发现的那些网页上没显示的应该有问题 可以算你入侵吧
    NerverLibis
        4
    NerverLibis  
       2020-03-05 12:14:42 +08:00 via iPhone   1
    打 110 询问 -2 分钟解决
    找 v 站-水 2 小时
    justzlq
        5
    justzlq  
       2020-03-05 12:18:06 +08:00
    @NerverLibis 110 也不知道的
    opengps
        6
    opengps  
       2020-03-05 12:19:33 +08:00   4
    是否担负责任主要在于是你不能造成影响,例如:
    1,把都对方网站爬挂了(这事常有,新手 tmd 不加间隔猛爬,我遭遇过不下 10 次)
    2,把对方某些付费资源消耗了( https 费用,cdn 费用,数据库日志费用等,我在 https 费用上花过钱)
    3,数据用于某些不恰当的目的(人家源头免费,你爬取后直接用于收费)
    4,爬到了不适合公开的数据(有些数据人家会有删除需求,你继续给人家曝光扩大错误影响的范围显然不合适)
    dongisking
        7
    dongisking  
    OP
       2020-03-05 12:37:36 +08:00 via Android
    @NerverLibis 打 110 我人没了
    dongisking
        8
    dongisking  
    OP
       2020-03-05 12:38:02 +08:00 via Android
    @temporary 俺也觉得
    dongisking
        9
    dongisking  
    OP
       2020-03-05 12:39:27 +08:00 via Android
    @opengps 里面很多数据通过其他 zf 文件也能查到,但是那个接口还挺全的
    Takuron
        10
    Takuron  
       2020-03-05 12:43:18 +08:00 via Android
    和 zf 没关系,我记得对于网站的管理没有说不许爬取,但我记得无特别声明不允许进行除正常浏览以外的访问行为,然而大部分爬虫都不是“正常浏览”,所以有法律风险。
    zf 网站只是因为别的网站被爬了最多 ban 你的 ip,但要是对 zf 网站造成影响了多半警察会上门。
    从互联网道德上讲,正常频率爬取,尊重网站的爬取规则,公开信息你随便爬。
    dongisking
        11
    dongisking  
    OP
       2020-03-05 12:48:38 +08:00 via Android
    @Takuron 那问题大不了
    meisky6666
        12
    meisky6666  
       2020-03-05 12:49:50 +08:00 via Android
    他不卡就没问题
    just1
        13
    just1  
       2020-03-05 12:58:35 +08:00   2
    企查查和天眼查不就活的好好的吗
    herozzm
        14
    herozzm  
       2020-03-05 13:03:18 +08:00
    公开的信息放心爬,别弄崩对方服务器就行,盈利都没问题,上面鼓励民间利用公开信息的
    hst001
        15
    hst001  
       2020-03-05 13:20:29 +08:00
    公开的数据应该没有问题,问题是怎么确定哪些字段是公开的?
    szx300
        16
    szx300  
       2020-03-05 13:23:44 +08:00 via iPhone   6
    都是假数据有啥好爬的?
    hikarikun1991
        17
    hikarikun1991  
       2020-03-05 13:25:56 +08:00
    @szx300 哈哈 有道理
    lizytalk
        18
    lizytalk  
       2020-03-05 13:31:29 +08:00
    不是无疑的公开信息,而是通过疑似接口的漏洞,这还是有风险的。
    losscontrol
        19
    losscontrol  
       2020-03-05 13:42:08 +08:00
    这种数据,我存都不敢存
    imydou
        20
    imydou  
       2020-03-05 13:49:25 +08:00 via iPhone
    这种不明确的,先不说刑事责任,被问询也是很不好受的
    zxy
        21
    zxy  
       2020-03-05 13:52:49 +08:00 via iPhone
    个人认为是有风险的,还是比较严肃的
    dongisking
        22
    dongisking  
    OP
       2020-03-05 14:04:40 +08:00
    @hst001 是的,他显示在 html 就 5 个多,可是接口有 30 多个字段
    dongisking
        23
    dongisking  
    OP
       2020-03-05 14:05:20 +08:00
    看来这个还是挺有争议。。。
    Sunrise837
        24
    Sunrise837  
       2020-03-05 14:06:41 +08:00
    先爬了再说
    zhttty
        25
    zhttty  
       2020-03-05 14:21:51 +08:00
    @opengps 6 楼说的很对。

    4,爬到了不适合公开的数据(有些数据人家会有删除需求,你继续给人家曝光扩大错误影响的范围显然不合适)

    特别是这个,官网删除了,结果你没删除。
    huayumo
        26
    huayumo  
       2020-03-05 14:23:40 +08:00
    轻点爬,没一点问题,公开的数据而已
    reus
        27
    reus  
       2020-03-05 14:24:41 +08:00   2
    你以为中国是法治国家吗?
    expkzb
        28
    expkzb  
       2020-03-05 14:28:31 +08:00
    猜字段可能有点问题
    huyansheng3
        29
    huyansheng3  
       2020-03-05 14:31:38 +08:00
    悠着点吧 可能只是接口写的时候偷懒了
    JerryJet
        30
    JerryJet  
       2020-03-05 14:51:53 +08:00   1
    法律不了解,但是想办你,找个差不多的罪名就行
    coobin
        31
    coobin  
       2020-03-05 15:26:31 +08:00
    没有绝对的情况,唯一就是对方看不看得惯。。。
    goodname
        32
    goodname  
       2020-03-05 15:39:01 +08:00
    猜字段真的有风险,页面上有的问题不大
    zvcs
        33
    zvcs  
       2020-03-05 16:11:44 +08:00 via iPhone
    @szx300 承包我一天的笑点
    cdp2166
        34
    cdp2166  
       2020-03-05 16:28:44 +08:00 via iPhone
    天眼查不就是爬的公开数据
    zhttty
        35
    zhttty  
       2020-03-05 16:32:59 +08:00   1
    @reus 所以你觉得是什么国家?你们公知治理的国家?
    syahd
        36
    syahd  
       2020-03-05 16:37:11 +08:00 via Android   2
    @zhttty 想封锁就封锁,完全不询问民众意见的国家
    hushao
        37
    hushao  
       2020-03-05 19:37:39 +08:00
    页面上显示的数据没问题,页面上(也就是普通民众能直观看到的,非技术性获取)没有的数据你爬就属于非授权获取或入侵了。
    然后爬的公开数据也不能盈利。你要公开数据,合法;牟利,非法。
    hushao
        38
    hushao  
       2020-03-05 19:40:44 +08:00
    看你描述的,还有一个问题,非公开的,你要猜测之后再公开。
    如果没问题,还好,如果有问题,那就是属于造谣的亲戚或者影响 /破坏公信力的事儿了
    InFaNg
        39
    InFaNg  
       2020-03-05 19:41:34 +08:00
    别开几万的并发那种应该没事吧
    jevonszmx
        40
    jevonszmx  
       2020-03-05 19:41:50 +08:00
    贴一下天眼查的:

    免责声明
    “天眼查”是由北京金堤科技有限公司开发的一款企业相关数据等公开信息查询工具。根据用户指令,天眼查的搜索引擎系统会以非人工检索方式生成用户检索的已经依法公开的企业信息。天眼查目前数据来源网站主要包括:

    全国企业信用信息公示系统( https://gsxt.saic.gov.cn
    中国裁判文书网( https://wenshu.court.gov.cn/Index
    中国执行信息公开网( https://zhixing.court.gov.cn/search
    国家知识产权局官方网站( https://www.sipo.gov.cn
    国家工商总局商标局官方网站( https://sbj.saic.gov.cn
    国家版权局官方网站( https://www.ncac.gov.cn
    天眼查平台所登载的信息均来自于网络公开信息,天眼查仅对相关网站依法公示的信息向用户如实展示,并不主动编辑或修改被所公示网站上的信息的内容或其表现形式。受限于现有技术水平、各信息来源网更新不同步等原因,对此类信息的展示,并不视为天眼查对其内容的真实性、准确性、完整性、时效性作出任何形式的确认或担保。请您在依据天眼查服务相关信息作出判断或决策前,自行进一步核实此类信息的完整或准确性,并自行承担使用后果。同时,天眼查承诺将不断提升技术水平,逐步完善服务信息来源质量与更新频次,为您提供更高质量的服务。
    Tyuans
        41
    Tyuans  
       2020-03-05 20:02:49 +08:00
    那些查公司的,不也都是爬来的公开的信息,然后转手让你开 vip 查看所谓的企业全部信息,好像找工作前用用他们的软件就知道这家公司坑不坑了似的。
    tengyoubiao
        42
    tengyoubiao  
       2020-03-05 20:15:21 +08:00 via Android
    @whwq2012
    “法无禁止即自由”。正常爬取行政公开信息做数据分析,但凡不危害国家统治,不会有警察上面抄水表,怎么就噤若寒蝉了?
    建议不编码的空闲时间了解一点法,你不喜欢你可以参与法制去改进啊
    ajaxfunction
        43
    ajaxfunction  
       2020-03-05 21:24:33 +08:00
    没关系,反而爬大公司的才有法务给你挖坑
    zf 关注的是和谐稳定,只要你的行为没有引起舆论,也没有伤害他们的利益,他们才不会把时间浪费在你身上
    ceyes
        44
    ceyes  
       2020-03-06 01:42:41 +08:00 via iPhone
    通过猜测的方式得到一些非公开信息,这不是非授权访问吗?好比他服务器存在若口令,然后你 123456 给试进去了再下载些数据,就算没有下载数据主动提交漏洞都有很大风险的,想想乌云和世纪佳缘的那个案子。
    reus
        45
    reus  
       2020-03-06 08:18:25 +08:00 via Android
    @zhttty 法治水平低的国家。要封锁消息时就训诫,要平息民怨时就给先进称号。
    继续洗,继续舔,看看铁拳打到你头上时,法律帮不帮得到你。
    huangdongdonghdd
        46
    huangdongdonghdd  
       2020-03-06 09:08:49 +08:00 via iPhone
    @reus #45 封锁消息?指的是最近新冠疫情时美国英国等一票皿主国家的做法吗?
    NaiveSimpleYoung
        47
    NaiveSimpleYoung  
       2020-03-06 09:16:39 +08:00
    @huangdongdonghdd 他指的中国啊
    RouJiANG14
        48
    RouJiANG14  
       2020-03-06 10:36:25 +08:00
    公开数据应该没有啥吧,不公开的数据应该也不会上网的。
    PinkPumpkin
        49
    PinkPumpkin  
       2020-03-06 13:16:57 +08:00 via Android
    @huangdongdonghdd 英美封锁了个锤子消息?外国有疫情你们这些国内的知道的比人家本国人民都快。
    reus
        50
    reus  
       2020-03-06 15:19:12 +08:00
    @huangdongdonghdd 哟,装外宾呢?
    julyclyde
        51
    julyclyde  
       2020-03-06 15:54:40 +08:00
    就知识产权来说,公布的内容属于 public domain 可以免费无限制使用
    但你得注意别把人家网站压垮了,否则犯破坏计算机信息系统罪
    ts8zs
        52
    ts8zs  
       2020-03-07 22:53:25 +08:00
    举个例子 专利查询
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5801 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 06:17 PVG 14:17 LAX 23:17 JFK 02:17
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86