数据抓取前、后端项目找外包,兼职专职都可以 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wsglj
V2EX    外包

数据抓取前、后端项目找外包,兼职专职都可以

  •  
  •   wsglj 2020-12-01 09:12:50 +08:00 1363 次点击
    这是一个创建于 1774 天前主题,其中的信息可能已经有所发展或是发生改变。
    数据抓取前、后端项目找外包,兼职专职都可以

    工作内容:
    电商平台数据抓取与分析,包括前、后端开发

    要求:

    有数据抓取项目开发经验,2 年以上 Python 相关项目经验
    熟练掌握前、后端开发技术,熟悉了解 VUE 等框架开发,对实践新技术有热情有耐心
    能够快速完成排期的需求,按时高质量交付
    熟练使用 git,有远程办公经验

    招聘类型:外包零活
    专业领域:开发
    工作方式:线上兼职
    17 条回复    2020-12-03 12:23:09 +08:00
    whevether
        1
    whevether  
       2020-12-01 09:18:53 +08:00
    什么电商数据抓取。就是爬虫嘛, 还爬电商的。真的有人不怕吃牢饭吗? 爬虫爬的好。牢饭少不了
    cian
        2
    cian  
       2020-12-01 09:19:32 +08:00
    来 base64 解码:cHV0aTU2NzIxMjM=
    dddd1919
        3
    dddd1919  
       2020-12-01 09:37:03 +08:00
    不了解《非法获取计算机信息系统数据罪》的优先?
    wushigejiajia01
        4
    wushigejiajia01  
       2020-12-01 10:03:19 +08:00
    这种事, 暗地里搞也就算了

    在 V2 这种不能自己删帖的地方发, 想啥呢
    barrysn
        5
    barrysn  
       2020-12-01 10:05:18 +08:00
    怕是去年的事情还是太小了
    S8I86w6eTxeLcK0a
        6
    S8I86w6eTxeLcK0a  
       2020-12-01 10:15:03 +08:00
    违法行为 建议举报
    wsglj
        7
    wsglj  
    OP
       2020-12-01 10:19:16 +08:00
    @whevether 还是要分的吧,一爬个人数据 ,二不爬全网数据,只抓取部分公开数据,不违法啊
    wsglj
        8
    wsglj  
    OP
       2020-12-01 10:19:59 +08:00
    @dddd1919 不做违法的事情是肯定的。
    wsglj
        9
    wsglj  
    OP
       2020-12-01 10:24:44 +08:00
    @zhengdutech ssfd,正常数据抓取也搞得这么敏感吗?
    wsglj
        10
    wsglj  
    OP
       2020-12-01 10:27:23 +08:00
    @barrysn 涉及抓取个人信息、全站重要数据并复制赢利,导致对方业务运行负载太大,或者直接竞争业务,这些才是违法的吧。
    comsweetcs
        11
    comsweetcs  
       2020-12-01 10:38:44 +08:00
    做爬虫的真的太危险了。。。给我 10w 一个月,我都不干。
    wsglj
        12
    wsglj  
    OP
       2020-12-01 11:16:12 +08:00
    谢谢大家提醒,特意去看了一下,有这个 GIT
    https://github.com/HiddenStrawberry/Crawler_Illegal_Cases_In_China

    守法是必须的,大家请放心
    wsglj
        13
    wsglj  
    OP
       2020-12-01 11:17:45 +08:00
    @comsweetcs 相信官府会更新细化相关规定,正常的技术使用总归是要支持的。之前可能确实乱了一点,新的技术出来没人管,野蛮生长。规范也是好事情,大家都按照规矩来。
    yaoye555
        14
    yaoye555  
       2020-12-01 11:34:20 +08:00
    eWFveWVlNTU1
    wsglj
        15
    wsglj  
    OP
       2020-12-01 11:42:11 +08:00
    这个文章也分析得不错,主要是个人信息、版权信息、还有商业机密这种不要抓取 。https://cloud.tencent.com/developer/article/1462074

    其实最大的困扰是反爬吧,如果用上 IP 池或者自动验码也成了违法 ,这就麻烦了。相信还是要看后果,是不是让对方的服务被影响,和后期有违法使用等吧。
    hackerang
        16
    hackerang  
       2020-12-01 16:25:45 +08:00
    aGFja2VyYW5n
    barrysn
        17
    barrysn  
       2020-12-03 12:23:09 +08:00
    现在法律规定 太模糊了,一不小心就把自己搞进去了,爬虫类的最好还是不碰,
    在不影响对方服务器的前提下,自己偷摸用,应该没事(不确定),涉及商业行为的最好一点也没沾
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2844 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 14:25 PVG 22:25 LAX 07:25 JFK 10:25
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86