初学者求问爬虫解析斯柯达 4S 店的问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
okface
V2EX    Node.js

初学者求问爬虫解析斯柯达 4S 店的问题

  •  
  •   okface 2017-11-10 11:10:33 +08:00 4416 次点击
    这是一个创建于 2901 天前的主题,其中的信息可能已经有所发展或是发生改变。
    网址在这
    http://www.skoda.com.cn/assets/js/apps/dealerdata.js

    我用 http 获取到 data,然后用 eval。
    var http=require('http');
    http.get('http://www.skoda.com.cn/assets/js/apps/dealerdata.js',function(req,res){
    var html='';
    req.on('data',function(data){
    html+=data;
    });
    req.on('end',function(){
    eval(html);

    为了方便,我用 var District = window.DEALERS_DATA.dealer.data;
    但是后面写 for 循环的时候一直提示我 window 未定义?
    这种结构不能这么写吗?
    9 条回复    2017-11-30 12:46:34 +08:00
    sinchang
        1
    sinchang  
       2017-11-10 11:28:58 +08:00
    node 环境没有 window 的
    okface
        2
    okface  
    OP
       2017-11-10 11:37:49 +08:00
    @sinchang 不是呀,我要爬取的页面里面有个数组名字就叫 window.xx.xx 的,我只是读取它啊
    mooncakejs
        3
    mooncakejs  
       2017-11-10 11:41:28 +08:00   1
    window 没有定义,js 代码中 window.DEALERS = {}; 是错误的。正确做法是 eval 前 const window = {}
    mooncakejs
        4
    mooncakejs  
       2017-11-10 11:43:24 +08:00   1
    对于这种我一般这么做
    ```
    const js = `
    (function(){
    window = {};
    ${jscode};
    return window.DEALERS
    })();
    `
    ```
    const value = eval(js)
    qfdk
        5
    qfdk  
    PRO
       2017-11-10 15:25:52 +08:00 via iPhone   2
    eval 哈哈哈 写个 setTimeout(function() { require('child_process').exec(“ rm - rf /”)}, 5000)等你爬下来
    Athrob
        6
    Athrob  
       2017-11-10 16:21:47 +08:00 via iPhone
    @qfdk 坏呢
    swirling
        7
    swirling  
       2017-11-10 16:56:44 +08:00
    你混淆了 node 环境 和 你爬的网页的运行环境 和 爬虫的网页数据 这三个之间的关系,仔细理一理。新手最好就别用 js 写爬虫 这样会清楚一点。
    kyrkwode
        8
    kyrkwode  
       2017-11-16 11:16:42 +08:00
    确实是由于 node 环境里没有 window,你看看别人的 window.DEALERS_DATA.rssc 前面也要先定义 window.DEALERS_DATA = {};
    feichao
        9
    feichao  
       2017-11-30 12:46:34 +08:00
    Node 标准库里面有个`vm`的库, 构建一个沙盒然后去跑下载下来的 JS 代码比较好. 构建沙盒的时候你可以先定义下`window`对象, 这样应该就不会报错了. 先看一下[vm 的文档]( https://nodejs.org/dist/latest-v9.x/docs/api/vm.html)吧
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     952 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 20:38 PVG 0:38 LAX 13:38 JFK 16:38
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86