根据v2ex上1200个招聘帖统计的招聘地区和程序语言相关信息 - V2EX
爱意满满的作品展示区。
faceair

根据v2ex上1200个招聘帖统计的招聘地区和程序语言相关信息

  •  
  •   faceair
    faceair Nov 7, 2013 5412 views
    This topic created in 4575 days ago, the information mentioned may be changed or developed.
    最近在学python,没事写了个小爬虫来统计了下招聘贴的消息。
    共统计了招聘贴前60页,约最近200天,共1200个主题。
    代码:

    只取了标题,所以有些招聘信息不在标题的没有统计进来。
    标题经过哑巴分词再计入数据库,后面的数字为在标题中出现的次数。

    地名根据搜狗全国地名词库统计。

    工作地区不完全排行榜:
    1.北京 304 + 帝都 21 = 325
    2.上海 220
    3.杭州 85
    4.深圳 79
    5.广州 51
    6.成都 29
    7.武汉 19
    8.南京 16
    9.苏州 8
    10.长沙 7
    11.珠海 5
    12.西安 4

    技术名词都是我手动查找的,可能不全,但大致就这样了。

    技术名词不完全排行榜:
    1.前端 165 + 前端开发 52 = 217
    2.php 151 + PHPer 11 = 162
    3.android 145
    4.ios 144
    5.web 104
    6.python 94
    7.java 72
    8.UI 69
    9.c++ 23
    10.测试 20
    11.Linux 19
    12.Ruby 18
    13.后端 15
    14.Node.js 14
    15.DBA 10
    16.Javascript 9
    17.html5 9


    可以看到一般公司集中在北京上海,再就是明显前端需求旺盛啊。。
    26 replies    2014-07-13 13:02:41 +08:00
    Livid
        1
    Livid  
    MOD
    PRO
       Nov 7, 2013
    V2EX 的分享创造节点最欢迎这样的主题 :-)
    family
        2
    family  
       Nov 7, 2013
    必火?
    shiny
        3
    shiny  
    PRO
       Nov 7, 2013
    bot 抓主题太频繁不会被 v2ex 封 ip 吗?
    faceair
        4
    faceair  
    OP
       Nov 7, 2013   1
    @shiny 刚开始抓的时候确实被封了几分钟,后来time.sleep(3)就好了。分词插入数据库还占一段时间,所以抓取实际间隔7。8秒左右吧
    romoo
        5
    romoo  
       Nov 7, 2013
    好多前端。
    ChiangDi
        6
    ChiangDi  
       Nov 7, 2013 via Android
    哈哈,壮哉我大杭州
    img src="https://cdn.v2ex.com/avatar/b633/9541/39433_normal.png?m=1402191682" class="avatar" border="0" align="default" alt="shadowind" data-uid="39433" />
        7
    shadowind  
       Nov 7, 2013
    看了这个帖子,觉得更应该学习下前端和PHP了。
    SErHo
        8
    SErHo  
       Nov 7, 2013   2
    结巴分词,不是哑巴。。。
    zorceta
        9
    zorceta  
       Nov 7, 2013 via Android
    直接mc不行么 看着MySQL好不习惯
    cctvsmg
        10
    cctvsmg  
       Nov 7, 2013
    @SErHo 莫名其妙戳中笑点
    faceair
        11
    faceair  
    OP
       Nov 7, 2013
    @SErHo
    @cctvsmg 哈哈哈,不要在意这些细节啦~~
    wxstorm
        12
    wxstorm  
       Nov 7, 2013
    @SErHo 哈哈哈~
    subpo
        13
    subpo  
       Nov 7, 2013
    这数据可以证明好多东西
    justff
        14
    justff  
       Nov 8, 2013 via iPhone
    运维 呢
    faceair
        15
    faceair  
    OP
       Nov 8, 2013
    @justff 运维 12,人工查找难免遗漏
    hewwcn
        16
    hewwcn  
       Nov 8, 2013
    前端比较多有部分原因还是跟社区有关系吧。V2比较偏前端。
    Sherlockhlt
        17
    Sherlockhlt  
       Nov 8, 2013
    突然才发现v2ex可以发代码
    faceair
        18
    faceair  
    OP
       Nov 8, 2013
    @Sherlockhlt 贴的gist.github.com的链接自动转换的
    mengyang
        19
    mengyang  
       Nov 9, 2013
    哭了,招运维的真是少啊。。
    weakish
        20
    weakish  
       Nov 9, 2013
    @mengyang Ruby也18……
    weakish
        21
    weakish  
       Nov 9, 2013
    @faceair 可以把抓取的公出? 大家可以自行自己感趣的容。
    faceair
        22
    faceair  
    OP
       Nov 9, 2013
    @weakish 数据统计完就删了。。代码都在,自己跑一遍就出来了
    seeker
        23
    seeker  
       Nov 9, 2013 via Android
    求饼图
    DeeCheung
        24
    DeeCheung  
       Nov 10, 2013
    -.- 正考虑过了年之后要不要去帝都搞前端。最近 V2EX 招聘都很给力。是时候挪窝了。
    llhh
        25
    llhh  
       Nov 12, 2013 via Android
    不错的东东,直观
    isaced
        26
    isaced  
       Jul 13, 2014
    厉害!
    About     Help     Advertise     Blog     API     FAQ     Solana     2980 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 82ms UTC 13:01 PVG 21:01 LAX 06:01 JFK 09:01
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86