金头条 - 股票即时新闻爬虫 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
vitovan
V2EX    分享创造

金头条 - 股票即时新闻爬虫

  •  1
     
  •   vitovan 2016-08-08 09:33:39 +08:00 5740 次点击
    这是一个创建于 3371 天前的主题,其中的信息可能已经有所发展或是发生改变。

    跳过正文:

    http://new.jtoutiao.com

    公众号:

    预览:

    能干啥:

    • 添加自选股,获得即时新闻。

    • 其他附加功能(全网热点、限售解禁预警、机构内参、异动个股等等)

    技术栈:

    • 爬虫: Python 3 - Celery - re2 - BS4 - Supervisord - Elixir

    • 后端: Python 3 - Tornado - PostgreSQL

    • 前端: Angular 2 - SystemJS

    项目状态:

    beta ,服务器随时挂掉 :-D

    缺钱、缺人,聊一聊?邮件(base64): YXdlc29tZXZpdG9AbGl2ZS5jb20=

    技术坑:

    • Angular 2 毛病多多呀,用作 Production 很是费劲:

    • PostgreSQL

      • 想不起来有什么可吐槽的,就是 XX 云的 RDS 太贵了,性能也不敢恭维。
    • Celery

      • Pros: 爽!分布式任务调度,加上 Flower 这个控制台,很方便呀~
      • Cons: 我是不知道为什么, worker 莫名的就那么消失了,要不然也不会非要再用什么 Supervisord 。
    • Tornado

      • Pros: @gen.coroutine 好用!
      • Cons: 没什么不好的,刚接触 ioloop 概念的时候很不适应,这个是 Tornado 自创的么(挖鼻孔)?
    • Elixir

      • Pros: erlang 美化版,好用呀~ 文档什么的也赞爆了:Kernel Elixir v1.3.2
      • Cons: 不知道为什么写着写着就恶心了,感觉语言中人为干预的太多了,预设模式太多了。可能设计出来的语言就有这毛病吧。尤其是用Postgrex这个库的时候越用越难受,也说不上为啥。
      • 总结:瞎折腾这些新鲜玩意儿,有这功夫咋不用 Java 呢?咋不去上天呢?

    讨论:

    大家有啥想聊的一起聊一聊,瞎吵吵架呗~

    41 条回复    2016-08-24 10:51:07 +08:00
    vimffs
        1
    vimffs  
       2016-08-08 09:56:40 +08:00 via Android   1
    感谢分享! 1024
    GreatMartial
        2
    GreatMartial  
       2016-08-08 09:58:49 +08:00 via Android
    一个人做的吗?
    GhostEX
        3
    GhostEX  
       2016-08-08 09:59:15 +08:00
    新闻抓取的范围是哪些网站?
    shaohuifan
        4
    shaohuifan  
       2016-08-08 10:00:56 +08:00 via iPhone
    楼主,想找人一起玩?
    vitovan
        5
    vitovan  
    OP
       2016-08-08 10:02:18 +08:00
    r#2 @GreatMartial 一个技术(Me)+ 一个产品兼前端(Partener)
    vitovan
        6
    vitovan  
    OP
       2016-08-08 10:03:15 +08:00
    r#3 @GhostEX 这......几乎全网的中文金融网站吧,大大小小一百多个。
    vitovan
        7
    vitovan  
    OP
       2016-08-08 10:05:57 +08:00
    r#4 @shaohuifan 不知道呀,缺钱缺人的迷茫期么,发上来随便聊聊。
    tkpc
        8
    tkpc  
       2016-08-08 10:09:01 +08:00
    @vitovan 和选股宝 华尔街见闻的 差异点在哪呢
    从网站没看出来
    vitovan
        9
    vitovan  
    OP
       2016-08-08 10:16:20 +08:00
    r#8 @tkpc 哈哈哈哈!哈哈哈哈!

    我竟无言以对(转身捂脸状)。
    shaohuifan
        10
    shaohuifan  
       2016-08-08 10:31:58 +08:00 via iPhone
    @vitovan 现在股市不好,把期货带上吧
    vitovan
        11
    vitovan  
    OP
       2016-08-08 10:37:10 +08:00
    r#10 @shaohuifan 期货是不是新闻不多?
    duolai798
        12
    duolai798  
       2016-08-08 10:45:31 +08:00
    这东西是创业路子吗?感觉离实用还很远,怎么熬到赚钱的时间点是个问题。如果只是玩玩基本上只能自己玩玩了。
    GhostEX
        13
    GhostEX  
       2016-08-08 10:47:52 +08:00 via iPhone
    @duolai798 大多数类似创业项目都是不盈利的....
    GreatMartial
        14
    GreatMartial  
       2016-08-08 10:54:31 +08:00
    @vitovan 不容易,支持楼主。 不知道你们的产品和其他家比优势在哪呢?
    vitovan
        15
    vitovan  
    OP
       2016-08-08 11:15:53 +08:00
    r#14 @GreatMartial 哈哈哈哈~我也说不上来呀,或许是不上心吧,也不是在用生命去做这件事,成不成随便了~
    xujif
        16
    xujif  
       2016-08-08 11:25:05 +08:00
    我们也在做这个
    vitovan
        17
    vitovan  
    OP
       2016-08-08 11:26:37 +08:00
    r#16 @xujif 自己烧钱呢?
    duolai798
        18
    duolai798  
       2016-08-08 11:38:22 +08:00
    @vitovan 创业项目不盈利不代表没有规划如何盈利以及在哪个时间点盈利 你这个只能算是玩票性质 如果没有经验 这东西基本做不下去 这类 2C 的产品前期就是要做用户量 估计你等不到那一天就没兴趣和信心了
    GreatMartial
        19
    GreatMartial  
       2016-08-08 11:41:05 +08:00
    @vitovan 额,股市数据的集合类应用应该很多了。
    如果你们能加上数据分析,通过数据给小白荐股,还是有市场的。
    不过估计技术方面相当难了, 2333

    可以换个思路,有没有兴趣做个足彩的数据聚合,通过历史数据分析,然后给用户推荐购买,这个比起你们现在的项目,可行性更高,而且有市场空白,个人觉得。
    vitovan
        20
    vitovan  
    OP
       2016-08-08 11:42:27 +08:00
    r#18 @duolai798 我觉得,你讲得很对。
    vitovan
        21
    vitovan  
    OP
       2016-08-08 11:44:04 +08:00
    r#19 @GreatMartial 足彩不跟国内股票一样是瞎胡闹么?不知道有没有实用价值呀(对彩民)?
    tkpc
        22
    tkpc  
       2016-08-08 11:47:32 +08:00
    @vitovan 足彩就是骗局 在冠军杯期间就看出来了 赔率高的大热门的队都输掉了 伤心的不要不要的 而且还是国内足彩 你懂的...
    tkpc
        23
    tkpc  
       2016-08-08 11:48:12 +08:00
    @GreatMartial 足彩类的才多 你以为 500.com 怎么来的
    GreatMartial
        24
    GreatMartial  
       2016-08-08 13:06:10 +08:00
    @vitovan 我有朋友玩足彩,而且足彩有很多人是玩外盘,赔率比国内良心很多。
    有人分析,足彩的庄家设计赔率,通过动态调整,引导用户,保证有一个大概率的收益平衡,而且收益率远没有摇号的彩票那么高。
    一个单场一定有赢的玩家,规模化的输多赢少,庄家就有了稳定的收益了。
    如果能做到跟着庄家走,赚钱的概率应该就很稳定了。
    以上是我的个人理解,求各位轻拍。
    GreatMartial
        25
    GreatMartial  
       2016-08-08 13:08:03 +08:00
    @tkpc 我知道 500 ,没有用过,不知道有没有推荐的业务...
    mahone3297
        26
    mahone3297  
       2016-08-08 13:40:56 +08:00
    @vitovan >这......几乎全网的中文金融网站吧,大大小小一百多个。
    请教,这么多网站,一个个抓?累不累?
    tony1016
        27
    tony1016  
       2016-08-08 16:00:56 +08:00
    不好意思,我一点,不小心点挂了
    yakiang
        28
    yakiang  
       2016-08-08 17:01:09 +08:00
    话说为什么国内不同股票网站会有不同的交易数据呢,比如新浪、同花顺、东方财富等网站对于同一支股票的大单交易的明细和数量是不同的,都不知道哪个靠谱了
    noder
        29
    noder  
       2016-08-08 17:31:14 +08:00
    为什么不试试 riotjs
    vitovan
        30
    vitovan  
    OP
       2016-08-08 17:36:42 +08:00
    r#27 @tony1016 哈哈,不碍事~
    vitovan
        31
    vitovan  
    OP
       2016-08-08 17:37:33 +08:00
    r#28 @yakiang 时间差问题吧~很难说谁的更及时。
    vitovan
        32
    vitovan  
    OP
       2016-08-08 17:37:57 +08:00
    r#29 @noder 没用过,去看看。
    vitovan
        33
    vitovan  
    OP
       2016-08-08 17:40:15 +08:00
    r#26 @mahone3297 还好吧,写好每个网站的适配模型,平时维护一下就好了,网站不改版或者改变防抓策略的话,维护工作不算大。
    ob
        34
    ob  
       2016-08-08 23:46:02 +08:00 via Android
    不错啊,只支持 a 股?
    vitovan
        35
    vitovan  
    OP
       2016-08-09 05:05:56 +08:00
    r#34 @ob 嗯~
    xujif
        36
    xujif  
       2016-08-09 07:38:59 +08:00 via iPhone
    @vitovan 老板掏钱,不要荐股,有法律风险
    vitovan
        37
    vitovan  
    OP
       2016-08-09 07:44:50 +08:00
    r#36 @xujif 多谢。
    yfmir
        38
    yfmir  
       2016-08-09 09:24:43 +08:00
    @GreatMartial 其实有这东西了,硬广一下,球球是道
    GreatMartial
        39
    GreatMartial  
       2016-08-09 23:26:05 +08:00 via Android
    @yfmir 额,我去关注一下,谢谢
    aaronrzh
        40
    aaronrzh  
       2016-08-10 23:45:44 +08:00
    关注一下
    kunee
        41
    kunee  
       2016-08-24 10:51:07 +08:00
    没看懂价值在哪里?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     855 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 21:32 PVG 05:32 LAX 14:32 JFK 17:32
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86