看见一个不错的博客,打算把内容爬下来放手机上离线浏览,有什么好的方案推荐 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
fkccp
V2EX    问与答

看见一个不错的博客,打算把内容爬下来放手机上离线浏览,有什么好的方案推荐

  •  
  •   fkccp 2014-12-01 16:01:46 +08:00 5092 次点击
    这是一个创建于 3977 天前的主题,其中的信息可能已经有所发展或是发生改变。
    RT

    /info/post/71.html 这样的链接,大概有好几百文章,内容带图片。
    设备是oppo find7,比较喜欢用多看。

    砖1:做epub。
    砖2:打算看看那些笔记客户端有没有批量导入html这样的功能,然后手机上装个app去同步。
    砖3:抓取后做成一个大的html,存成word。

    求玉。
    29 条回复    2014-12-04 15:05:57 +08:00
    arens
        1
    arens  
       2014-12-01 16:02:44 +08:00
    既然不错,就发出来
    fkccp
        2
    fkccp  
    OP
       2014-12-01 16:05:31 +08:00
    greatghoul
        3
    greatghoul  
       2014-12-01 16:10:01 +08:00 via Android
    博客一般不是会有 RSS 么?
    arens
        4
    arens  
       2014-12-01 16:13:11 +08:00   1
    @fkccp 卢松松的啊,你可以下载一个RSS订阅器,然后通过订阅他的RSS来查看文章,没必要扒~
    fkccp
        5
    fkccp  
    OP
       2014-12-01 16:13:27 +08:00
    @greatghoul 所以有好的rss app推荐么?
    nieccyyy
        6
    nieccyyy  
       2014-12-01 16:16:09 +08:00
    @fkccp 现在变软文基地了吧?
    negation
        7
    negation  
       2014-12-01 16:16:14 +08:00   1
    rss啊
    不自带的话试一试搭个tinytiny
    watsy0007
        8
    watsy0007  
       2014-12-01 16:23:15 +08:00   1
    可以用safari自带的订阅订阅rss
    也可以买个reeder2,我个人喜欢reeder2
    fkccp
        9
    fkccp  
    OP
       2014-12-01 16:31:31 +08:00
    @watsy0007 安卓机上有?
    fkccp
        10
    fkccp  
    OP
       2014-12-01 16:33:22 +08:00   1
    @watsy0007 这个reeder2支持批量下载离线浏览么
    fkccp
        11
    fkccp  
    OP
       2014-12-01 16:33:51 +08:00
    @nieccyyy 我就随便点了几篇,觉得还可以,没细看
    Hodor
        12
    Hodor  
       2014-12-01 16:48:31 +08:00
    reeder
    fsquared
        13
    fsquared  
       2014-12-01 16:52:32 +08:00
    @fkccp 不支持 而且Reeder2是不能抓取历史文章的
    jimwoo
        14
    jimwoo  
       2014-12-01 17:00:34 +08:00/span>   1
    必须 ~~~~~ Pocket
    youyongsong
        15
    youyongsong  
       2014-12-01 17:06:55 +08:00   1
    SiteSucker
    1989922yan
        16
    1989922yan  
       2014-12-01 17:11:17 +08:00   1
    = = pocket
    weekr
        17
    weekr  
       2014-12-01 17:14:53 +08:00 via iPhone
    看站长新闻还可以,现在软文居多。
    zenhand
        18
    zenhand  
       2014-12-01 17:32:04 +08:00   1
    python抓,zipfile写成epub,我就是这么干的,抓知乎,大约1000行代码,抓小网站应该用不了1000行。
    oIIo
        19
    oIIo  
       2014-12-01 17:38:03 +08:00   1
    android用feedly,挺好用了。
    WhyLiam
        20
    WhyLiam  
       2014-12-01 17:39:23 +08:00
    火车头爬
    fkccp
        21
    fkccp  
    OP
       2014-12-01 17:56:18 +08:00
    @jimwoo 这个可以把几百篇文章一下子拉下来吗?
    fkccp
        22
    fkccp  
    OP
       2014-12-01 17:58:06 +08:00
    @WhyLiam 怕其实很好爬了,主要是怎么批量弄到手机上,还方便。
    herozzm
        23
    herozzm  
       2014-12-01 18:00:10 +08:00   1
    就写个爬虫爬到数据后直接生成pdf格式,然后拷贝到手机上
    greatghoul
        24
    greatghoul  
       2014-12-01 18:22:11 +08:00
    @1989922yan pocket + 1
    PhilCai
        25
    PhilCai  
       2014-12-01 19:52:22 +08:00 via iPhone
    自己写个阅读器啦
    lhfcws
        26
    lhfcws  
       2014-12-01 20:08:31 +08:00
    evernote clip
    fkccp
        27
    fkccp  
    OP
       2014-12-04 14:37:42 +08:00
    @zenhand 方便给下代码,或者epub的格式文档吗~~
    zenhand
        28
    zenhand  
       2014-12-04 14:53:43 +08:00   1
    fkccp
        29
    fkccp  
    OP
       2014-12-04 15:05:57 +08:00
    @zenhand 感谢~~~
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5338 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 46ms UTC 07:53 PVG 15:53 LAX 00:53 JFK 03:53
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86