
1 erictang66 2013-10-12 16:50:26 +08:00 你现在可以做的就是比如看一下python的标准库,先从基本的爬虫开始写,慢慢来,再有如果是想写web的话,可以先去了解一下tornado,django以及webpy这些常用的web框架等等,理论上来说,你以前学过其他的编程语言的话,学一门新的语言并不是很难,我也是自学的python,都是零零碎碎的时间学的 |
2 flynngao 2013-10-12 16:57:16 +08:00 写网站? |
3 vmebeh 2013-10-12 17:11:45 +08:00 和楼主一样先爬虫后博客 爬虫就和浏览器流程差不多,先下载网页,再提取需要的内容,URL都会有规律的,有分页的都可以提取到下一页/上一页的URL。 博客就复杂点,如1楼所说,最好了解一下已有的web框架,然后根据你博客准备部署的平台选一种框架,再看看那个框架的文档,你有基础很快就能写好。 |
4 moroumo 2013-10-12 20:06:10 +08:00 在写爬虫ing,也是初学。 用http://doc.scrapy.org/en/latest/index.html |
5 RIcter 2013-10-14 10:41:48 +08:00 |
6 xdyl 2013-10-14 12:10:23 +08:00 Scrapy.抓取网页入库SoEasy. 不过解析我用的是Java版的自动解析正文. Python的没试过. |
7 xdyl 2013-10-14 12:11:19 +08:00 Scrapy做爬虫解析代码的话也就是十行左右.入库也就是五行左右.赶紧写几个试试去 |
10 flowerains OP |
11 flowerains OP @RIcter 很期待你的作品 |