
我以前队列是直接在内存里,程序停了又要重头开始。。。。
所以队列应该保存在数据库当中会好一点
1 demoslam 2015-07-24 06:06:56 +08:00 看需求,正常爬虫存的数据库可以随便选。inverted index的存储可能要额外考虑其他的数据库 |
2 itfanr 2015-07-24 07:06:39 +08:00 via Android leveldb rocksdb |
3 shoumu 2015-07-24 09:17:38 +08:00 想用什么数据库就用什么数据库,等数据库性能遇到瓶颈了还能学学数据库的东西 |
4 Comdex 2015-07-24 09:53:31 +08:00 redis/mongodb |
6 mcwanderer 2015-07-24 12:01:28 +08:00 mongodb |
7 qw7692336 OP @mcwanderer 不说原因的都是耍流氓 |
10 zjq426 2015-07-24 17:43:07 +08:00 爬和解析分开,爬下来的rawdata直接存文件不好吗。。。 |
11 bengtuo 2015-07-24 18:39:34 +08:00 直接存文件 |