![]() | 1 hizoubin 2017-07-25 22:45:18 +08:00 感觉搜索效果不如 biliworld |
2 yuedingwangji 2017-07-26 00:38:32 +08:00 好像还蛮不错的 |
![]() | 3 LINAICAI 2017-07-26 01:07:32 +08:00 牛逼 |
4 asheshorse 2017-07-26 06:18:34 +08:00 via Android 不算全,不过还不错 |
![]() | 5 WildCat 2017-07-26 06:36:24 +08:00 via iPhone 666 不过很想知道爬虫原理 |
6 shenyangno1 2017-07-26 07:29:18 +08:00 via iPhone 搜索条件中包含:和 /会报 500 错。 |
![]() | 7 ericbize 2017-07-26 08:33:15 +08:00 专业的爬虫公司被你爬了 |
![]() | 8 feifan00x 2017-07-26 08:44:46 +08:00 好像真的很好玩 |
9 a494836960 2017-07-26 09:25:44 +08:00 爬种子很好用 |
10 default7 2017-07-26 09:37:41 +08:00 怎么弄的? |
![]() | 11 Qiss 2017-07-26 09:40:32 +08:00 速度好快啊,大神用的哪家服务器? |
![]() | 12 believeitcould 2017-07-26 09:55:04 +08:00 匹配模式可以选吗 搜出来的信息太多了 想完全匹配 |
![]() | 13 Dvel 2017-07-26 09:59:50 +08:00 速度贼快 |
![]() | 14 1O 2017-07-26 10:01:32 +08:00 |
15 frankkai 2017-07-26 10:03:12 +08:00 可以可以,很强 |
16 jimyan 2017-07-26 10:04:23 +08:00 牛逼 |
![]() | 17 Hellofxq 2017-07-26 10:05:20 +08:00 看起来很好玩的样子,我也想学 |
![]() | 18 huangzitao OP |
![]() | 19 nazor 2017-07-26 10:19:34 +08:00 via iPhone 能不能采集有没有那种带密码的资源。 |
![]() | 20 ericbize 2017-07-26 10:21:49 +08:00 @huangzitao 凭自己本事浏览的网页,没什么不阳光的,有本事你 block 了 python requests 的 UA 啊。 |
![]() | 21 beyoung 2017-07-26 10:30:40 +08:00 各种链接不存在 |
![]() | 22 mahone3297 2017-07-26 10:32:41 +08:00 原理是? |
![]() | 23 guodong110 2017-07-26 11:53:29 +08:00 via Android http://www.fastsoso.cn 有失效检测 |
![]() | 24 NAO 2017-07-26 12:00:41 +08:00 同想完全匹配 |
![]() | 25 upczww 2017-07-26 12:05:49 +08:00 via iPhone 原理 site:pan.baidu.com |
![]() | 26 ikeeper 2017-07-26 13:07:49 +08:00 厉害了,求指导 |
27 cenyu 2017-07-26 13:26:02 +08:00 很厉害,赞一个 |
28 gao117348222 2017-07-26 14:09:22 +08:00 收藏了 |
![]() | 29 suliuyes 2017-07-26 15:08:43 +08:00 楼上都是才上互联网吗,为什么都觉得厉害?网盘搜索有很多了啊。百度“网盘搜索”看看有多少。 #25 @upczww 也说了原理了。 |
![]() | 30 v166ex 2017-07-26 15:22:14 +08:00 @suliuyes site:pan.baidu.com 应该不是这个吧,我试了下 bd 没有啥显示 |
![]() | 31 xmh51 2017-07-26 15:40:00 +08:00 @huangzitao 现在还能爬吗?百度不在主页显示分享文件后? |
33 Adamla 2017-07-26 17:01:19 +08:00 为啥我搜索“拳皇”就会出现错误页面呢。 |
![]() | 34 sola97 2017-07-26 17:06:00 +08:00 我平时用的胖次搜索,带失效检测,也能搜到不可告人的东西 |
35 Zioyi 2017-07-26 17:06:42 +08:00 楼主后台用什么写的 |
![]() | 37 iphantom 2017-07-26 17:31:34 +08:00 这个速度很赞 结果也很棒 |
![]() | 38 iShawnWang 2017-07-26 17:46:42 +08:00 via iPhone ![]() 可以讲解下远离或者开源么... 希望能学习下代码... |
![]() | 39 Antidictator 2017-07-26 17:47:55 +08:00 via Android 借楼问谷歌用 site 语法没什么效果。是不是被屏蔽啦。 再借楼问原理 |
![]() | 40 Antidictator 2017-07-26 17:49:17 +08:00 via Android @upczww 经常在 Google 用这个语法,但是效果还不如一些类似楼主做的站呢 |
![]() | 41 upczww 2017-07-26 17:52:13 +08:00 @Antidictator 那是别人做了二次整理的,分好类的 |
![]() | 42 huangzitao OP @xmh51 百度网盘前几天被人差评,现在封了很多,所以你懂得 @Adamla 用的第三方中文分词器,后台看了下,有 bug @Zioyi springboot 跟 lucene @iShawnWang 这个也没什么难度啊,无非是爬文件分享链接。 |
![]() | 43 66kanfengjing 2017-07-26 18:36:07 +08:00 搜索*会报 500O(∩_∩)O 哈!以前做 lucene 的时候就忘了考虑通配符的问题 |
![]() | 44 huangzitao OP @66kanfengjing 什么都不写也 500 O(∩_∩)O 这程序不够健壮啊 |
![]() | 45 66kanfengjing 2017-07-26 19:12:32 +08:00 @huangzitao 我用 Lucene ( Version:3.5 )的时候用的 IK(Version:2012FF)分词器,目前还没有遇到分词器的 bug. |
46 Zioyi 2017-07-26 19:32:55 08:00 大佬 你是怎么爬下来的?百度云盘有 api ? |
![]() | 47 huangzitao OP |
![]() | 48 zyowe 2017-07-27 10:26:57 +08:00 ![]() |
![]() | 49 NullException 2017-07-27 10:55:10 +08:00 666 |
50 hienchu 2017-07-27 13:41:45 +08:00 via iPhone 不错 |
![]() | 52 WEAlex 2017-07-27 15:27:10 +08:00 有源码可以分享一下吗?最近刚把 springboot 和 docker 学习了. |
53 gao117348222 2017-07-27 16:12:06 +08:00 @zyowe 稳 |
![]() | 54 smartdie 2017-07-28 09:24:34 +08:00 可以啊,这个引擎的速度非常可观。希望能分享下实现方式或者源码。 |
![]() | 55 huangzitao OP |
56 Hugh123 2017-07-28 17:28:59 +08:00 需要 66666666 |
![]() | 57 Dwyanetalk 2017-07-28 18:51:43 +08:00 贤者,我对这个名字来源感兴趣 |
![]() | 58 huangzitao OP @Dwyanetalk 哈哈我朋友想的,感觉爆了 |
59 propc 2017-07-29 07:16:22 +08:00 via Android 不错不错 |
60 mooncakejs 2017-07-29 20:04:42 +08:00 @ericbize 偷偷爬不查你也就算了,show 出来就不行了,殊不知有 robots 协议。 |
![]() | 61 syl371 2017-07-29 21:22:20 +08:00 我还是觉得 www.biliworld.com> 好用一点 |
![]() | 62 1002149271 2017-07-30 15:06:38 +08:00 写这个会不会被抓? |
63 wanglaihuai 2017-07-31 01:16:07 +08:00 via Android 如果加上个按照时间排序就更好了大神。 |
![]() | 64 wilonti 2017-07-31 10:47:09 +08:00 但是我不知道用啥关键词搜...尴尬了 |
![]() | 65 yuanfnadi 2017-08-03 23:54:39 +08:00 |
![]() | 66 huangzitao OP @yuanfnadi 好 |
![]() | 67 jedihy 2017-08-08 00:41:40 +08:00 via iPhone 爬 115 吧 |
68 omg21 2017-08-08 14:15:23 +08:00 你是不是也建了一个数据库,把爬到的内容存进去,然后别人在你主页上搜的时候,再数据库里读取? |
![]() | 69 aifang 2017-08-08 17:15:54 +08:00 感觉好牛逼的样子,肯定比我牛逼, |
![]() | 70 huangzitao OP |
![]() | 71 weilongs 2017-08-11 10:25:20 +08:00 上面那个搜私房不过瘾,http://wiseso.cc/search?keyword=DCIM |
72 aosp 2017-08-11 13:43:28 +08:00 我也很好奇,现在只能抓分享动态了吗?那不是得关注很多人 |
73 mon3 2017-08-15 13:58:20 +08:00 @huangzitao 分享列表已经关闭了,你现在是咋爬的百度云? |
![]() | 75 weilongs 2017-08-16 21:19:00 +08:00 @YoungBai http://www.fastsoso.cn/search 这个搜 私房,DCIM,我的照片,照片 过瘾 !! |
76 sunnyzhi 2017-08-25 15:48:59 +08:00 还不错,谢谢 |
![]() | 77 huangzitao OP @sunnyzhi 老哥,不用客气 |