做了个阿里云盘搜索工具 YaPan - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
thinkdiff
V2EX    分享创造

做了个阿里云盘搜索工具 YaPan

  •  1
     
  •   thinkdiff 2022-11-22 13:20:34 +08:00 11574 次点击
    这是一个创建于 1053 天前的主题,其中的信息可能已经有所发展或是发生改变。

    地址 https://pan.ccof.cc

    支持PWA ,可以添加到桌面

    以后不用看到好东西就存自己网盘占空间了。

    考虑做一个订阅功能,不知道有没有人感兴趣。

    67 条回复    2024-08-30 15:32:51 +08:00
    Xhack
        1
    Xhack  
       2022-11-22 13:33:16 +08:00
    再做个失效检测
    buyan3303
        2
    buyan3303  
       2022-11-22 13:39:59 +08:00
    以前有一个百度盘搜索比较好的网站,花点钱买网站的币,就能买资源下载,后来那个网站可能被发律师函了。
    lvsshuttao
        3
    lvsshuttao  
       2022-11-22 13:45:44 +08:00
    试了下不错,就怕很快下线了,要不搞个备份网址?
    buyan3303
        4
    buyan3303  
       2022-11-22 13:55:07 +08:00
    @lvsshuttao #3 更建议分享思路,不做成品,这样一般来说也不用考虑下线。
    SenLief
        5
    SenLief  
       2022-11-22 14:00:15 +08:00   1
    来个 TG Bot 这样就算是网页挂了,也还能接着用。
    wbwm
        6
    wbwm  
       2022-11-22 14:14:19 +08:00
    还以为是 yapian
    thinkdiff
      &nbp; 7
    thinkdiff  
    OP
       2022-11-22 15:25:54 +08:00
    @Xhack 是的,还得过滤需要密码的
    thinkdiff
        8
    thinkdiff  
    OP
       2022-11-22 15:27:09 +08:00
    @buyan3303 百度不行 下载速度太慢了 咱这个不收费,以后也不收费(如果能活到以后的话。。。)
    thinkdiff
        9
    thinkdiff  
    OP
       2022-11-22 15:29:55 +08:00
    @lvsshuttao 谢谢 资源还在不断丰富中 关注这个帖子 如果挂了 我再更新
    thinkdiff
        10
    thinkdiff  
    OP
       2022-11-22 15:30:59 +08:00
    @SenLief 用户量不多 再搞个 tg bot 貌似也没几个人用
    thinkdiff
        11
    thinkdiff  
    OP
       2022-11-22 15:32:36 +08:00
    @wbwm yapian = ya + pian 这个名字还蛮有意思的
    fhzyi
        12
    fhzyi  
       2022-11-22 15:38:44 +08:00
    试了下挺好的,如果能加一个筛选条件就更好了
    NeedforV2
        13
    NeedforV2  
       2022-11-22 15:44:27 +08:00
    试了下挺不错的,希望能长久
    tediorelee
        14
    tediorelee  
       2022-11-22 16:02:22 +08:00
    有无 pikpak 盘的..
    Ritter
        15
    Ritter  
       2022-11-22 16:26:16 +08:00
    什么原理呀
    entimm
        16
    entimm  
       2022-11-22 16:34:20 +08:00
    谢谢,如获至宝
    zhoujx
        17
    zhoujx  
       2022-11-22 16:54:27 +08:00
    这种一般是怎么实现的呢
    Asimov01
        18
    Asimov01  
       2022-11-22 17:16:46 +08:00
    试了好些东西都搜不到,自己分享过的东西也搜不到
    UT
        19
    UT  
       2022-11-22 17:22:33 +08:00 via iPhone   1
    @buyan3303 云盘精灵吧,确实很好用,很多资源都能搜到。
    toan
        20
    toan  
       2022-11-22 17:28:49 +08:00
    嚯!速度好快,数据定时抓取的?
    asly
        21
    asly  
       2022-11-22 17:49:36 +08:00
    好厉害啊,已收藏~
    SenLief
        22
    SenLief  
       2022-11-22 18:14:24 +08:00
    好像无法直接定位过去啊
    amlee
        23
    amlee  
       2022-11-22 18:25:20 +08:00
    有点好奇,原理是啥
    viWww0vvxmolvY5p
        24
    viWww0vvxmolvY5p  
       2022-11-22 18:54:32 +08:00
    谢谢,现在收藏有三个搜索工具了。
    danhua
        25
    danhua  
       2022-11-22 18:55:26 +08:00
    同好奇这类的网盘搜索的原理是啥
    zhygkx
        26
    zhygkx  
       2022-11-22 20:12:05 +08:00
    好用 +1
    lincanbin
        27
    lincanbin  
       2022-11-22 20:21:41 +08:00
    做爬虫的都很刑
    lizhesystem
        28
    lizhesystem  
       2022-11-22 20:59:18 +08:00
    不错,速度很快。
    utre938722
        29
    utre938722  
       2022-11-22 21:38:12 +08:00
    同好奇这类的网盘搜索的原理是啥
    w3cll
        30
    w3cll  
       2022-11-22 21:49:34 +08:00
    @danhua 同好奇
    FightPig
        31
    FightPig  
       2022-11-22 21:54:13 +08:00
    试了下,挺快的啊
    jfds
        32
    jfds  
       2022-11-22 22:35:43 +08:00
    @mway 老哥分享下?
    Pogbag
        33
    Pogbag  
       2022-11-22 22:45:17 +08:00 via iPhone
    挺好用的,感谢
    flymeto
        34
    flymeto  
       2022-11-22 23:39:00 +08:00
    申请开源
    yokon
        35
    yokon  
       2022-11-23 09:03:45 +08:00
    好用
    好奇原理是啥
    op351
        36
    op351  
       2022-11-23 09:08:57 +08:00
    @Ritter
    我猜是从微博等平台上定向爬分享类博主的微博
    因为我搜了两部电视剧 结果都指向同一个分享账号
    estk
        37
    estk  
       2022-11-23 10:17:31 +08:00 via Android
    2013 年我做百度网盘搜索时,还收到优酷官方邮箱发的警告函
    pkwenda
        38
    pkwenda  
       2022-11-23 10:32:21 +08:00
    见过,但是一直搞不懂原理是什么
    baisensenseng
        39
    baisensenseng  
       2022-11-23 10:47:28 +08:00
    我有个朋友说为什么搜不到波多野结衣?
    TomPig0216
        40
    TomPig0216  
       2022-11-23 11:02:32 +08:00
    搜了下 速度还挺快
    thinkdiff
        41
    thinkdiff  
    OP
       2022-11-23 11:37:52 +08:00   1
    感谢大家的鼓励和收藏,特别是给予我感谢的朋友。

    不出意料很多人对背后的原理感兴趣,这也是我喜欢 v2 的原因。其实不复杂,从网络上爬取公开分享的资源链接,并解析链接内的文件。将得到文件名和链接地址做成 KV 缓存到 MongoDB 。在搭建一个 WSGI ,做个搜索页面即可。

    主要到技术栈:Python / Scrapy / MongoDB / HanLP / Vue 3 / UnoCSS / NativeUI


    @zhoujx
    @amlee
    @danhua
    @utre938722
    @w3cll
    @yukun666
    @op351
    @pkwenda
    thinkdiff
        42
    thinkdiff  
    OP
       2022-11-23 11:46:28 +08:00
    做这个工具初衷是为了方便我个人使用。主要解决两个问题,一是存储空间,太多想要的资源无奈自己网盘空间有限。二是找资源效率,以前需要从各种渠道获取资源,有些还得爬楼找,遇到一个大合集还得进入合集内部搜索,效率太低。

    合规性是网盘搜索工具的共性问题,所以想向 V 有请教下如何尽量规避此类风险?

    如果像 @estk 那样收到官方告警函,网站会尽快下线,毕竟咱不获利,没必要引麻烦。

    如果有天网站被下线,我会考虑开源代码。

    @buyan3303
    @SenLief
    @NeedforV2
    @lincanbin
    @flymeto
    @estk
    estk
        43
    estk  
       2022-11-23 12:14:24 +08:00
    @thinkdiff #42
    2013 年优酷有一部新剧在上映,百度网盘有人传,我就采集到了,优酷没找网盘反而来找我。我就把哪部剧的名字放进搜索黑名单然后回复邮件告知对方,同时把百度网盘官方的举报链接也发给他们。这是网盘的责任,搜索引擎如果也要担责,那谷歌就是黄色网站搜集器
    viWww0vvxmolvY5p
        44
    viWww0vvxmolvY5p  
       2022-11-23 12:53:07 +08:00   1
    @jfds UP 云搜、猫狸盘搜
    thinkdiff
        45
    thinkdiff  
    OP
       2022-11-23 12:54:20 +08:00
    @estk 谢谢,学到了,我打算加个免责声明和举报功能 :)
    pkwenda
        46
    pkwenda  
       2022-11-23 14:11:16 +08:00
    fenglingyu
        47
    fenglingyu  
       2022-11-23 14:16:39 +08:00
    楼主这个不错啊,以前用过几个,现在都死了
    weiliangweiliang
        48
    weiliangweiliang  
       2022-11-23 15:30:16 +08:00
    谢谢 op ,我拿来出版社 挺好用的
    macy
        49
    macy  
       2022-11-23 15:41:47 +08:00
    很不错,建议增加一个筛选功能,是文件夹还是文件,有些电视剧是在一个文件夹里有好多集,这样方便下载
    moranrs
        50
    moranrs  
       2022-11-24 10:17:47 +08:00
    感谢 op ,用这个我找到了一个很不错的电子书分享合集
    https://www.aliyundrive.com/s/sD4YdCPQx93
    yusifeng
        51
    yusifeng  
       2022-11-24 11:57:38 +08:00
    牛的
    heyleo
        52
    heyleo  
       2022-11-24 16:57:14 +08:00
    真的感谢楼主分享
    noshiro
        53
    noshiro  
       2022-11-25 11:46:36 +08:00
    感谢分享
    lion
        54
    lion  
       2022-12-02 23:39:41 +08:00
    建议在搜索页加个首页 log 点击返回的设计
    QuinYim
        55
    QuinYim  
       2022-12-05 16:48:19 +08:00
    感谢分享
    colarxu
        56
    colarxu  
       2023-02-13 15:54:34 +08:00
    在用了 谢谢!
    balduncle
        57
    balduncle  
       2023-04-13 22:08:45 +08:00
    很好。收藏了
    Act1ve
        58
    Act1ve  
       2023-04-19 11:59:45 +08:00
    "从网络上爬取公开分享的资源链接"

    好奇这个是咋实现的,因为 baidu ,google 加 site 过滤搜索的结果质量不好, 如果是自己用爬虫提取网页,你咋知道要爬些什么站点呀
    SenseHu
        59
    SenseHu  
       2023-06-02 09:53:36 +08:00
    搜到想要的东西了,收藏了~
    koali123
        60
    koali123  
       2023-07-09 15:19:31 +08:00
    在用了 感谢分享 ~
    misasasaka
        61
    misasasaka  
       2023-07-10 00:51:03 +08:00 via iPad
    好像进不去了
    misasasaka
        62
    misasasaka  
       2023-07-10 00:52:37 +08:00 via iPad
    @misasasaka 我的问题
    fason1995
        63
    fason1995  
       2023-08-18 10:29:39 +08:00
    好用好用 搜索到我想要的资源了
    gniviliving
        64
    gniviliving  
       2023-11-22 17:00:52 +08:00
    大佬。好像用不了,返回空
    thinkdiff
        65
    thinkdiff  
    OP
       2023-12-03 13:19:55 +08:00
    @gniviliving 使用新域名访问 https://yapan.io
    deweixu
        66
    deweixu  
       2024-02-18 10:56:36 +08:00
    https://yapan.io 域名也不能用了吗
    SAfte345
        67
    SAfte345  
       2024-08-30 15:32:51 +08:00
    大佬,yapan.io 是不是下线了?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     884 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 21:19 PVG 05:19 LAX 14:19 JFK 17:19
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86