有没有什么工具能根据我的兴趣,自动刷知乎、V2EX 等网站并筛选感兴趣的帖子? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
ycy9808
V2EX    程序员

有没有什么工具能根据我的兴趣,自动刷知乎、V2EX 等网站并筛选感兴趣的帖子?

  •  
  •   ycy9808 197 天前 4242 次点击
    这是一个创建于 197 天前的主题,其中的信息可能已经有所发展或是发生改变。
    现在发现获取碎片化的信息太费时间,和我玩游戏的时间有点冲突。

    虽然这些网站提供了 RSS 功能或者栏目订阅,但我发现一个问题:

    即便已经订阅了某个话题或板块,里面推送的内容也有很大一部分并不是我真正关心的。而且推送的内容质量参差不齐。

    所以我在想,有没有现成的工具或者框架,能够实现这些功能:

    1 、定时访问指定网站;

    2 、按关键词、标签、标题内容等进行初步筛选;

    3 、最好能用 AI 来判断这篇帖子我可能是否感兴趣;

    4 、最后把这些内容以每日或者汇总的形式,推送到邮箱。

    有没有大佬已经搭建过类似的东西,能省去每天翻几十篇没兴趣内容的时间,不知道大家有没有这样的需求。
    28 条回复    2025-04-15 11:42:17 +08:00
    yb2313
        1
    yb2313  
       197 天前
    我也在想自己整一个项目来搞这个, 用 py 做爬虫, 然后前端展示, 后端可能用 rust 或者 c#,go, 筛选条件还是用 py 写比较方便, 猜测有很多包比较方便
    shendaowu
        2
    shendaowu  
       197 天前
    Mem0 也许能实现这个功能?“自适应个性化:根据用户交互不断改进,提供精准个性化记忆。” “Mem0 可以显著提升个性化 AI 的能力。通过记住用户的偏好等用户画像信息,AI 产品就可以提供更加个性化服务,有较好的想象空间。”https://www.cnblogs.com/xiaoqi/p/18315502/mem0

    另外 OP 刷这些东西的主要目的是什么?我属于手里拿着“XY 问题”,看谁都在犯这个毛病。比如如果 OP 是想扩展知识面的话,也许看“牛津通识读本”或者各学科的导论效果会更好一些。如果是想紧跟时事的话,订阅一些相关的正经媒体也许更好。
    DIO
        3
    DIO  
       197 天前
    建议直接基于 RSS 的搞,爬虫项目一般是弃坑跑路最快的
    lekai63
        4
    lekai63  
       197 天前 via iPhone   2
    你这需求 不是又回到算法推荐了吗

    无非是本来平台出算法 现在你想自建
    renmu
        5
    renmu  
       197 天前 via Android
    不看立省
    shendaowu
        6
    shendaowu  
       197 天前   3
    @lekai63 #4 平台跟用户一般有利益冲突。平台想要用户不停地刷刷刷。用户想要自己真正感兴趣的,并且不想一直刷刷刷。
    IndexOutOfBounds
        7
    IndexOutOfBounds  
       197 天前
    楼主看下我这个是否满足你的需求,基于 RSS 的
    t/1119444

    不过现在还没出来,拖了比较久,现在在写 README &测试阶段
    musi
        8
    musi  
       197 天前
    @DIO #3 国内很多平台本并不提供 RSS 订阅,所以大多数平台的 RSS 也就是个爬虫
    2333wz
        9
    2333wz  
       197 天前   1
    我每次大会员断供 B 站就给我推送想看的会员限定
    yb2313
        10
    yb2313  
       197 天前
    主要是自己看的平台就那么几个, 直接操作浏览器不停往数据库存就行了, 速度也不用很快, 自己看不完, 然后自己根据任意条件筛选掉不喜欢的, 对接 ai 也很方便
    bantianys
        11
    bantianys      197 天前
    https://newsnow.busiyi.world/c/hottest
    这个是开源的项目,自己改下,用 LLM 的 API 过滤。具体代码怎么改可以用 cursor 根据整个 CodeBase 辅助你修改。
    SmiteChow
        12
    SmiteChow  
       197 天前   7
    自建的信息茧房它就不是茧房了吗?
    mumbler
        13
    mumbler  
       197 天前   1
    不就是今日头条么
    opengps
        14
    opengps  
       197 天前
    你是想玩游戏,但惦记着刷资讯。“看山不是山,看水不是水”
    Gilfoyle26
        15
    Gilfoyle26  
       197 天前
    这不就是 抖音吗,反正都是打发时间,刷抖音和刷知乎、V2EX 等网站又有什么区别呢
    Pipecraft
        16
    Pipecraft  
       197 天前
    Feedly 的 AI feed 功能也许是你想要的。
    Librola
        17
    Librola  
       197 天前   1
    @SmiteChow 茧房总比茅厕好,有些平台的推荐简直是在压着你喂
    adgfr32
        18
    adgfr32  
       197 天前 via Android
    拒绝平台给你推送的流信息,自己主动去找一些想知道的信息。
    chqome
        19
    chqome  
       197 天前
    feedbro 可以根据关键词过滤掉不行看的内容
    hxy100
        20
    hxy100  
       197 天前
    何必自己造轮子,建议你多花点时间刷刷今日头条就行了。字节的算法向来很先进,会给你想要的。
    elffkdx
        21
    elffkdx  
       197 天前
    t/1123085
    我也想要个这样的,就是这个 APP 可以抓取和收集任何信息,或者由用户产生,都可以。
    will800
        22
    will800  
       197 天前
    @hxy100 #20 今日头条上不是都是营销号吗,高质量内容只剩知乎和少数垂直论坛了
    smlcgx
        23
    smlcgx  
       197 天前 via iPhone
    @SmiteChow 我觉得不一定,要看信息源的质量。比如读 10 本高质量的书和刷 1000 个短视频相比,肯定是前者给人带来的收获更多一些
    aarontian
        24
    aarontian  
       197 天前
    之前有考虑过,且不说推荐算法和成本问题,单数据获取就很难(爬虫是个体力活),最终大概率不如选个适合自己的平台+平台推荐
    abc8678
        25
    abc8678  
       196 天前 via Android
    @SmiteChow 突然想起还在看本站和 IT 之家等的原因之一
    kneo
        26
    kneo  
       196 天前 via Android
    是不是最好还能自动帮你阅读,阅读完告诉您今天收获满满。
    xuanwu
        27
    xuanwu  
       195 天前
    简单的聚合脚本: https://zhuanlan.zhihu.com/p/693971016
    目标是自定义排序和推荐: https://zhuanlan.zhihu.com/p/346258393
    feiyu001
        28
    feiyu001  
       194 天前
    之前有个推酷挺好的
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1051 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 23:30 PVG 07:30 LAX 16:30 JFK 19:30
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86