我开发了一款 AI+爬虫的工具,可以不需要配置爬虫,就能监控任意页面 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
xjiang1982154112
5.21D
V2EX    分享创造

我开发了一款 AI+爬虫的工具,可以不需要配置爬虫,就能监控任意页面

  •  1
     
  •   xjiang1982154112
    jufeng-2022 1 天前 1240 次点击

    只要输入你想监控的网址 + 一句话监控说明,AI 就能自动进行监控。

    支持邮件、微信、短信、webhook 多种通知方式

    免费用户可以监控 5 个网站

    猫头鹰智能网页订阅: https://www.mtywatch.com/

    11 条回复    2025-12-17 02:03:03 +08:00
    nananqujava
        1
    nananqujava  
       1 天前
    用的视觉大模型?
    xjiang1982154112
        2
    xjiang1982154112  
    OP
       1 天前
    @nananqujava 多个模型组合的,视觉+代码+文本大模型
    lswlray
        3
    lswlray  
       1 天前
    1 、看到监控的部分,没看到抓取数据的部分,请问 OP 可以实现数据抓取吗?例如多页表格数据。
    2 、部分网站有反爬虫的措施,如各种登陆验证码、IP 限制等等,可以解决吗?
    xjiang1982154112
        4
    xjiang1982154112  
    OP
       1 天前
    @lswlray 重点是因为合规性和防止滥用的考虑,
    1 、SaaS 版本只是做内容监控通知,完整内容的抓取,后续会现在浏览器插件版本开发
    2 、关于“反-反爬”技术,我们只做轻微的处理(低频率、使用真实浏览器访问)
    3 、IP 限制问题,我们仅绕开部分 WAF 会拦截机房 IP 的限制,gfw 的问题不处理,可自行翻墙后用浏览器插件版本
    4 、验证码这个问题,暂时不处理

    浏览器插件版本会在本月发布
    lswlray
        6
    lswlray  
       1 天前   1
    @xjiang1982154112 #3 期待新版本,我有这方面的商业需求
    x86
        7
    x86  
       1 天前   1
    AI 是其次的,要抓取的部分无非就那么点
    主要对比八爪鱼,后羿那种采集器,有啥优势没。
    BenCoper
        8
    BenCoper  
       1 天前
    特征还是比较明显未突破我司反爬,watching
    获取页面标题失败:服务返回错误: 获取页面标题失败: chromium 获取标题失败: Inspected target navigated or closed (-32000)
    xjiang1982154112
        9
    xjiang1982154112  
    OP
       1 天前
    @BenCoper @x86 我们只做了轻微的“反-反爬”处理,并且把抓取频率控制在最低 15 分钟。

    我们这个产品需求的出发点,是为了服务原来一直都存在的一类人群:
    1 、因为自己的工作、学业、娱乐的需要,要盯某几个网站;
    2 、不是为了获取大量数据,也不会为了秒级抢购,只是需要一天刷几次网站,甚至几天刷一次;
    3 、这类人群,愿意为此付出一点点的金钱,但是无法被有效服务(找不到程序员帮忙写爬虫,也学不来八爪鱼这类的工具);

    20 多年前,我接触爬虫技术的时候,就在想办法如何有效服务这些人(挨个写代码配脚本绝对不是好方式,八爪鱼这种方式对普通人还是鸡肋了点)。

    这次 AI 技术变革,带来了真正的解决方法。任意一个页面,理论上-_-AI 都能帮你自动识别并抓取。

    所以做了这套工具,我们的重点确实不是处理反爬问题,我们的重点只有一个:
    相当于你请了一个兼职,每天帮你刷十几次网站,有你关心的数据就通知你;
    或者是相当于你请了一个 1 年的程序员,帮你写写代码配脚本,并保证可以持续工作。
    而你只要花一点点钱(一个月几块钱)

    这是我的初心与设想,不知道是否能有足够的需求群体支撑这个产品走下去(想把 AI 优化的能处理好各种页面和不同需求,难度还挺高 -_-!!)/抱拳/抱拳
    brave256
        10
    brave256  
       18 小时 48 分钟前
    op 你是怎么找到你的付费人群的
    xjiang1982154112
        11
    xjiang1982154112  
    OP
       15 小时 6 分钟前
    @brave256 你问到我们痛点上了,都还没开始想呢。目前所有的心思都放在如何找到第一批使用人群。我只能抱着只要我们把"一句话就能监控网页"这个能力做好,应该有我们一口汤喝-_-!
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5172 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 136ms UTC 09:09 PVG 17:09 LAX 01:09 JFK 04:09
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86