目前用 SingleFile 自动保存到 webdav ,但是搜索是个问题,理想情况是有个 web 界面,目前没有找到合适的工具,暂时是用命令行 find+grep ,感觉不太方便。
了解了下两个轻量级的全文搜索:ZincSearch 、blevesearch ,还没深入是看,但是感觉也应该需要想办法把网页内容导入到引擎里面,不知道还有没有其他的方案。
尽量轻量级一些,ES 太重了首先排除掉吧。

目前用 SingleFile 自动保存到 webdav ,但是搜索是个问题,理想情况是有个 web 界面,目前没有找到合适的工具,暂时是用命令行 find+grep ,感觉不太方便。
了解了下两个轻量级的全文搜索:ZincSearch 、blevesearch ,还没深入是看,但是感觉也应该需要想办法把网页内容导入到引擎里面,不知道还有没有其他的方案。
尽量轻量级一些,ES 太重了首先排除掉吧。
1 TrembleBeforeMe Feb 28, 2023 |
2 FrankAdler OP @TrembleBeforeMe 这个看起来好强,我先研究下看看 |
4 tool2d Feb 28, 2023 自己写一个 vscode 插件,find in files 文本搜搜嘛可以了。 低频需求,性能要求不需要那么高。 |
5 FrankAdler OP |
6 FrankAdler OP @tool2d 可能还不如 find+grep 呢,就是要 ssh 下 |
7 607L4a6qlLSEi6vy Feb 28, 2023 语雀的剪存 |
8 607L4a6qlLSEi6vy Feb 28, 2023 飞书的剪存 |
9 fds Feb 28, 2023 前两天看到 https://github.com/omnivore-app/omnivore 不过我没用过 |
10 tool2d Feb 28, 2023 @FrankAdler mhtml 需要解包,至少不去搜索 base64 里的图片。 还需要定位跳转,搜出来结果,你总要看一下上下文吧。 还有一些不是 utf8 格式的页面需要转换,又或者不是一个个独立文件,文件多了后,是定期 zip 打包这种形式存在于磁盘上的。 退一万步,就算直接用 find 命令行,我也会写一个自己特化的管道过滤工具,码农不就是写工具的。 |
11 ipfox Feb 28, 2023 chrome 插件 Chrono Power Action |
12 Giftina Feb 28, 2023 SingleFile 存到本地后搭配 hamsterbase 即可 |
13 Huelse Feb 28, 2023 感觉有点像 onetab 的功能 |
14 abcdxe2v Feb 28, 2023 @FrankAdler historio.us 这个不行,很多网页抓取不到(可能是因为动态加载的原因) 由于我需要正则,所以我是 SingleFile 保存后,用 FileLocator Pro (因为是正则,所以无索引) |
15 ztbz123 Feb 28, 2023 @abcdxe2v 我也这样,但 FileLocator Pro 检索和预览 HTML ,是源代码 html 标签的形式,html 标签和样式比较多,看着不太直观方便,有没有什么解决方法?比如,能不能设置 FileLocator Pro 预览 HTML 格式文件时,可通过浏览器预览展示 |
16 zictos Feb 28, 2023 试过很多,没一个好用的,很多明明看过的文字却搜不到。现在很多网站又都是 js 动态加载,就更可能搜不到了 |
17 FrankAdler OP @zictos archivebox 可以抓起 js 动态加载的(基于无头浏览器) |
18 FrankAdler OP @ztbz123 可能保存的时候不要 css 样式会好很多?毕竟内容才是最重要的 |
19 tinola Mar 1, 2023 以前用网文快捕 CyberArticle 可以离线保存,后来不更新了,可惜。现在用 onetab. |
20 edis0n0 Mar 1, 2023 @TrembleBeforeMe #1 这个要登录的页面就不行,好文章很多都要登陆才能看 |
22 woyaojizhu8 Mar 4, 2023 recoll 最合适,而且也有 webui |