大家好,我是 Glenn ,过去几周的时间,我开始了我的 AI Coding 挑战,一周做至少一款产品,争取做出来大家喜欢好用的有影响力的产品。产品的选题会从我实际上遇到的问题和感兴趣的方向出发去做,主要专注于效率工具方向。
过去几周做的部分项目:
- Modern Mermaid:全世界最好看的 mermaid 流程图设计网站
- llmhub:一个 golang 的 llm 基础库,把大部分的 llm 厂商统一成一个接口,可以接入不同的 golang 项目
- llmgit:基于上面的 llmhub 项目做的 git 命令行终端工具,跟 git 一样的使用,加多了更多的 ai 功能,比如:ai 生成 commit ,ai 生成 changelog ,ai 审查代码等等
- trendhub:一个热点趋势的过推送滤平台,体验:https://trendhub.wowwwow.cn,自定义每天的推送热点
- simple-db-web:一个 golang 编写的 web 端数据库管理工具,小而美,支持:mysql/pg/国产数据库/es/redis 等,体验:https://simpledbweb.go-admin.com/
- indexttsWeb::一个基于 indextts 的 web 管理平台,可以让你利用自己电脑搭建一个可以对外的 indextts api 服务。随时生成逼真情绪的语音。
- snapup:一个提供网站多尺寸设备的截图服务的项目,体验:https://snapup.wowwwow.cn
- simpletunnel:一个极简好用的外网穿透代理软件
过去一周的实践
过去一两周我都有在迭代 Modern Mermaid 。但这个网站已经完成度可以了,剩下是一些深入的功能,等用户慢慢口碑传播后,我会再考虑进一步深入开发了。
眼下我的重心在一个新的项目,浏览器 Agent 。我发现全世界都找不到一个真正能用好用的浏览器自动化工具,于是我就动手做了。应该是全球范围内的第一个真正落地能用的浏览器 Agent 。截稿至我当前发这篇帖子,目前基础框架搭差不多,应该是可以玩了,但是肯定还有很多功能和问题,等待慢慢深入优化。

我没有采用直接完全轮询识别浏览器结构的方案,这个方案基本就是工具性质,只能慢慢等待大模型能力增强还有算力价格下来才能用。所以退而求其次,采用录制脚本重放代码,大模型来做规划的方案,这个不能通用和泛化,但是他固定场景马上能用,更通用的,随着脚本增加,规划能力增强,也完全可行(任何 web 能做的场景),尤其当你的场景很明确的时候,实际上我觉得需要做自动化的人都有明确的场景,那么这个方案完全可以落地,很少的 token ,很低的耗时就可以帮你做日常你经常重复做的活了。
当前这个项目在找内测的同学一起帮忙免费试试呀,感兴趣的可以加我:mongorz ,备注:浏览器。我拉您入群,内测就不放开很多人了,只能先到先得呀,要真的有场景对这个方向感兴趣的同学,可以一起交流。后续功能稳定应该会开源给大家下载使用。
我猜应该能比最近火的豆包手机跟 autoglm 更加实用,如果不是,也可以一起来做得更实用!
未来一周的展望
接下来,我还有一个想做的产品是做一个全世界最好看的笔记应用。如果你觉得有用过好用的可以留言推荐,可能我觉得很好用就会放弃这个想法了。因为我搜索遍了网上 markdown 编辑器,都太丑了,难以想象 2025 年了,这些产品的设计还这么简陋。网上有一款有名的浏览器扩展交沉浸式翻译,我想做 markdown 编辑器的沉浸版本。
关于我
我还在持续的做 AI Coding 的挑战。如果你觉得有意思,可以关注联系我。 这些是我的社交媒体,关注我可以最快获得更新,有怎么做产品/运营/出海的思考分享和经验啦。
- X: https://x.com/chg80333
- VX:mongorz
- 小红书:@glenn2033
- 即刻:@glenn2033
