使用示例: https://api.xinac.net/icon/?url=https://www.google.com
使用了 @EdgeOne 的 CDN 加速,已缓存域名约 13 万,日均请求数近 5000 万
docker 镜像: https://hub.docker.com/r/xinac721/favicon-api
Github: https://github.com/xinac721
]]>本来想 cursor 免费版 autocomplete+kilocode ,但 cursor 也有一些小 bug 跟其他的 ai 工具不怎么兼容。
]]>想让 Claude 完全用 Golang 重构一遍,当前的模型水平靠谱吗?全部实现的话 100 刀 token 消耗够吗?
]]>最近,我为网站接入了谷歌广告进行变现,目前流量表现也不错, 社区的反馈让我备受鼓舞,看到越来越多用户发现并使用这个平台,我感到非常兴奋!
现在,我正在考虑进一步提升网站功能,想听听大家的意见:你们觉得为网站添加付费功能(例如订阅模式或 AI 工具的优质推荐位)有必要吗?
我希望在保持用户友好体验的同时,探索更多可持续发展与提升平台价值的方式。 欢迎访问我的网站: https://www.aiagentehub.com/ 期待大家的反馈!如果有任何关于网站改进的建议,也非常欢迎分享!
]]>好奇的是——这些平台的数据是怎么拿到的?
我查了一些资料,大部分都语焉不详。V 站里有没有做过类似数据采集的朋友,可以分享一下思路或原理?不求商业机密,只想了解个大致的技术路径和可能的合规风险。
]]>某些问题我不想问 AI ,比如 web 安全方面的问题。
听说 SO 水比较深,我会考虑仔细看 SO 的要求的,不过不知道有没有人有简单的解读,类似几句话就说明白的。要是没有我就只好去仔细看了。
据说 SO 提问量这几年跌得很猛。我看了一下 Go 的搜索结果,好像有时候一天都没一个。回答质量有保证吗?
我看了一下我之前问的很多问题,感觉不太符合我之前看到的一个总结 SO 规则的知乎回答,就是问题要落实到代码上。这种比较虚的问题比较适合在哪问?
还有翻译的问题。我英文挺烂的,看还勉强凑合,写实在是不行。用大语言模型翻译问题有没有什么坑?如何解决?
其他我没想到的东西希望大佬多给点经验。
最后说一下我的优势和劣势,可不看。我的主要优势就是脸皮厚,不怕失败和拒绝。有没有能利用这种优势的策略?比如直接给大佬发邮件?我感觉挺贱的,怎样更好一些?先在网上问,然后再发邮件,如果大佬愿意的话可以去回答?或者如果问题好评比较多再去骚扰大佬?虽然我脸皮厚,但是不是那种无底线的厚,我自我感觉我不是类似精致利己主义那种。如果有能减少对大佬的消耗的方法我会使用的。我的主要劣势是穷,我感觉很多问题如果有钱的话就算在国内也能很好的解决。我试过付费咨询,基本都还算满意。所以花钱多的方法我不想用,当然你可以写,反正这帖也不是我一个人看。
]]>放三个截图吧
这可能就是这个工具给我带来最大的意义,这个项目几乎完美呈现了我博客 Slogan 的这句话:“享受技术带来的乐趣,体验生活给予的感动”。开发工具给我带来了快乐,大家的反馈真的让我感动
]]>现在就是 prompt 很难控制“有必要”的这个状态,不会判断什么情况下该调用“图片/视频”生成工具,什么时候不必调用“图片/视频”生成工具。
目前在 Prompt 中,告诉大模型:按需出图/视频,但基本上每次都必出图/视频。感觉控制不住了,有大佬知道怎么处理这种情况的吗?
]]>介绍下我尝试过两种方案
在 Cline 里调用 mcp 服务获取组件数据再用 AI(Qwen3-32B)组合并填充数据,最后输出 JSON
基本能生成,但不实用,像简单的组件排列
由于电脑性能有限,只用了 Qwen-0.6B 模型尝试 lora 微调。数据集就是一些生产环境的数据,但训练后的效果不理想,模型的回答和数据集完全没关系。导出自定义的模型在 ollama 里运行,然后在 Cine 里调用 ollama ,不过无法调用 mcp 服务
如果有硬件环境,这条路是否更加可行
]]>prompt = f""" 你是一个擅长识别发票内容的 AI ,请从以下多个发票的 OCR 块中,提取结构化的发票信息。输出内容为 json 格式,不输出解释、思考或额外说明。 每张发票以“ [文件: xxx.pdf ] ”标识其来源。请为每个文件分别返回结构化信息,输出如下 JSON 格式: {{ "invoice001.pdf": {{ "发票代码": "...", "发票号码": "...", "开票日期": "...", "购买方名称": "...", "销售方名称": "...", "价税合计": "...", "明细": [ {{ "名称": "...", "数量": "...", "单价": "...", "金额": "..." }} ] }}, ... }} 以下是多个文件的 OCR 文本及其坐标: {'\n'.join(all_text_blocks)} """.strip()
对接 gpt 和 deepseek 公有模型都好使,但是对接私有模型,比如 deepseek-r1-distill-qwen-32b ,deepseek-prover-v2-671b , 还有最新的 qwen3-30b-a3b ,效果都很差,基本上解析不了 json 格式。这是什么原因呢,需要怎么调试。
使用的是 langchain 框架,私有模型用的是 gpustack 在 macstudio m3ultra 上部署的。
]]>我将 copy 的内容放到记事本中,发现并没有带 css 等样式脚本,这种是怎么实现的呢?求大佬解惑
]]>请问大家能给点点子不?我自己暂时没啥想法,没有什么明显的痛点,请大家给点思路?
]]>顺序 | 模型 | Token 价格 | 编程得分 | 百分比 | 备注 |
---|---|---|---|---|---|
1 | anthropic/claude-3.7-sonnet | $3/M | 1356 | 100.00% | |
2 | openai/gpt-4.1 | $2/M | 1283 | 94.62% | |
3 | google/gemini-2.5-pro-preview-03-25 | $1.25/M | 1275 | 94.03% | 网页端免费 |
4 | google/gemini-2.5-pro-exp-03-25:free | 0 | 1275 | 94.03% | openrouter 免费 |
5 | anthropic/claude-3.5-sonnet | $3/M | 1239 | 91.37% | |
6 | deepseek/deepseek-chat-v3-0324:free | 0 | 1207 | 89.01% | openrouter 免费 |
7 | openai/gpt-4.1-mini | $0.40/M | 1194 | 88.05% | |
8 | google/gemini-2.5-flash-preview | 0.15/M | 1172 | 86.43% | 网页端免费 |
9 | google/gemini-2.0-flash-001 | 0.10/M | 1035 | 76.33% |
注:
aistudio
在网页端使用时可以免费openrouter
提供了几个可以使用 API 调用的免费模型1 、修改镜像:soulter/astrbot:latest 2 、接下来打开容器外部访问,新增两个容器端口,6185 和 6196 3 、配置 qq 机器人 4 、配置大模型 api 服务 5 、开始聊天吧 还可以自己添加一些 mcp 服务
https://opaoai.com/archives/1744717612679
有些会显示白名单问题,虽然我没有遇到,都没有这个选项 如果遇到白名单问题,请参考这个 先用 itdogping 一下自己的域名, 大概有 20 来个 ip 全部加到白名单后, 在重启 astrBot 这时候才启动成功, 不然就会提示这个;
需要自己准备一个 apikey
]]>想知道怎么尝试比较合适,自己接入 api ?对于新事物总是犹犹豫豫的😂
目前只用 deepseek 和 kimi 写过一些 go 和 python 脚本
希望大佬们不吝赐教
]]>下载了某个 ui 库的 next js 的示例项目,我想生成纯静态文件,然后部署到服务器上。
我是知道如果执行 next build 以后只会生成.next 文件夹的,但是!我想生成的是 out 文件夹来部署。
我查看了 nextjs 的版本是 15 ,所以我知道在 next.config.js 的文件里面,要配置 output: export 。
但是这个项目竟然拿没有 next.config.js,我就创建了一个,之后老老实实的配了 output :export ,执行 npm run build 还是只生成了.next 文件夹。。。
我又开始研究,发现这是个 ts 的项目,然后我还在 tsconfig.json 文件的 include 数组里面加了‘next.config.js’,依旧是不行。
心态彻底崩了,我就想生成一个静态可以部署的输出,怎么这么费劲,到底是哪里的问题???
]]>一般的 tab 和一些代码的补全和修改用这个额度吗
]]>namespace helloworld { internal class Program { static void Main() { int foo =0; //新建一个线程 var t = new Thread(() => { foo++; } ); t.Start(); //启动上面这个线程 t.Join(); //主线程阻塞直到 t 线程完成 Console.WriteLine(foo); } } }
]]>Google 发布了免费版编程助手 Gemini Code Assist ,而且其免费额度足够大部分人使用。Gemini Code Assist 基于微调过的 Gemini 2.0 模型,程序员每个月可以用它完成 18 万次辅助编程。相比之下 GitHub Copilot 免费版每个月只有 2000 次。它能集成到 Visual Studio Code 、JetBrains IDE 和 GitHub 等流行开发环境中。Gemini Code Assist 的上下文窗口最多 128,000 个令牌,能用于较大的代码库,使用只需要有 Gmail 帐户不需要信用卡。Google 声称逾四分之三的开发者在日常工作中使用 AI ,有四分之一的新代码是在 AI 帮助下生成的。
看这免费额度能锤爆 Copilot 和 Claude 了!
]]>后面我把整个项目移到固态硬盘,把报错的子项目清理了以后再编译,终于编译成功了,前后浪费了 5 天时间。
得出的教训是,机械硬盘别放重要项目,碰上一个坏块可能整个项目就废了,有些报错信息 Google 搜不到,0 结果,想排查都不知道从哪查起。
还有就是 vscode 有些 AI 编码的插件会占用文件,导致编译失败,有些插件哪怕你没开 vscode 也会在后台运行,不用的插件最好卸载了。
杀毒软件也会占用文件,导致编译失败,这个我以前碰到过,所以我很多年没装过杀毒软件了。
]]>类似于“该主播最常来的嘉宾是谁?” “主播的口头禅是什么”“主播最难忘的是什么事”
但是完全没有头绪。
我现在能想到的是
但是我是一个编程小白,我想请求一下 V 站的大佬,这个可行性高吗?
或者已经有了类似的工具?
]]>根据这个链接提到,似乎是 Oracle 的,但是我不了解 Oracle 数据库,也没有找到更多资料。
]]>就像汽车,混动只是个过渡而已,现在的编程语言也是。
]]>在我看来我觉得 webrtc 的方案比较重,成本高,维护复杂,小公司也玩不转这套技术栈,反而 websocket 甚至更简单的 http 在满足需求的同时技术要求更低,成本也低,维护也相对容易。
如果说是体验的问题,在大模型出现之前,类似小爱同学、天猫精灵等智能音箱的交互应该也没有使用 webrtc 吧,大家似乎也可以接受他们的交互体验。
有大佬研究过这方面的问题嘛?或者说各位是什么看法?
]]>针对不同的传感器数量级,十万,百万,千万,各有什么性价比最高的实现方案,综合考虑开发成本、硬件成本、运维成本
希望大家给点意见,集思广益
]]>