我用 3.5 天的时间和 Claude 3.5 联手开发了一个 Mac App，利用本地运行的 Llama 3.1 提供实时的 AI 反应。在 M 系列芯片的 Mac 上可用。免费，完全本地，飞快。

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

这是一个创建于 440 天前的主题，其中的信息可能已经有所发展或是发生改变。

朋友们好，好久不见。

前几天 Llama 3.1 发布，我体验之后感到

时代的变化突然降临了，现在每个人都有几乎免费而且无限量的机器智能。

问题在于缺少应用。

我要做一个大量使用本地 AI 的应用！

整个开发过程和 Claude 3.5 合作完成，3.5 天之后，Snapbox 横空出事：

下载链接：

https://snapbox.app

Snapbox 最基本的用法是在任意 App 中选中一段内容，按 Alt + Space 快捷键启动 Snapbox ，立即获得来自本地 AI 的回应。

修改会自动触发重新请求，因此叫 Live Reaction.

更高级的用法是可以利用预设的 Prompt ，选中内容之后直接套入特定的 Prompt ，可以实现翻译、查词、找 bug 、改写等各种业务。

一切都在本地完成，完全免费，速度飞快。

推荐 Llama 3.1 8B 和 Gemma 2 2B 这两个模型，16G 内存选前者，8G 选后者。

第 1 条附言 2024-08-04 21:47:58 +08:00

刚刚更新的 v1.10 支持了包括 Openai, Gemini, Anthropic, Openrouter, Groq 等在内的服务提供商。

Snapbox

llama

48 条回复 2025-09-02 15:29:30 +08:00

BearD01001

2024-08-02 17:37:13 +08:00

好强的执行力，已下载体验

arongpm

2024-08-02 17:41:11 +08:00

已下载，需要和你学习执行力

KcKXpykSg2777f5I

2024-08-02 17:46:14 +08:00

楼主太强了，能否加我微信一下？ R29vZ2xlTWljcm9zb2Z0

BearD01001

2024-08-02 17:47:40 +08:00

不知道是不是我使用方法有问题，更改快捷键后好像不会生效，快捷键无法唤起应用主窗口

unstop

2024-08-02 17:47:57 +08:00

@wangshushu 微信不太用，可以 X 私信联系我：dm.new/qqs

CSGO

2024-08-02 18:07:45 +08:00

！

CSGO

2024-08-02 18:09:18 +08:00

15.0 Beta 版是不是用不了啊。

unstop

2024-08-02 18:26:35 +08:00

@BearD01001 确认是一个 bug ，已经在 v1.9.10 中修复。推荐更新一下。

unstop

2024-08-02 18:26:55 +08:00

@CSGO 能用，我就在用 15.0 Beta

djyde

2024-08-03 13:39:31 +08:00

8.2MB, electron 用户流下了羡慕的泪水

djyde

2024-08-03 13:49:54 +08:00

我用的 16G m1 air, 跑 llama 3.1 还是挺吃资源，会从本来 5G free 变成 1G. 速度大概是一秒两三个字。

这也是为什么我一直想用本地模型但最终还是会回到中心化模型。不知道大家一般用什么配置能流畅使用 llama3.1 这个级别的模型。

unstop

2024-08-03 13:56:10 +08:00

@djyde 推荐试试 Gemma 2 2B ，我在 M3 Air 8G 上使用速度很快。

richangfoo

2024-08-03 14:02:03 +08:00

横空出事? 出什么事了？

unstop

2024-08-03 14:13:57 +08:00

@richangfoo 故意留的错别字，目前只有你一个人发现

djyde

2024-08-03 14:38:54 +08:00

@unstop 确实快，但是幻觉也严重。看来要发掘一些适合小模型的使用场景

yb2313

2024-08-03 14:40:59 +08:00

@djyde #10 快使用 tauri, 还能做移动端

djyde

2024-08-03 14:41:39 +08:00

@yb2313 风评太差了

ktqFDx9m2Bvfq3y4

2024-08-03 14:56:05 +08:00 via iPhone

苹果的模型性能需求不是只有你那个 8B 的六分之一么，有没有人试试效果

yb2313

2024-08-03 14:56:14 +08:00

@djyde #17 ??诶, 完全没有听说过, 网上搜了一下也没有搜出来这个风评太差了,给个地址我看看

kaxiu

2024-08-03 15:06:22 +08:00

的确飞快！

YsHaNg

2024-08-03 16:55:56 +08:00 via iPhone

@Chad0000 afm 没开源出来 on-device 是个不到 3b 的模型按照公测评价实际不咋样苹果自己评分对比 op 这两个是胜的 https://machinelearning.apple.com/papers/apple_intelligence_foundation_language_models.pdf

john990

2024-08-03 19:23:30 +08:00

楼主可以分享下使用 Claude 技巧吗？为什么我和他沟通好几次才能完成一个小功能…

unstop

2024-08-03 21:19:39 +08:00

@john990 也没有什么技巧，大概就是两点：1. 描述需求要准确到细节，2. 提供相关的上下文。

joejiang

2024-08-03 23:32:43 +08:00 via iPhone

gebiwanger

2024-08-04 18:56:23 +08:00

nice 。后续还会有更多有价值的迭代更新吗？

git4all 这样的 app 也可以快速下载开源模型，叠加 RAG 文档训练，开启本地 server 。

这些开源模型都需要比较大的内存，服务器上跑跑还可以，但质量还是不行。
本地的话，还是得上 gpt 和 claude ，但是又不开源。

so ，这个方向价值的局限性，看起来还是很大。

unstop

2024-08-04 21:56:36 +08:00

@gebiwanger 刚刚更新 v1.10 支持了远程服务商