
大佬们,我现在有两个 safetensors 格式的模型文件,一个只有 130M ,另一个 3G+ 我现在想要部署这个模型使用,我不太清楚这两个文件都是什么意思,我需要怎么部署,纯新手 有没有操作案例或者示例代码 指引一下迷路人
1 zhmouV2 358 天前 safetensors 不包含模型本身的结构,只有模型参数,你得知道这个模型是啥样的。然后 safetensors 一般还是用 python 部署吧,就是安装一下 pytorch 之类的框架,最后用 gpt 写个示例代码就行。 |
2 WolverineL OP @zhmouV2 我 gpt 了个示例代码,但是一直跑不起来 不知道模型该怎么用,130M 和 3G 都只是参数吗 我看 130M 是张量 3G 那个我也不知道是什么 ,现在的场景就是只给了我两个 safetensors 文件,让部署 |
3 WolverineL OP 是 Lora 模型 safetensors 格式 |
4 zhmouV2 358 天前 @WolverineL #2 你找到的是画图的模型吗,3G 大小感觉是一个画图的模型,然后 130M 是对应的 Lora ?“Lora”不是某一种模型,而是对模型参数的微调方法,类似于一种“插件”,以画画为例,某个特定的“Lora”模型能够让原来的大模型本体画出之前不认识的角色/画风/概念之类的。建议先搜索一下模型的文件名,知道大概是哪个范围的才能有答案。 |
5 DefoliationM 358 天前 via Android 用 ollama 的话,需要手动转一下,具体可以参考 https://tech.takuyakobayashi.jp/2024/06/14/526 ,转完之后直接用 ollama run xxx 就能运行。 |
6 DefoliationM 358 天前 via Android @DefoliationM 下面的量化可以不看 |
7 huoshen 358 天前 凭直觉先用 transformers 的 AutoModelForCausalLM 和 AutoTokenizer 试试看能不能 load 再说 |
8 WolverineL OP @zhmouV2 是一个画图模型,大佬。 模型文件是这个 chilloutmix_NiPrunedFp32Fix ,那我是需要以什么形式启动模型 StableDiffusionPipeline.from_pretrained 这个是不是可以载入模型, 然后再将 lora 参数文件(130M) load 进 pipe: pipe.load_lora_weights (lora_weights) |
9 WolverineL OP @DefoliationM 好的 我看一下 |
10 thevita 358 天前 不知道 sd 有不有毕竟好的推理框架哦, 比如如果你用你上面的 diffusers 的话,就看 怎么 load lora 呗 https://huggingface.co/docs/diffusers/v0.14.0/en/training/lora#inference |
11 charlert 357 天前 via Android 用 Comfyui 建工作流啊,教程很多 |