求推荐 AI 图片分类的现成服务 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
forty
V2EX    程序员

求推荐 AI 图片分类的现成服务

  forty 2024-05-27 16:04:48 +08:00 2235 次点击
这是一个创建于 506 天前的主题,其中的信息可能已经有所发展或是发生改变。

手头有大量图片,以及一些分类标签的名单列表,需要根据图片找到对应的标签。 比如输入图片 1 ,期望得出标签:风景,夜晚。

我试了一下某大厂的,不能用我提供的标签去分,而是它自己的标签,比如我期望的是“人物,女性”,然而它给出的是“眼睛,鼻子,咖啡”

20 条回复    2024-09-25 09:22:42 +08:00
abelyao
    1
abelyao  
   2024-05-27 16:06:38 +08:00
反过来想,输入图片,问它内容是否为“风景”,是的话你就打上标签“风景”咯,以此类推
forty
    2
forty  
OP
   2024-05-27 16:09:40 +08:00
如果有几百个基本标签,那 1 个图片得问上几百次?还是说有支持 1 次问全部的?不知道哪家的 api 支持
mumbler
    3
mumbler  
   2024-05-27 16:16:04 +08:00
你先给每个标签准备一个标准图片,计算出向量,然后新图片也计算向量,相似度排序看与哪个标签的标准图片最接近,就先粗分到这个标签下,然后用大模型询问复核一下是否与这个标签匹配
safilar
    4
safilar  
   2024-05-27 16:42:18 +08:00
@mumbler 你这个方法是不错,有实践过么
jimrok
    5
jimrok  
   2024-05-27 16:46:50 +08:00
这个不是做一个微调就行了吗,你用 restnet 50 的模型,改一下分类,载入原来的权重,重新训练一下就行了。问一下 gpt4 ,马上给你一套代码。
lizhisty
    6
lizhisty  
   2024-05-27 16:50:08 +08:00
@jimrok 老哥 restnet 50 是什么
rming
    7
rming  
  &bsp;2024-05-27 17:04:50 +08:00
用 yolo 微调下
mightybruce
    8
mightybruce  
   2024-05-27 17:19:20 +08:00
这个图片分类属于计算机视觉的经典任务。
常见的有好几种方案
第一种,图片元数据信息 尤其是 exif 信息,可以直接利用来打上标签,然后就用这个做文本做索引查找,

第二种,这个属于少量自己训练的计算机视觉任务,叫做 image classification

如果你一点都不懂 AI, 不建议自己训练, 百度飞浆 可以看看,easydl 提供了这些
https://ai.baidu.com/easydl/vision/

第一步需要你把图片做分类, 并完成标注,这个手动的话要耗费很多时间的

自动标注最好借助一些平台来做

第二步 选取训练集, 做有监督的训练学习

第三步 用剩下的测试集 测试效果
jimrok
    9
jimrok  
   2024-05-27 17:22:15 +08:00
@lizhisty 残差网络,多打了一个 t ,resnet ,何凯明在微软研究院搞出来的图像分类模型,曾经的 imgnet 的冠军。
jimrok
    10
jimrok  
   2024-05-27 17:26:49 +08:00
图像识别已经是深度学习非常成熟的领域,一般都不建议重新训练一个模型,现有的模型选一个速度和准确率都能接受的模型,做一个微调就行,因为现有的模型对图片的纹理特征都完成了比较好的训练,只需要基于现有的权重,重新训练,就能得到特定领域的模型。
ZnductR0MjHvjRQ3
    11
ZnductR0MjHvjRQ3  
   2024-05-27 17:49:51 +08:00
这种服务应该没有,如果你找的是你认为很通用的,但是市面上没有的话,就只能自己微调了,yolo8 很好用
chenuu
    12
chenuu  
   2024-05-27 17:53:48 +08:00
azure 有自定义视觉这个能力
qq316107934
    13
qq316107934  
   2024-05-27 18:25:32 +08:00
试试 zero shot 分类然后算向量相似度,自己卡一个阈值,参考 CLIP 模型
mumbler
    14
mumbler  
   2024-05-27 21:56:33 +08:00
@safilar 都跑了一年多了,不过不是图片分类,而是视频内容搜索
fjkfwz406
    15
fjkfwz406  
   2024-05-27 22:06:11 +08:00
clip
suke119
    16
suke119  
   2024-05-28 08:51:41 +08:00
每一种图片 20-40 张,越多模型越准确 准备好分类,然后训练下 最后准确率在 99%以上,前端时间刚给别人定制过一个
huang86041
    17
huang86041  
   2024-05-28 13:58:53 +08:00
我使用的图库应用 MT-Photos 里面就包含 AI 识别,而且他也开源了。用的 Chinese-CLIP
省事的话,你直接用他的 docker 部署一个。搜 mt-photos-ai
或者你直接搜 Chinese-CLIP ,自己定制一个。
andforce
    18
andforce  
   2024-08-30 16:46:31 +08:00
目前回复中好像没有开箱即用的,蹲一个
xiaobai987
    19
xiaobai987  
   2024-09-05 20:44:52 +08:00
@suke119 #16 你好 你是用的 YOLO 训练的吗?
ChanKc
    20
ChanKc  
   2024-09-25 09:22:42 +08:00
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5798 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 26ms UTC 06:20 PVG 14:20 LAX 23:20 JFK 02:20
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86