如何利用 AI 实现图片点评功能 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
bubble21
V2EX    问与答

如何利用 AI 实现图片点评功能

  •  
  •   bubble21 2023-12-23 17:36:33 +08:00 1853 次点击
    这是一个创建于 656 天前的主题,其中的信息可能已经有所发展或是发生改变。
    功能:上传一张图片,就图片进行文字点评(如色彩,构图,颜色等方面)
    只知道用 GPT ,不是很了解 AI 模型,找不到技术研究方向,想问下如果想实现这个功能,有没有可用的开源框架
    12 条回复    2024-11-01 11:15:37 +08:00
    songge
        1
    songge  
       2023-12-23 17:44:39 +08:00
    这个?
    bubble21
        2
    bubble21  
    OP
       2023-12-23 17:48:46 +08:00
    @songge 有点类似,点评非专业点评,就是比如少儿涂鸦,需要以那种积极的语句去点评图片内容
    bubble21
        3
    bubble21  
    OP
       2023-12-23 18:02:44 +08:00
    目前了解的是可以通过 CLIP 模型本地训练
    Juszoe
        4
    Juszoe  
       2023-12-23 18:26:12 +08:00
    这个任务叫 Image Captioning ,很传统的任务了
    下面是一些开源的方法
    https://paperswithcode.com/task/image-captioning/latest
    em70
        5
    em70  
       2023-12-23 18:42:04 +08:00
    研究 gpt4v 开发文档就行了,一句 prompt 的事,让 gpt4 按你制定的标准去评判,难点是你要先知道怎么评价,技术无难度
    love060701
        6
    love060701  
       2023-12-23 20:36:50 +08:00
    调用 GPT-4-vision 接口即可,prompt 设定为类似这种的:你是一位儿童美术老师,需要对儿童画的画进行评价,尽量发掘儿童画作的优点,给予儿童鼓励。
    几行代码的事,没有任何开发难度。
    PinkPumpkin
        7
    PinkPumpkin  
       2023-12-24 08:25:30 +08:00
    clip 不行
    happyn
        8
    happyn  
       2023-12-24 09:52:09 +08:00
    现在 GPT4 做这种事情很轻松了,花几分钟创建了一个 GPTS 机器人,开了 Plus 可以直接点开用:

    (摄影图片点评大师)
    https://chat.openai.com/g/g-woSbRatQU-she-ying-tu-pian-dian-ping-da-shi

    效果是这样的:
    https://imgur.com/sxEtWK0
    happyn
        9
    happyn  
       2023-12-24 09:53:29 +08:00


    提示词:

    # Role:摄影专家

    ## Background:
    用户上传了一张图片,想要从专业的摄影角度得到点评。他们可能是摄影爱好者或专业人士,寻求技术提升或创作灵感的确认。

    ## Attention:
    你对摄影的热情和追求完美的眼光是无价的。每一张图片都是一个故事,一个瞬间,一个情感的表达。我们在这里帮助彼此成长,探索摄影的艺术之美。

    ## Profile:
    - Author: happyn
    - Version: 1.0
    - Language: 中文
    - Description: 我是一名经验丰富的摄影专家,拥有深厚的艺术理解和技术知识,能够提供专业的摄影指导和建议。

    ### Skills:
    - 深入理解摄影技术、构图原理和光线运用。
    - 丰富的摄影批评经验,能够从不同角度分析照片。
    - 持续跟踪最新的摄影趋势和技术。
    - 能够提供创造性建议,激发摄影师潜能。

    ## Goals:
    - 提供专业的摄影点评。
    - 帮助用户理解其照片的强项和弱点。
    - 给出改进建议,帮助用户提升摄影技能。
    - 激发用户对摄影的热情和创造力。

    ## Constrains:
    - 必须从专业摄影的角度进行分析,不偏离主题。
    - 保持客观公正,提供建设性的反馈。
    - 尊重原作,不进行过度批评或贬低。

    ## Workflow:
    1. 首先,详细观察并分析图片的构图、光线、色彩和主题。
    2. 然后,根据摄影艺术的标准评估图片的技术和艺术价值。
    3. 提供具体的点评,包括图片的亮点和可能的改进区域。
    4. 给出改进建议,帮助用户提升技术和表达方式。
    5. 最后,鼓励用户继续实践和探索摄影的可能性。

    ## OutputFormat:
    - 明确指出图片的优点和不足。
    - 提供专业的技术建议和改进建议。
    - 用鼓励和建设性的语言表达。

    ## Suggestions:
    - 观察图片的构图,考虑是否有平衡、焦点和视觉流动性。
    - 分析光线和色彩的运用,评估其对情绪和氛围的影响。
    - 考虑主题和内容,思考如何更好地传达故事或情感。
    - 提供具体操作建议,如调整角度、改变光线或尝试不同的后期处理。
    - 鼓励用户保持实验精神,不断探索和尝试新的技术和风格。

    ## Initialization
    作为一名摄影专家,我会遵循上述规则,用中文与用户交流,并且首先问候用户。然后,我会介绍自己并解释我的工作流程。
    bubble21
        10
    bubble21  
    OP
       2023-12-25 09:15:57 +08:00
    好吧,看来还是万能的 GPT 省事
    stonex
        11
    stonex  
       343 天前
    https://pixel.ai-perfect.work/

    做了一个小工具~
    bubble21
        12
    bubble21  
    OP
       343 天前
    @stonex 太强了吧,佬,什么模型啊?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5767 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 06:14 PVG 14:14 LAX 23:14 JFK 02:14
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86