CAD 智能识图 预处理图片分割问题请教 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
3297269
V2EX    机器学习

CAD 智能识图 预处理图片分割问题请教

  •  
  •   3297269 2023-10-31 09:57:54 +08:00 1086 次点击
    这是一个创建于 776 天前的主题,其中的信息可能已经有所发展或是发生改变。

    坐标设计院,应科改要求,领导想做一些智慧创新的东西,被临时抓来干活。。。 想实现的是 CAD 智能识图功能,我想的第一步是,在图纸上标注出说明/尺寸标注/表格等图元,通过深度学习,达到识别图元区域并输出,后续再对输出的区域做 OCR 识别。 现在我手头有 1000 张左右的 CAD 扫描图纸,分辨率极高,尺寸大约是 12000×8000 像素。我尝试着标注了几十张,将其 resize 到 640×640 像素,图纸直接马赛克了,看不清任何信息...学习的效果也非常非常差。

    我有几个问题请教,希望能给我一个大概的思路 1.该怎样对图片做预处理以在不丢失过多特征的前提下缩减像素?如果直接简单粗暴将每张图裁剪为等大的几份,会有一些图元被分割,这样影响学习效果吗?是否有开源项目可以裁剪出有内容的几小块,将空白舍弃? 2.如果学习时将图片裁剪了,那么识别时是否也应该先裁剪再分别输入?这样会丢失掉被分成两段的图元信息吗? 3.是否有现成的轮子可参考? 问的问题非常小白,各位大佬不吝赐教,感谢!!

    标注完的 CAD 图纸大概长这样 https://imgur.com/a/HYDdEQz

    6 条回复    2023-11-01 09:13:37 +08:00
    tool2d
        1
    tool2d  
       2023-10-31 10:04:38 +08:00   1
    你先把大图用传统的图片处理方法,分割成一小部分一小部分。这样才好有针对性训练图片分类吧。

    话说你这个需求,和带表格的 OCR 感觉没啥区别了。
    alexsz
        2
    alexsz  
       2023-10-31 10:12:26 +08:00   1
    这么大的图,就算模型已经训练出来了,实际检测的时候 上传图片要不少时间吧
    3297269
        3
    3297269  
    OP
       2023-10-31 10:35:09 +08:00
    @alexsz 实际检测时应该在本地,不上传
    3297269
        4
    3297269  
    OP
       2023-10-31 10:36:28 +08:00
    @tool2d 请问如果训练时分割了图片,使用时用完整图片,效果会不好吗?
    paopjian
        5
    paopjian  
       2023-10-31 10:39:12 +08:00   1
    没搞懂你的需求,你现在是需要分割图片吗?我看图片上这些留白都很清楚,那直接用传统 cv 的侵蚀扩展再配合 reseiz 不就可以标记出图片的位置,再微调下边框就可以切出来了
    或者直接试试 paddleocr 那个 PP-Structure 直接分析图标结构?
    3297269
        6
    3297269  
    OP
       2023-11-01 09:13:37 +08:00
    @tool2d
    @paopjian
    谢谢,我先去学习了解一下
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3221 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 11:20 PVG 19:20 LAX 03:20 JFK 06:20
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86