如何从"国家药品监督管理"局获取全量产品成分数据 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lxwlxc
V2EX    问与答

如何从"国家药品监督管理"局获取全量产品成分数据

  •  
  •   lxwlxc 2023-11-11 10:15:20 +08:00 1883 次点击
    这是一个创建于 715 天前的主题,其中的信息可能已经有所发展或是发生改变。

    发现一些 APP 能查到各种食品、化妆品成分数据,例如"成分喵"、"美丽修行"这种。好奇,他们是如何拿到数据的。

    我直接去国家药品监督管理局官方查询,每次搜索都需要验证码,所以他们怎么拿到全量数据的?是爬虫绕过验证码爬的、还是官方有合作渠道、还是别的手段,有知道的小伙伴吗?

    下面是成分喵截图:

    app 截图.jpg

    官网查询截图.jpg

    15 条回复    2024-10-17 23:35:56 +08:00
    mazyi
        1
    mazyi  
    PRO
       2023-11-11 11:36:19 +08:00 via iPhone
    卖数据的,只是不卖给你
    sakura6264
        2
    sakura6264  
       2023-11-11 12:13:02 +08:00
    这大概率不是个技术问题。
    lxwlxc
        3
    lxwlxc  
    OP
       2023-11-11 12:33:52 +08:00
    @mazyi 你是指官方内鬼卖数据?还是说有官方有合作渠道付费接口
    lxwlxc
        4
    lxwlxc  
    OP
       2023-11-11 12:34:59 +08:00
    @sakura6264 所以好奇他们什么渠道搞来的
    mazyi
        5
    mazyi  
    PRO
       2023-11-11 12:47:45 +08:00 via iPhone
    @lxwlxc 都可能有,但是你不知道,肯定就是没有了。据我所知,有些内部接口完全不公开的。
    Ericcccccccc
        6
    Ericcccccccc  
       2023-11-11 14:19:01 +08:00
    你感觉你做一个企查查能成立吗?
    me1onsoda
        7
    me1onsoda  
       2023-11-11 15:09:29 +08:00
    基本上是内部 api 。
    逆向国家机构的风控系统法律风险太大了。
    1145148964
        8
    1145148964  
       2023-11-11 15:13:28 +08:00
    这是人家的生意啊。
    lxwlxc
        9
    lxwlxc  
    OP
       2023-11-11 16:12:22 +08:00
    @Ericcccccccc 没这本事,所以老哥觉得上面 app 的数据怎么来的
    lxwlxc
        10
    lxwlxc  
    OP
       2023-11-11 16:14:11 +08:00
    @me1onsoda 我也觉得不太可能爬取或入侵国家官方系统,内部 api 是指和官方有合作吗?
    lxwlxc
        11
    lxwlxc  
    OP
       2023-11-11 16:15:24 +08:00
    @1145148964 不怕笑话,我本来也打算搞一个这种 app ,做一些特有的功能,后来发现拿不到数据
    PbCopy111
        12
    PbCopy111  
       2023-11-11 23:01:28 +08:00
    这个可以合法买数据啊,合法的。
    lxwlxc
        13
    lxwlxc  
    OP
       2023-11-12 21:22:11 +08:00
    @PbCopy111 #12 多谢回复,这么说,看来是有官方正规合作渠道
    lingalonely
        14
    lingalonely  
       2024-08-15 11:31:53 +08:00
    就是采集的,那美丽修行为例,他们在 16 年就采集了,那时候一个小团队,你觉得回去哪里买数据
    lxwlxc
        15
    lxwlxc  
    OP
       2024-10-17 23:35:56 +08:00 via Android
    @lingalonely 多谢回复,那就是绕过验证码或者自动识别验证码强行爬的?这么嚣张?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2556 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 11:17 PVG 19:17 LAX 04:17 JFK 07:17
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86