井底之蛙问问,国内有 AI 方面的储备人才吗 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
Toby2021
V2EX    程序员

井底之蛙问问,国内有 AI 方面的储备人才吗

  •  
  •   Toby2021 2023-04-06 14:56:34 +08:00 7360 次点击
    这是一个创建于 918 天前的主题,其中的信息可能已经有所发展或是发生改变。

    昨天在某群看到个 jd ,金融公司招聘 AI 工程师,ChatGPT 火了也有一段时间了,可以理解各大头部公司都进行相关部署,但是我比较好奇国内这方面人才究竟...多吗?或者...有吗?他们一般在哪里?

    我知道这些年计算机很热门,人才不人才咱先不论,人肯定是不少,但是学计算机的大多不会也去搞 AI ,哪怕搞 AI 也不是做大语言模型,毕竟资源门槛太高了。不过我觉得大概率是我井底之蛙了,有没有圈内的老哥,可以给咱科普一下,不胜感激~

    前段日子文心一言出来,大家都说想借着它看看与国际的差距,结果也没啥下文了,沦为了不少段子手的创作工具,加之百度垄断搜索引擎后干的不少缺德事,有些人对百度有先入为主的负面意见,也就很难客观评价了。下周是不是阿里的模型也要问世了?

    附一下 JD 的前面一小部分,应该不涉及泄露隐私: 岗位名:对话式 NLP 工程师 /Chatbot 工程师 /LLM 工程师 /大规模语言模型工程师 /多模态工程师 /NLG 、AIGC 大模型工程师 1 、熟悉掌握 NLP 模型效果调优基本手段,能独自完成效果优化,具备 NLP 大模型训练经验者优先,如 BERT 、GPT-3 、chatGPT 等 LLM 等相关经验;

    第 1 条附言    2023-04-07 15:49:36 +08:00
    经过几位回复朋友的提点,我意识到自己提问过于宽泛了,标题有哗众取宠之嫌疑。某位朋友说的对,如果不是 ChatGPT 我不会来问这个问题,所以我其实想知道的是国内 LLM 方面的发展水平,而非广义上的 AI ,提问方式给人一种 AI=LLM 的感觉,实在欠妥,诸君抱歉。
    50 条回复    2023-04-07 21:20:55 +08:00
    ljrdxs
        1
    ljrdxs  
       2023-04-06 15:25:49 +08:00
    “具备 NLP 大模型训练经验者优先,如 BERT 、GPT-3 、chatGPT 等 LLM 等相关经验”
    我不太熟悉这块。我觉得奇怪,后面 3 个不是开源吧?所以,要谷歌或 Open AI 的员工?这种太难招了吧……
    echoless
        2
    echoless  
       2023-04-06 15:33:49 +08:00   6
    这种你看看就好了, 没有要求 gpt-3 5-10 年经验已经很给你们打工人面子了, 不要不识好歹.
    Biluesgakki
        3
    Biluesgakki  
       2023-04-06 15:41:27 +08:00   1
    说明这个公司屁都不懂
    vsitebon
        4
    vsitebon  
       2023-04-06 15:44:48 +08:00   5
    如果只是 GPT 中的核心 Transformer 结构,一直做 NLP 方向的不可能没接触过,那你就可以认为接触过这个的是储备人才。进一步地说,GPT-2 是开源的,你可以认为之前有做过依赖 GPT-2 的是储备人才。但如果你希望一定是也接触过大数据集的和深入了解且实践过 GPT-3 中人工反馈环节之类的算法人才 /工程师,那人数可能就会锐减。不过比起这个,国内的数据源的清洗难度,以及一些公司的急功近利的想法反而更会影响到国内能否做大模型这个问题的结果。
    guiyun
        5
    guiyun  
       2023-04-06 15:46:25 +08:00
    我自己用了一下文心一言,感觉和 ChatGPT 没拉开那么大的差距,感觉在发展个 1 年就能到 ChatGPT 的现在的水平了
    d94IgFQK17R50xY0
        6
    d94IgFQK17R50xY0  
       2023-04-06 15:50:42 +08:00
    @guiyun :文心一言,是披着马甲
    lostberryzz
        7
    lostberryzz  
       2023-04-06 15:58:14 +08:00
    hefish
        8
    hefish  
       2023-04-06 16:38:16 +08:00
    招聘这事儿,有时候也是展现企业文化的一个东西。 招的越高端,越能体现企业的档次。
    有时候不是为了招到人,而是为了展现档次。
    GP1
        9
    GP1  
       2023-04-06 16:54:01 +08:00
    了解这干啥?当猎头了吗?这方面人才基本都在高校和大厂里,
    普通公司就不要考虑,继续业务搬砖吧。
    GrayXu
        10
    GrayXu  
       2023-04-06 17:36:00 +08:00   1
    你的论据“学计算机的大多不会也去搞 AI”就错的比较没边了,别说学生,大多数老师们也希望自己的方向能尽量和热门方向贴合。虽然做 NLP 做 LLM 的比例没那么高,但问有没有这种人才这种问题确实。。。
    ktqFDx9m2Bvfq3y4
        11
    ktqFDx9m2Bvfq3y4  
       2023-04-06 17:41:33 +08:00
    @guiyun #5
    你说的文心一言和 ChatGPT 的差距没那么大是 ChatGPT3.5 还是 4 ?因为 3.5 和 4 的差距就不小,尤其是你问得问题越复杂(越难),越明显。
    Juszoe
        12
    Juszoe  
       2023-04-06 20:11:10 +08:00
    “学计算机的大多不会也去搞 AI”,读研究生,AI 是最火的方向了,计算机方向搞学术,和 AI 沾点边才好发论文。
    如果你有关注视觉领域方向的论文,会发现华人 /国人非常多
    HungryOrangeCat
      &nbs; 13
    HungryOrangeCat  
       2023-04-06 20:15:04 +08:00
    @ludesala777 咱技术人就别看 B 站上那些营销号瞎解说了,那个文生图的文心一格是套的,文心一言 ernie 是百度自己的,可以上 github 看,我觉得那个知识图谱增强的 idea 还挺 novel
    evan9527
        14
    evan9527  
       2023-04-06 20:28:28 +08:00
    国外要先开源,国内才有能力自研。
    Toby2021
        15
    Toby2021  
    OP
       2023-04-06 21:29:38 +08:00
    @Juszoe
    @GrayXu
    两位都对我问题中“学计算机的大多不会去搞 AI”的说法产生质疑,我本意是指所有计算机相关专业的学生,包括基数最庞大的本科生、专科生群体,而非特指研究生及以上群体,但转念一想,既然谈论的是 AI 人才,我觉得默认从研究生开始考虑确实更加妥当,所以我承认我的表述不准确,请各位无需再纠结这一处表述了。

    其实我想问的更具体点就是大语言模型这块,提问的初衷也是看到了群里的 JD 想知道如果大型商业公司想招聘这样的人,国内真的有足够这方面的人才能满足他们的需求吗。
    另外我自己也想起来之前看到过清华开源的语言模型 ChatGLM ,他们 Group 的研究就成果斐然。我只是想知道还有哪些类似这样的研究、课题组,多了解一些。
    我并没有在否定国内的研究和发展,只是见识短浅所以想问一问,提问是一个设问句,并非反问句。
    liuidetmks
        16
    liuidetmks  
       2023-04-06 21:32:34 +08:00
    百度招过吴恩达陆奇这类学术人才,
    其他公司如果招聘这样的人物,也能让人看出你的决心
    LaurelHarmon
        17
    LaurelHarmon  
       2023-04-06 21:40:56 +08:00 via Android
    这个你尽管放心,你随便去个好点的大学的计算机或者软件学院看看,大把大把的老师在做 AI 相关的,甚至通信电子机械遥感都往这边硬蹭。更何况前几年各大高校争先恐后成立人工智能学院,数据科学人工智能相关的学生茫茫多。
    国内 AI 论文数量仅次老美,顶会基本刷到手软,另一方面,深度学习的繁荣也养活了太多了本硕学生的毕业课题。
    你觉得少只是因为你平常没有关注到。所以 chatGPT 这一块,不说最尖端的突破创新,照猫画虎做一个八九不离十的还是松松的。
    GrayXu
        18
    GrayXu  
       2023-04-06 21:57:49 +08:00
    @Toby2021
    AIGC 更像是个商业概念吧,这些相关技术不是一夜之间出现的,都是螺旋上升的

    国内较强的 NLP 高校实验室有哪些? https://www.zhihu.com/question/451102718
    csranking 也有细分领域的高校老师列表 https://csrankings.org/#/fromyear/2017/toyear/2023/index?nlp&cn
    yoa1q7y
        19
    yoa1q7y  
       2023-04-06 22:01:49 +08:00
    @guiyun 然而 ChatGPT 也不是原地踏步啊,再过 1 年谁知道 ChatGPT 会发展到什么程度了
    Tompes
        20
    Tompes  
       2023-04-06 22:06:09 +08:00
    NLP 这个领域贼卷,做的人挺多的,但是他这个 jd 看了真的尴尬。。。
    TomsOutside
        21
    TomsOutside  
       2023-04-06 22:27:47 +08:00
    unco020511
        22
    unco020511  
       2023-04-06 22:34:22 +08:00
    起码百度腾讯阿里是有真技术人才储备的,特别是百度在 AI 上技术不差的,国内顶级,人才自然也不少
    TomsOutside
        23
    TomsOutside  
       2023-04-06 22:38:50 +08:00
    AI 自己的回答:

    mrpzx001
        24
    mrpzx001  
       2023-04-06 22:42:23 +08:00
    @HungryOrangeCat 套的哪家?
    wateryessence
        25
    wateryessence  
       2023-04-06 22:42:48 +08:00
    Xoper
        26
    Xoper  
       2023-04-07 00:01:42 +08:00
    国内好多都是用 GPT 3.5 的 API 来训练的,所以最近各种模型都出来了,上次看到个模型几天用了几万个帐号跑了 100w 个问题
    pC0oc4EbCSsJUy4W
        27
    pC0oc4EbCSsJUy4W  
       2023-04-07 00:42:28 +08:00
    有啊,几年前就有了
    TWorldIsNButThis
        28
    TWorldIsNButThis  
       2023-04-07 01:00:25 +08:00
    openai 很多清华的
    L4Linux
        29
    L4Linux  
       2023-04-07 08:07:47 +08:00 via Android
    水论文的人才而已,大约 8 成的文章都没啥用吧。
    Kokomashiro
        30
    Kokomashiro  
       2023-04-07 08:31:43 +08:00   1
    "但是学计算机的大多不会也去搞 AI ,哪怕搞 AI 也不是做大语言模型"
    SpikeX
        31
    SpikeX  
       2023-04-07 08:38:51 +08:00
    lz ,你发的 JD 待遇给的多少,什么城市?海外找个 1-2 年经验的 remote 开发待遇就比二线 NLP 强多了
    diagnostics
        32
    diagnostics  
       2023-04-07 08:56:16 +08:00 via iPhone
    @guiyun 直接套壳肯定差距不大啊,因为背后就是 chatgpt
    Lykos
        33
    Lykos  
       2023-04-07 09:01:05 +08:00
    怎么 v 站也有信百度是套壳的啊,平常都瞧不起短视频营销号,然后一个比一个信是吧
    jifengg
        34
    jifengg  
       2023-04-07 09:07:31 +08:00
    LLM 只是 ai 的一个方向而已。之前接触或了解过的,至少 3 年前,国内就有很多 ai 人才了,当然不一定是 LLM 的。
    说实话,在互联网上还是能看到很多百度和腾讯在 ai 这方面的成绩的。
    0littleboy
        35
    0littleboy  
       2023-04-07 09:09:38 +08:00
    @Lykos 谁让百度口碑这么差呢,说的深耕十几年结果就出来这玩意
    Lykos
        36
    Lykos  
       2023-04-07 09:11:52 +08:00
    @0littleboy #35 口碑差可以直接骂百度是屎,没必要去吃营销号拉的屎
    dif
        37
    dif  
       2023-04-07 09:26:06 +08:00   2
    国内很多公司其实挺搞笑的,啥技术热就赶紧开会弄啥技术。记得以前大数据火的时候,有些小公司搞大数据,结果数仓里连 100G 数据都没得。后来数据湖概念出来了,又有些小公司开始写 PPT 了。再后来数据中台火了,我听过身边的朋友同事几乎所有公司都在埋头苦干数据中台,甚至调整公司组织架构什么大前台,大中台,大后台的。最后都是一地鸡毛。最近 chatgpt 火了,我这边又听到开 chatgpt 的会议了。我在想,全公司连一个 nlp 的开发都没得,还扯个 P 犊子。

    当然,国企会做课题,来申请特殊预算。之前帮某国企的一个小课题,非常简单,甚至他们自己百度都能搞,但就是不做(或许可以理解为宏观调控,故意放水一些毫无难度且毫无用处的课题,让社会上的小公司中标然后活着)。

    回到原题,国内又 AI 方面的储备人才吗? 目前我工作的地方算是有(类似外包在国企做项目),并且已经 5 年了,只不过没啥成果罢了,所以储备有没有,肯定有,是不是人才就不知道了。
    zxCoder
        38
    zxCoder  
       2023-04-07 09:47:30 +08:00
    @L4Linux 8 成? 10 成!
    rb6221
        39
    rb6221  
       2023-04-07 10:00:36 +08:00
    首先 gpt 和大语言模型的细分方向在整个 AI 里面也只是一个方向而已,如果 ChatGPT 不火你也不会发这个帖子了。
    ChatGPT 也是研究了很久释出的一个产品,又不是一夜就冒出来的,他们也是招了很多人花了很多年才做出来,为什么国内不应该是这样?
    那既然国内是这样,你就不能因为文心一言来表达国内人才少,谁不是慢慢做出来的
    kaddusabagei38
        40
    kaddusabagei38  
       2023-04-07 10:05:02 +08:00   1
    有人才储备,我国有世界领先的人数相当多的优秀审查产业,一定能开发出优秀的审查 AI
    e3c78a97e0f8
        41
    e3c78a97e0f8  
       2023-04-07 10:09:43 +08:00 via iPhone
    其实 ChatGPT 出来前我一直觉得中国在 AI 这个领域快要超越美国了

    现在发现美国还是当之无愧的第一

    不过老二比别的国家还是强很多
    /div>
    alne
        42
    alne  
       2023-04-07 10:16:08 +08:00
    可以去看看 CV 顶会,挺多国人的
    houshuu
        43
    houshuu  
       2023-04-07 10:16:55 +08:00
    如果只是接触过相关技术, 那这两年所有的自然语言处理和视觉相关的研究方向毕业的研究生都能在这类工作里搬砖.
    但大型模型最缺的知识其实是如何稳定训练模型和快速决策调优方向, 这块目前没钱还真没法练手, 有这技术的大部分公司也是藏着掖着不会分享的.
    pkoukk
        44
    pkoukk  
       2023-04-07 10:18:28 +08:00
    @guiyun 99 和 100 虽然只差了 1 ,但是所要付出的努力可能超过 1-99.
    arthas2234
        45
    arthas2234  
       2023-04-07 10:27:26 +08:00
    据说文心一言达到了 GPT-3 ,实力还是有的,只是百度这几年口碑太差大家都在冷嘲热讽
    我觉得有差距没问题,但是不能啥都没有
    yarawen
        46
    yarawen  
       2023-04-07 10:37:32 +08:00
    王者荣耀里的绝悟人机还是很强的。 这应该不是 if else 写的吧?
    Yeen
        47
    Yeen  
       2023-04-07 14:38:40 +08:00
    先拿出有分量的重量级 paper 和实践工程来看看。
    datou
        48
    datou  
       2023-04-07 16:08:43 +08:00
    @Lykos 用过文心一格,个人判断就是 stable diffusion 套壳

    文心一言没用过,不评论
    Ne
        49
    Ne  
       2023-04-07 21:11:16 +08:00
    @arthas2234 https://imgloc.com/i/ir9Cpb .早餐店看到文心都要流泪了
    HungryOrangeCat
        50
    HungryOrangeCat  
       2023-04-07 21:20:55 +08:00
    @mrpzx001 文心一格大概率是 stabledifusion 微调或者同款训练集,文心一言是百度自己的
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2847 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 14:18 PVG 22:18 LAX 07:18 JFK 10:18
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86