高薪内推|高性能计算工程师、大模型推理引擎研发工程师 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
外包信息请发到 /go/outsourcing 节点。
不要把相同的信息发到不同的节点
zeng27
V2EX    酷工作

高薪内推|高性能计算工程师、大模型推理引擎研发工程师

  •  
  •   zeng207 166 天前 2137 次点击
    这是一个创建于 166 天前的主题,其中的信息可能已经有所发展或是发生改变。
    base 上海,GPU 设计公司,不卷不加班,弹性工作不打卡,含中晚饭,补充公积金,交通补贴,每年节假日有礼金。
    如果遇到合适的可以 V 我,我帮你走内推渠道~
    V:TWFyaW5hXzEwOQ== (可联系)
    [高性能计算工程师]

    岗位职责:

    1. 研发高质量的芯片基础软件栈,包括支撑大语言模型在内的深度学习,线性代数,科学计算,信号处理等方向的基础加速库;

    2. 分析重要的性能指标,调优已有软件算法,并且对未来的软件进行优化和提升;

    3. 和硬件/应用的同事协同工作,一起对大语言模型,CV 模型,语音模型,推荐系统,科学计算和其他相关并行算法领域进行分析和优化;

    4. 负责 AI 模型推理/训练的端到端性能整体优化;

    5. 实现 AI/科学计算领域在 GPGPU 上的最新算法和最佳实践;

    6. 负责包括分子动力学、气象、量子力学等科学计算领域最新 AI 科学算法和传统算法在 GPGPU 上的实现和优化。



    任职要求:

    1. 熟悉 C++编程,了解常用数据结构及算法;

    2. 熟悉线性代数,科学计算,机器学习,深度学习,AI 算法等一个或多个领域;

    3. 熟悉 GPU 或 AI 加速芯片的体系结构,有过在不同架构芯片上的算法调优经验;

    4. 熟悉并行算法优化的基本技巧,有对算法性能进行分析和优化的经验;

    5. 熟悉计算机体系结构,操作系统;

    6. 以下情况优先:

    ( 1 ) GPU 的编程和优化经验,e.g. CUDA or OpenCL ;

    ( 2 )有过机器学习方面的开发经验,尤其是深度学习,熟悉 Tensorflow, Pytorch, TensorRT 等框架/引擎的原理和使用方法;

    ( 3 )有过视觉/大语言模型的开发和调优经验,熟悉 CNN/Transformer 等网络的性能瓶颈和优化方向,能够把握相关领域的国际前沿发展趋势;

    ( 4 )有过数据科学,统计科学,图像处理,信号处理等方面的开发和优化经历;

    ( 5 )有软硬件协同优化、基于异构硬件的软件开发经验者优先;

    ( 6 )了解微分方程求解的基本流程以及在 GPU 上优化的经验。有分子动力学、气象、以及量子力学等某一科学计算领域 AI 模型或者传统计算模型的开发经验。


    [大模型推理引擎研发工程师]
    岗位职责:

    负责天数大模型推理技术的探索与研发,提升大模型在天数 GPGPU 上的推理性能:

    1. 负责大模型推理引擎的架构设计与实现;

    2. 负责大模型 server 的架构设计与实现;

    3. 负责大模型推理通信库的设计及算法实现;

    4. 负责大模型相关算子的实现及推理性能的整体优化;

    5. 调研并支持大模型前沿算法;

    任职资格:

    编程基础(必须):

    1. 熟悉 Python/C++ 编程( 11 标准及以上),了解常用数据结构及设计模式;

    2. 熟悉深度学习编程框架,能够使用 PyTorch 构建大模型推理 pipeline 并对模型中的核心模块进行高效实现;

    3. 熟悉 CUDA 编程,了解常见算子的实现及优化手段;

    大模型推理技术(至少满足两项):

    1. 有 vLLM 、TGI 、SGLang 、TensorRT-LLM 等大模型推理框架的使用或优化经验;

    2. 了解 FlashAttention 、PagedAttention 、MoE 、Chunked Prefill 等大模型核心技术;

    3. 了解常见的大模型量化算法(如 AWQ 、GPTQ 、SmoothQuant 等)及量化算子的实现;

    4. 了解大模型通信算子(如 Allreduce 等)及计算通信 overlap 实现;

    5. 有分离式部署( PD 分离)开发经验。
    目前尚无回复
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5360 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 07:35 PVG 15:35 LAX 00:35 JFK 03:35
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86