
本人目前从事大模型工作,8 个月之前从后端工程转到做大模型,目前大模型相关技能都掌握,但是停留在操作层面,原理掌握的很浅,如果面试大模型算法岗位,有哪些方法或者资料,求大佬们分享
1 metmit 304 天前 大佬,怎么转的,自己做项目、还是公司内部给的机会? |
2 metmit 304 天前 t/1110790?p=1#; 这个帖八楼有分享 |
3 yukino 304 天前 读读基础论文 Attention is all you need 再看看简单代码 nanoGPT 之后就看看 sparse attention 跟强化学习吧 |
4 gewuzhizhi OP @metmit 自己换方向找的,现在做大模型的工程方向。但是算法做的 stf 啥的都会操作,我就想针对面试学习一下 |