大模型算法实习生(A119748)
250-400/天
大模型算法实习生(A119748) 250-400/天
北京
硕士
5天/周
3个月
发布于 5月21日
职位描述
PythonTensorFlowPyTorch
职责描述: 1. 参与LLM前沿技术探索,包括但不限于训练数据建设、模型预训练、对齐优化、MoE、模型自动评估等工作; 2. 负责LLM对齐效果的优化和提升,包括数据质量优化、指令微调、基于反馈的训练策略优化,推动算法性能达到行业领先; 3. 参与LLM在小米内部落地应用的相关工作。 任职要求: 1. 计算机或相关专业硕士及以上,发表过大模型相关研究AI顶会论文优先。 2. 熟悉Python,熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案。 3. 具备NLP经验,对BERT,T5,chatGPT,Llama,GLM等模型的原理与差异有深入了解。 4. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法,乐于挑战自我。
工作地址
北京市/北京市/海淀区
相似职位推荐