阿里国际--大模型强化学习对齐算法工程师
30-60K
阿里国际--大模型强化学习对齐算法工程师 30-60K
杭州
学历不限
经验不限
发布于 3月30日 BOSS直聘
职位描述
强化学习语音算法发表算法相关优秀论文参加算法相关竞赛/获奖
AI Business成立于2023年4月,是阿里国际数字商业集团(AIDC)设立的一层业务组织,专注于AI技术能力建设和AI产品能力输出,旨在用最先进的AI技术重塑平台竞争力,为商家和用户带来极致的电商体验。 算法团队主攻三个方向:多语言的电商大模型训练,对话模型和下游任务,图像生成能力。AI Business 的 AI 服务已应用在阿里国际内部的 AliExpress(速卖通)、Trendyol、Daraz 等业务,主要包括商品信息本地化、图像设计、客服机器人、客服翻译等场景。
11 月,基于自研的 LLM 模型,AI Business 团队正式对外发布具备翻译、营销、本地化内容、设计等一系列功能的 AI 产品 “Aidge”,除了支持阿里国际各业务,还将接口开放给了独立软件服务商(ISV)和 SaaS 服务商,以供他们在此基础上开发出更符合商家需求的产品。
AI Business 的 AI 服务已应用在阿里国际内部的 AliExpress(速卖通)、Trendyol、Daraz 等业务,主要包括商品信息本地化、图像设计、客服机器人、客服翻译等场景。
1. 负责研究并开发针对大型语言模型的强化学习算法(RLHF)和技术,设计并实施对齐策略,以使语言模型的行为与人类偏好保持一致,优化大语言模型在各类落地场景的效果;
2. 研究和探索带有业务特性的偏好建模算法,指导对齐算法的优化方向,为对齐效果提供量化评估标准;
3. 通过深入实验和基准测试分析和评估强化学习算法和对齐技术的性能;
4. 不断跟进工业界和学术界强化学习对齐算法的研究进展,结合业务场景进行算法创新。
职位要求
1. 硕士及以上学历,计算机、数学、自然语言处理等相关专业,博士优先;
2. 具有大型语言模型的实际经验,在强化学习方面具有丰富的专业知识,包括深度强化学习算法及其在语言模型中的应用。
3. 熟悉深度学习框架,如TensorFlow、PyTorch等,有扎实的编程基础和代码实现能力;
4. 具备良好的沟通、协作和解决问题的能力,能够与团队成员密切合作,共同解决问题;
符合以下条件者优先:
1. 有大语言模型RLHF实际训练和落地经验
2. 在强化学习、对齐或语言建模方面在顶级会议或期刊上发表过论文
3. 在大语言模型或强化学习开源项目中有贡献或积极参与
工作地址
杭州余杭区阿里巴巴西溪A区A1