强化学习算法工程师(A211935)
30-60K
强化学习算法工程师(A211935) 30-60K
北京
博士
经验不限
发布于 4月30日 BOSS直聘
职位描述
机器学习大模型算法自然语言处理算法C/C++Python强化RLHF
职位描述:
1. 完善和优化RLHF/RLAIF算法,基于RLHF/RLAIF等方法提升模型性能;
3. 根据业务需求开展研究,包括但不限于:Reward Model泛化性研究、RLHF中的exploitation/exploitation机制研究等;
4. 跟踪和研究学界/业界最新进展,包括Agent技术(工具调用、长短期记忆以及规划能力),基于LLM的多智能体交互以及基于LLM的数学/科学发现等。
职位要求:
1. 熟悉大模型技术栈,在强化学习领域,有解决实际问题的调优经验,NLP领域优先,有大模型的RLHF/RLAIF等经验优先;
2. 拥有计算机、自动化、电子等相关方向博士学位,具备独立研究能力,能够跟踪学术界最新的研究进展和业界最新应用;
3. 对数据有感知,具备从业务实际出发分析和解决问题的能力,以及良好的表达和沟通能力。
工作地址
北京海淀区启迪科技大厦B座百川智能
王女士本月活跃
百川智能 - 招聘经理

何先生 - 人事经理

Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
匹配度分析 立即分析

三个月内共 87 位应聘者投递了该职位,您的简历与该职位的匹配度为:323

较低
一般
较为匹配
非常匹配
公司信息
百川智能
计算机软件
100-499人
陕西百川文化传播股份有限公司于2003年10月21日在陕西省工商行政管理局登记成立。法定代表人陈郁洁,公司经营范围包括广告的设计、制作、发布、代理;办公用品、计算机软硬件及耗材等。