崗位職責:
1. 研究強化學習以及類強化學習技術,構造偏好數據、訓練大模型、設計新架構。
2. 數據構造及標注管理
3. 完成大模型強化學習領域科技成果,包括但不限于論文和專利。
任職資格:
1. 人工智能、計算機、電子工程、自動化、數學、物理等相關專業(yè)畢業(yè),獲得碩士和博士學歷,以及優(yōu)秀本科畢業(yè)生。
2. 對以下方向中的至少其中一個有研究或項目經驗:大模型、自然語言處理、深度學習、強化學習。熟悉分布式訓練框架,如Megatron-LM和DeepSpeed,并具備多機多卡大模型訓練經驗者優(yōu)先考慮。
3. 優(yōu)秀的編程能力,ACM/ICPC、IOI等編程競賽獲獎者優(yōu)先。
4. 具有良好的英語讀寫能力,可以完成英文論文寫作。
5. 有高質量論文發(fā)表者優(yōu)先 (如NIPS, ICLR, ACL, CVPR, ICCV, ECCV等),有較強學術比賽經驗者,有在開源社區(qū)有較大影響力者優(yōu)先。
6. 理論基礎扎實,有創(chuàng)新精神和深入思考能力。