崗位職責
1、核心職責:研究確定大模型產(chǎn)品和項目技術(shù)路線;編制大模型項目技術(shù)方案;
2、負責大模型核心技術(shù)研發(fā)工作,包括模型訓(xùn)練、模型微調(diào)、模型推理、模型評測、模型安全、模型輕量化等圍繞大模型全鏈條的工具集和服務(wù)研發(fā);
3、負責大模型訓(xùn)練、推理等計算過程對國產(chǎn)或異構(gòu)算力資源的適配;
4、負責實現(xiàn)大模型分布式并行訓(xùn)練,并對硬件算力資源進行統(tǒng)一調(diào)度;
5、負責對垂直領(lǐng)域行業(yè)大模型訓(xùn)練提供支撐保障。
任職資格
1.計算機科學(xué)或人工智能等相關(guān)專業(yè),碩士及以上學(xué)歷;
2.有深度學(xué)習領(lǐng)域知識背景,了解基本的深度學(xué)習原理,熟悉常用的深度學(xué)習框架,如TensorFlow、PyTorch等;
3.熟悉Linux開發(fā)環(huán)境,具有良好的編程能力,熟悉計算機相關(guān)基礎(chǔ)知識,至少掌握以下一種編程語言:python/go/java;
4.熟悉大模型訓(xùn)練、微調(diào)等環(huán)節(jié)的原理和方法;
5.了解大規(guī)模分布式訓(xùn)練基本方法,了解混合精度訓(xùn)練、數(shù)據(jù)并行等訓(xùn)練加速方法;
6.了解高性能計算、GPU計算、GPU-CPU混合計算、云計算等;
7.有激情,責任心強,具有分析問題和解決問題的能力,具備良好的團隊合作精神和溝通能力。
加分項:
1.有深度學(xué)習框架的研究或開發(fā)經(jīng)驗者優(yōu)先;
2.有大規(guī)模AI訓(xùn)練和推理經(jīng)驗者優(yōu)先;
3.有大模型管理平臺開發(fā)經(jīng)驗者優(yōu)先;
4.熟悉DeepSpeed、Colossal-AI 等分布式并行訓(xùn)練框架者優(yōu)先;
5.985/211院校計算機/自動化/人工智能/遙感/地信等相關(guān)專業(yè)碩士/博士優(yōu)先。