崗位職責(zé):
1、結(jié)合實際業(yè)務(wù)場景,規(guī)劃設(shè)計AI產(chǎn)品中智能語言理解交互的技術(shù)方案;
2、負責(zé)大語言模型及多模態(tài)大模型的研發(fā)與優(yōu)化,包括但不限于模型訓(xùn)練調(diào)優(yōu)、推理加速等工作,提升模型在政務(wù)相關(guān)場景的性能;
3、負責(zé)跟進領(lǐng)域最新進展,探索將前沿的算法應(yīng)用于實際業(yè)務(wù),包括不僅限于Agent、多輪對話、圖像識別的研發(fā)落地工作。
崗位要求:
1、本科及以上學(xué)歷,三年以上工作經(jīng)驗,計算機相關(guān)專業(yè),深刻理解計算機原理,有良好的數(shù)據(jù)結(jié)構(gòu)和算法基礎(chǔ),有扎實的編程能力;
2、對傳統(tǒng)和前沿的NLP/LLM、機器學(xué)習(xí)、數(shù)據(jù)挖掘等相關(guān)技術(shù)都有深刻的了解和相關(guān)項目經(jīng)驗(包括但不限于Transformer、BERT、GPT等),對DeepSeek-R1所使用技術(shù)有較深理解或者實踐者優(yōu)先;
3、對CV領(lǐng)域有深入的理解,在多模態(tài)模型(LLaVa、InternVL、Qwen2.5-VL等)有深入的研究經(jīng)歷者優(yōu)先;
4、具有在大模型訓(xùn)練、微調(diào)方面的實戰(zhàn)經(jīng)驗,熟練使用Python或者C++等編程語言,熟悉主流深度學(xué)習(xí)框架(如PyTorch、TensorFlow等),具有較強的算法工程落地能力和經(jīng)驗;
5、有大模型推理加速經(jīng)驗者優(yōu)先,包括但不限于vLLM、SGLang等;
6、熟悉Al Agent的原理和應(yīng)用,有相關(guān)項目開發(fā)經(jīng)驗者優(yōu)先;
7、學(xué)習(xí)能力強,邏輯思維清晰,較強的文獻閱讀能力,有較強的自我驅(qū)動力和問題解決能力,有軟件工程能力者優(yōu)先;
8、要求抗壓能力強,樂于主動分享和溝通技術(shù)。