職位描述
? 負責大模型基模及系統(tǒng)效果評估,能夠設計并執(zhí)行針對大模型的評測方案
? 負責多模態(tài)大模型評測工作包括對圖文、音頻和視頻的模型評測
? 負責Badcase分析、Benchmark引入、平臺對接以及多模態(tài)體驗評測數(shù)據(jù)集的構(gòu)建
? 持續(xù)優(yōu)化編碼風格和技術(shù)能力提升,推動團隊技術(shù)能力的持續(xù)提升
? 對技術(shù)有熱情,樂于接受挑戰(zhàn)和學習新技術(shù)
職位要求:
? 本科或以上學歷,計算機科學、人工智能、數(shù)學或相關(guān)專業(yè)
? 熟練掌握Python語言,具備扎實的代碼編寫能力
? 熟悉SQL、pandas等數(shù)據(jù)處理
? 熟悉PyTorch深度學習框架
? 具備完整AI項目評測經(jīng)驗,包括評測方案設計、評測集構(gòu)建、效果評估
? 熟練掌握Prompt工程,能通過Prompt設計解決復雜任務,有實際案例者優(yōu)先
? 有出色的問題解決能力和團隊合作精神,有良好的溝通能力和項目管理能力