負責大規(guī)模文本數(shù)據(jù)和復(fù)雜數(shù)據(jù)集的深度分析,運用自然語言處理(NLP)技術(shù)進行關(guān)鍵詞提取、命名實體識別、文本分類、情感分析、主題建模和事件檢測與追蹤。
應(yīng)用機器學(xué)習(xí)(ML)算法(包括監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、傳統(tǒng)ML模型及深度學(xué)習(xí)模型如CNNs, RNNs, Transformers, GNNs)進行趨勢預(yù)測、模式識別和用戶行為分析。
參與高級分析功能的研發(fā),如多模態(tài)數(shù)據(jù)分析、異常行為識別及基于大語言模型(LLM)的文本分析與內(nèi)容生成。
構(gòu)建和維護風險評估指標體系,參與異常檢測模型的開發(fā)與優(yōu)化。
與團隊成員協(xié)作,將分析結(jié)果通過可視化方式呈現(xiàn),為決策提供數(shù)據(jù)支持。
參與MLOps流程,包括數(shù)據(jù)管理、模型訓(xùn)練、評估、部署及監(jiān)控,確保模型持續(xù)有效。
任職要求:
計算機科學(xué)、統(tǒng)計學(xué)、數(shù)據(jù)科學(xué)或相關(guān)領(lǐng)域本科及以上學(xué)歷。
扎實的自然語言處理和機器學(xué)習(xí)理論基礎(chǔ),熟悉常用的算法和模型。
熟練掌握至少一種主流編程語言(如Python),并熟悉相關(guān)的數(shù)據(jù)分析和機器學(xué)習(xí)庫(如Scikit-learn, TensorFlow, PyTorch, Transformers, spaCy, NLTK)。
熟悉大數(shù)據(jù)處理框架者優(yōu)先(如Apache Spark, Apache Flink)。 具備數(shù)據(jù)可視化工具使用經(jīng)驗者優(yōu)先。
具備良好的邏輯思維能力、數(shù)據(jù)敏感度和解決問題的能力。
具備良好的溝通能力和團隊合作精神。
有MLOps實踐經(jīng)驗者優(yōu)先。