崗位職責(zé):
1、大數(shù)據(jù)處理和分析·負(fù)責(zé)大數(shù)據(jù)的收集、組織、清理、分析,以提取支持業(yè)務(wù)決策的有價(jià)值的見解?!ぴO(shè)計(jì)和優(yōu)化數(shù)據(jù)存儲(chǔ)、清理和處理工作流程,以提高數(shù)據(jù)利用率?!みM(jìn)行數(shù)據(jù)探索,以識(shí)別關(guān)鍵業(yè)務(wù)指標(biāo)的潛在影響因素,并提供數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)見解。
2、機(jī)器學(xué)習(xí)建模和優(yōu)化·應(yīng)用機(jī)器學(xué)習(xí)算法和模型來解決實(shí)際業(yè)務(wù)問題,如預(yù)測分析、用戶行為分析和風(fēng)險(xiǎn)評估?!ぴO(shè)計(jì)、訓(xùn)練、優(yōu)化和部署機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,以增強(qiáng)業(yè)務(wù)預(yù)測能力?!ぴ谏a(chǎn)環(huán)境中進(jìn)行模型評估、超參數(shù)優(yōu)化和監(jiān)控模型性能,以不斷提高準(zhǔn)確性和性能。
3.大數(shù)據(jù)技術(shù)堆棧和數(shù)據(jù)工程·使用分布式計(jì)算框架(例如,Spark、Hadoop、Flink)處理PB級數(shù)據(jù),提高計(jì)算效率?!な煜ぴ破脚_(tái)(例如,AWS、Azure、GCP)上的數(shù)據(jù)存儲(chǔ)和計(jì)算優(yōu)化解決方案?!?gòu)建和優(yōu)化數(shù)據(jù)管道、ETL流程、數(shù)據(jù)倉庫和數(shù)據(jù)湖,以確保流暢、穩(wěn)定、高效的數(shù)據(jù)流。
4.數(shù)據(jù)可視化和決策支持·設(shè)計(jì)和開發(fā)可視化儀表板和報(bào)告(例如,Tableau、Power BI、Matplotlib、Seborn),使復(fù)雜的數(shù)據(jù)更加直觀和易于理解?!ねㄟ^A/B測試和因果推理等方法提供數(shù)據(jù)支持,以優(yōu)化業(yè)務(wù)策略。
5.跨團(tuán)隊(duì)協(xié)作和技術(shù)研究·與業(yè)務(wù)、產(chǎn)品和工程團(tuán)隊(duì)密切合作,了解業(yè)務(wù)需求,并提供數(shù)據(jù)驅(qū)動(dòng)的決策支持?!ぞo跟最新的行業(yè)技術(shù)發(fā)展,探索新的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)方法,并將其應(yīng)用到實(shí)際的業(yè)務(wù)場景中。
任職資格:
1、教育背景·計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)、數(shù)據(jù)科學(xué),或相關(guān)領(lǐng)域的本科及以上學(xué)歷。
2、專業(yè)技能·編程技能:精通Python(優(yōu)先)或R,具有扎實(shí)的編程基礎(chǔ),熟悉常用的數(shù)據(jù)處理和分析庫,如Scikit-Learning、XGBoost、TensorFlow、PyTorch、Pandas、NumPy、Matplotlib、Seborn等。·機(jī)器學(xué)習(xí):深入了解回歸、決策樹、隨機(jī)森林、XGBoost、深度學(xué)習(xí)(CNN、RNN、Transform)等算法,并能夠?qū)⑵鋺?yīng)用到實(shí)際項(xiàng)目中。·大數(shù)據(jù)處理:熟練掌握Hadoop、Spark、Flink、Kafka、Hive、HBase等大數(shù)據(jù)處理技術(shù),具備處理大規(guī)模數(shù)據(jù)的能力。·數(shù)據(jù)庫和SQL:熟悉SQL和非關(guān)系型數(shù)據(jù)庫(如MongoDB、Cassandra),具備高效數(shù)據(jù)查詢、存儲(chǔ)和管理的能力。·數(shù)學(xué)和統(tǒng)計(jì)學(xué):具有較強(qiáng)的數(shù)學(xué)和統(tǒng)計(jì)學(xué)基礎(chǔ),具備概率論、數(shù)理統(tǒng)計(jì)、線性代數(shù)、優(yōu)化方法等知識(shí)。
3.項(xiàng)目經(jīng)驗(yàn)·3年以上大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)經(jīng)驗(yàn),至少有3個(gè)完整的項(xiàng)目經(jīng)驗(yàn)?!⑴c數(shù)據(jù)挖掘、預(yù)測分析、機(jī)器學(xué)習(xí)模型開發(fā)等項(xiàng)目,具備獨(dú)立完成從數(shù)據(jù)采集、清洗、特征工程、模型訓(xùn)練和部署的整個(gè)過程的能力。·有MLOps(例如,MLflow、Kubeflow、Airflow)經(jīng)驗(yàn)者優(yōu)先,具有在生產(chǎn)中部署和監(jiān)控模型的能力。
4.個(gè)人能力和素質(zhì)·邏輯思維:具有較強(qiáng)的邏輯分析和解決問題的能力,能夠快速解決復(fù)雜的數(shù)據(jù)問題?!F(tuán)隊(duì)協(xié)作:具有出色的溝通能力和與來自不同背景的團(tuán)隊(duì)成員有效協(xié)作的能力?!?shù)據(jù)敏感性:對數(shù)據(jù)高度敏感,具有出色的數(shù)據(jù)分析和洞察力,能夠從數(shù)據(jù)中識(shí)別潛在的業(yè)務(wù)價(jià)值。·自我激勵(lì):具有較強(qiáng)的學(xué)習(xí)能力和好奇心,能夠持續(xù)關(guān)注數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的最新發(fā)展。
加分項(xiàng)(非必需,但優(yōu)先):
具有自然語言處理(NLP)、計(jì)算機(jī)視覺或推薦系統(tǒng)方面的經(jīng)驗(yàn),為業(yè)務(wù)擴(kuò)展提供額外的技術(shù)支持(例如,多語言文本分析、圖像識(shí)別、個(gè)性化推薦)?!な煜/B測試、因果推理和強(qiáng)化學(xué)習(xí)等方法。·有跨境或多語言數(shù)據(jù)處理經(jīng)驗(yàn),例如處理全球數(shù)據(jù)集以支持國際業(yè)務(wù)擴(kuò)展。