注意:需接受派駐廣西地區(qū)項(xiàng)目或長(zhǎng)期出差廣西地區(qū)項(xiàng)目
一、核心職責(zé)概述
負(fù)責(zé)企業(yè)IT基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的全生命周期管理,涵蓋容器化部署、自動(dòng)化運(yùn)維、服務(wù)監(jiān)控、安全合規(guī)、資源規(guī)劃等領(lǐng)域,保障系統(tǒng)高可用性、安全性及穩(wěn)定性。
二、具體職責(zé)范圍1. 應(yīng)用部署與維護(hù)
負(fù)責(zé)在容器集群(Kubernetes、天翼云容器服務(wù))?、虛擬機(jī)(VMware/OpenStack)、物理機(jī)等環(huán)境中部署、升級(jí)和回滾應(yīng)用系統(tǒng)。
設(shè)計(jì)容器化部署方案,優(yōu)化鏡像構(gòu)建流程(Dockerfile編寫(xiě)、Harbor鏡像倉(cāng)庫(kù)管理)。
配合開(kāi)發(fā)團(tuán)隊(duì)完成應(yīng)用環(huán)境適配,解決跨平臺(tái)部署兼容性問(wèn)題。
2. 持續(xù)集成與持續(xù)交付(CI/CD)?
在Jenkins中設(shè)計(jì)和維護(hù)自動(dòng)化部署流水線(xiàn)(Job配置),支持Java(Maven構(gòu)建)、Node.js等語(yǔ)言的項(xiàng)目構(gòu)建與發(fā)布。
集成代碼倉(cāng)庫(kù)(GitLab)、制品庫(kù)(Nexus)、鏡像倉(cāng)庫(kù)(Harbor)等工具鏈,實(shí)現(xiàn)代碼提交到生產(chǎn)環(huán)境的全流程自動(dòng)化。
優(yōu)化CI/CD流程,提升部署效率,保障發(fā)布過(guò)程的穩(wěn)定性。
3. 中間件與工具鏈運(yùn)維
運(yùn)維以下核心工具及服務(wù):
?容器生態(tài):Docker、Harbor(鏡像倉(cāng)庫(kù))
?開(kāi)發(fā)協(xié)作:GitLab(代碼倉(cāng)庫(kù))、Nexus(制品庫(kù))、Minio(對(duì)象存儲(chǔ))
?數(shù)據(jù)庫(kù)與中間件:MySQL、Redis、MongoDB、ELK(日志分析)、RabbitMQ/ActiveMQ(消息隊(duì)列)
?微服務(wù)組件:Nacos(服務(wù)注冊(cè)發(fā)現(xiàn))、Keepalived(高可用)、Sentinel(流量控制)、SkyWalking(APM)
負(fù)責(zé)安裝、配置、監(jiān)控、擴(kuò)容、故障排查及版本升級(jí),保障服務(wù)可用性。
4. 監(jiān)控與告警體系建設(shè)
基于Prometheus搭建指標(biāo)監(jiān)控系統(tǒng),通過(guò)Grafana實(shí)現(xiàn)可視化看板配置。
監(jiān)控容器集群、微服務(wù)、中間件的性能指標(biāo)(CPU/內(nèi)存/網(wǎng)絡(luò))、業(yè)務(wù)健康狀態(tài)(API成功率、延遲)。
配置告警規(guī)則(如Prometheus ************),聯(lián)動(dòng)企業(yè)微信/釘釘/Slack等通知渠道,實(shí)現(xiàn)異常實(shí)時(shí)響應(yīng)。
5. 安全合規(guī)與漏洞管理
配合等保測(cè)評(píng)要求,完成服務(wù)器安全基線(xiàn)配置(SSH加固、權(quán)限最小化)、漏洞修復(fù)(如操作系統(tǒng)補(bǔ)丁、軟件版本升級(jí))。
定期執(zhí)行安全掃描(如Nessus、OpenVAS),修復(fù)高風(fēng)險(xiǎn)漏洞(如Log4j、Fastjson漏洞)。
制定安全加固方案,例如數(shù)據(jù)庫(kù)訪(fǎng)問(wèn)控制、敏感數(shù)據(jù)加密(Minio TLS配置)、防火墻策略?xún)?yōu)化。
6. 基礎(chǔ)設(shè)施規(guī)劃與優(yōu)化
參與硬件資源規(guī)劃,評(píng)估服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)資源需求,設(shè)計(jì)高可用架構(gòu)(如Kubernetes多節(jié)點(diǎn)集群、數(shù)據(jù)庫(kù)主從復(fù)制)。
優(yōu)化云資源使用(如天翼云資源配額管理),配合網(wǎng)絡(luò)團(tuán)隊(duì)完成VPC、負(fù)載均衡、防火墻規(guī)則設(shè)計(jì)。
推動(dòng)容器化遷移與資源利用率提升(如HPA自動(dòng)擴(kuò)縮容)。
7. 文檔與協(xié)作支持
編寫(xiě)運(yùn)維操作手冊(cè)、故障處理預(yù)案、系統(tǒng)架構(gòu)圖。
協(xié)助開(kāi)發(fā)團(tuán)隊(duì)定位線(xiàn)上問(wèn)題(如通過(guò)SkyWalking分析鏈路異常)。
參與跨部門(mén)協(xié)作,如配合架構(gòu)師完成微服務(wù)治理方案設(shè)計(jì)。
三、附加能力要求
?技術(shù)棧深度:熟悉Linux系統(tǒng)管理、Shell/Python腳本編寫(xiě),了解微服務(wù)架構(gòu)(Spring Cloud/Alibaba)。
?問(wèn)題導(dǎo)向:具備快速定位故障能力(如通過(guò)ELK分析日志、通過(guò)Redis慢查詢(xún)定位性能瓶頸)。
?安全意識(shí):熟悉等保2.0標(biāo)準(zhǔn),掌握常見(jiàn)漏洞修復(fù)方法(如CVE漏洞處理)。
?工具整合能力:能將分散的工具(如Prometheus+************+Grafana)整合為統(tǒng)一監(jiān)控平臺(tái)。
四、工作目標(biāo)
?穩(wěn)定性:保障系統(tǒng)全年可用率≥99.95%,平均故障恢復(fù)時(shí)間(MTTR)≤30分鐘。
?自動(dòng)化:實(shí)現(xiàn)90%以上的日常操作自動(dòng)化(如日志清理、備份、巡檢)。
?成本優(yōu)化:通過(guò)資源調(diào)度策略(如K8s彈性伸縮)降低云資源成本10%-20%。
?安全合規(guī):通過(guò)等保測(cè)評(píng)并持續(xù)滿(mǎn)足合規(guī)要求