崗位職責:
1. NVIDIA和AMD GPU 故障排查分析和與廠商配合解決故障
2. GPU相關故障整理和匯總
3. GPU廠商FA報告評審
4. PCIe 或者 OCP 網卡(包含DPU等)的故障排查分析、與廠商配合解決故障
5. 網卡相關故障整理和匯總
6. 網卡廠商FA報告評審
7. 部件Firmware管控
8. 配合其它一些C語言功能代碼實現
應征要求:
1. 計算機/電子/通信等相關專業(yè)本科及以上學歷
2. 熟練掌握C語言及shell或者python
3. 至少4年以上服務器GPU測試經驗或者網卡、DPU測試經驗
4. 熟練掌握GPU各種測試工具使用,如Nvqual,DCGM, Fieldiag等,熟練解析測試log,定位測試異常點
5. 熟練掌握網卡/DPU各種測試和監(jiān)測工具使用,如iperf, iperf3等,熟練解析測試log,掌握TCP/IP協(xié)議,熟練使用網絡抓包分析和定位問題
6. 對于GPU性能和網卡、DPU性能等常見問題有專業(yè)的分析方法和調優(yōu)方法
7. 熟練掌握嵌入式Linux下的多任務編程及調試
8. 能夠獨立完成模塊的設計,實現和調試
9. 熟悉外設常用的通信協(xié)議:I2C, MCTP, PCIe, NVMe
10. 熟練掌握Linux OS使用者佳