职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:
1、完成从网络设备选型、网络规划和设计、网络部署、网络安全评估到系统交付的建设全过程。
2、负责 GPU 集群的总体规划与建设,负责 AI 服务器、网络技术及国产化解决方案技术支持。
3、负责智能算力 IAAS 基础设施层的网络规划、GPU / DPU 等异构计算网络架构设计、智能算力网络整体方案交付。
4、负责智算及云计算项目的售后技术支持,智算平台计算/存储/网络架构设计和解决方案编写。
5、公司交办的其他任务等。
职位要求:
1、学历及专业:计算机网络或相关专业;全日制本科及以上学历,具备五年以上网络规划和运维经验。
2、精通 TCP / IP 、 VRRP 、 OSPF 、 BGP 、 VPN 、负载均衡等技术原理。
3、熟悉主流防火墙、安全网关的安装、配置和故障
排查。
4、熟悉 IB 、 RoCE 网络,有 NVIDIA 等 GPU 集群部署、调度、管理、优化经验优先:实施过 GPU / DPU 集群的网络规划,大规模部署、性能调优和整体交付,熟悉 IB 组网,组织裸机和虚机等方式的 GPU 资源和服务经验者优先。
5、满足以下至少1条开发经验要求:
--- RDMA 协议的应用优化及拥塞控制算法优化工作经验,熟悉 IB 网络/ RoCE
--- GPU 卡集群部署的性能优化工作经验,了解 GPU 互联,熟悉 NVLINK 、 NVSWITCH
--- GPU 虚拟化,至少熟悉 vCUDA 、 cGPU 、qCUDA 、 rCUDA 等一种虚拟化方案
--- CUDA 和 NCCL 的优化工作,熟悉 CUDA 算子库、runtime 、 driver 库相关 API
6、具有思科 CCIE 和华为数 HCIE 通证书者优先录用。
7、富有事业心和团队合作精神,有很强的技术沟通能力和技术文档编辑能力。
工作地点
地址:武汉江汉区武汉-江汉区武汉市江汉区新华路186号福星国际商贸大厦4楼
![](http://img.jrzp.com/jrzpfile/rcw/SearchJob/images/jg.png)
![](https://img.jrzp.com/images_server/comm/nan1921.png)
职位发布者
HR
福星惠誉控股有限公司
![](http://img.jrzp.com/jrzpfile/provincercw/images/sfrz_yrz.png)
-
房地产开发·建筑与工程
-
500-999人
-
私营·民营企业
-
福星国际商会大厦