[英伟达上海] [高级 DevOps 工程师 - AI 基础设施!]

[地点] 上海浦东矽岸国际英伟达

[简历投递邮箱] xiaozhao@nvidia.com

我们现在正在寻找一位高级 DevOps 工程师 - AI 基础设施!

NVIDIA 正在招聘工程师来扩大其 AI 基础设施。您需要具备强大的编程技能、对云技术、编排与自动化系统、数据中心和云架构的深入理解,以及出色的沟通和计划能力。您和其他团队专家将帮助提升 NVIDIA 构建和部署广泛的基于 AI 的应用程序的领导解决方案的能力,如自动驾驶汽车、医疗保健、虚拟现实、图形引擎和视觉计算。

这是一个雄心勃勃且令人兴奋的角色,位于 AI 基础设施软件团队,为您提供创造和扩展一个新产品类别的机会。我们是一个充满活力、类似创业公司的环境,强调执行力、灵活性和团队合作。我们正在寻找具有高度动力的软件工程师,他们与我们一样对构建卓越软件充满真正的热情。

NVIDIA 处于深度学习和 AI 革命的前沿。加入我们,一起在 NVIDIA GPU 上打造人工智能的未来。

您将要做的工作:

  • 与多个 AI 产品团队合作,了解他们的数据和计算需求(目前专注于自动驾驶汽车)。
  • 构建基础设施和工具,提高开发基于 AI 系统的团队的生产力(数据闭环、深度学习标记/训练、自动驾驶汽车问题的调试/重放等)。
  • 通过使用云计算、Kubernetes 、Docker 和物理深度学习机器在模拟环境中提供自动化构建和测试解决方案,使开发团队能够发展。
  • 使用 git 维护版本控制模式,追踪开发、暂存和生产代码。
  • 使用维护窗口、HA 故障转移和不可变基础设施模式,编排创建/删除/升级实时系统。
  • 与多个团队和领域专家合作,将多个 NVIDIA 产品集成到 CI 工作流程中。
  • 自动化复杂任务,提高功能自动化测试的效率。
  • 作为值班轮换的一部分,支持生产系统,及时响应事件,进行停机原因分析,并实施预防措施。

我们需要看到的:

  • 拥有 4 年以上经验的学士学位/硕士学位。
  • 在自动化、云基础设施和编排方面有坚实的技术基础,包括至少一个编排系统( Kubernetes 、Swarm 、Mesos 、Marathon 、Aurora 等)的经验。
  • 具有微服务和 ETL 作业的经验。
  • 有使用云自动化工具( Ansible 、Terraform 等)的经验。
  • 精通 AWS:EC2 、S3 、RDS 、ECS 、CloudFront 、VPC ,或阿里云、腾讯云等的等效服务。
  • CI/CD:Jenkins 、GitHub 、GitLab 等。
  • 编程:Go 、Python 、Bash 。
  • Linux:Debian 包管理、Docker 、systemd 。
  • 网络:Linux 防火墙、PXE 、NFS 、ZFS 、CIFS 。
  • 了解可观测性仪器技术及标准方法,包括 Prometheus 、Grafana 、OpenTelemetry 、日志系统。

脱颖而出的方式:

  • 出色的团队成员,喜欢在团队环境中工作。
  • 在一级自动驾驶汽车公司工作,为 AV 自动化和加速数据驱动的开发闭环。
  • 流利的英语。

来源:https://v2ex.com/t/1063758