-
职位描述: 1.保障基础设施/云原生/分布式存储等核心系统的可靠性与正常运行,同时关注系统成本与稳定性; 2.通过监控系统组件可用性、性能指标提升系统可见性,帮助系统开发以及团队快速定位故障; 3.保障产品数据库系统的稳定性和可靠性;进行数据库的故障发现、定位、止损能力建设,提升数据库异常恢复速度; 4.推动提升服务的可靠性、可扩展性以及成本、性能优化,保障系统 SLA; 职位要求: 1.本科以上学历,计算机相关专业,并有5年以上相关领域工作经验; 2.熟悉一种或多种编程语言,例如 Go/Python/Java/Shell等; 3.熟悉K8S与Docker,有K8S集群运维经验者优先; 4.熟悉主流的数据库,例如 MySQL/Redis/MongoDB等,拥有数据库集群管理经验优先; 5.具备系统化解决问题的能力或工程化研发能力,良好的沟通技巧和主人翁责任感;
-
工作职责: 1、负责服务器的环境搭建及日常维护,保障系统稳定可靠运行; 2、负责公司相关产品的部署运维; 3、负责线上问题排查,紧急事故处理,后续事故分析与优化。 岗位要求: 1. 计算机相关专业本科及以上学历,5年以上工作经验; 2.运维经验丰富,精通python, 熟悉Linux系统管理和性能优化,熟悉docker; 3. 熟悉阿里云、腾讯云、AWS等云平台的操作; 5. 熟悉高并发、高可用、微服务系统架构者优先; 6. 熟悉Prometheus、Grafana等监控报警系统优先; 7. 自主学习能力和兴趣,能承受较强的工作压力,具备良好的沟通及团队协作精神
-
工作职责: 1、运维平台建设:基于业务迭代需要,建设大型规模生产环境管理运维平台,包含服务发布、资源管理、监控体系等; 2、运维自动化工具开发:基于SRE运维工作,理解需求背景和业务发展,开发自动化工具和平台提升效率; 3、效能效率平台建设:优化CI/CD产研流程,参与流程与规范设计,基于业务研发场景建设效能平台; 4、SRE高可用保障:参与故障应急、稳定性优化等工作,并设计系统助力运维能力提升; 5、知识沉淀:相关技术调研与文档输出。 任职要求: 1、拥有三年以上的 Golang、Python 3.x 和 Vue 实际开发经验; 2、拥有具备规模的容器平台、监控平台开发管理经验; 3、熟悉Linux (Ubuntu 优先)常用运维工具,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 4、各类效能效能效率与运维开源系统使用和开发经验:Prometheus、ELK等; 5、了解常用中间件:数据库、消息队列、服务发现等。
-
岗位职责: 1.负责卡中心生产环境服务器操作系统的升级、补丁更新、漏洞修复等; 2.负责卡中心生产环境服务器操作系统的巡检、日常投产变更、业务连续性保障等工作; 3.负责操作系统安全配置的检查及整改; 4.参与重保活动、节假日的值班工作,关注操作系统的各项指标,并在出现问题时配合团队进行故障排查; 5.在系统日常运维工作中,参与处置系统的告警,解决系统异常故障相关的疑难问题; 6.根据实际情况,完成所分配的其他工作。 任职资格: 1.计算机等相关专业本科及以上学历,三年及以上系统运维相关工作经验; 2.熟悉Linux环境基本操作,熟练使用Linux命令,具备较强的脚本或语言开发能力,熟练使用shell、pathon等至少一种脚本语言;熟练运用自动化运维工具ansible、saltstack等; 3.熟悉linux-redhat、SuSELinux、Kylin、windows等常用操作系统的运维和配置优化,可以进行安装、调测和管理操作系统;熟练操作系统的性能分析、故障处理等; 4.较强的分析和解决问题能力,较强的责任感、缜密的逻辑思维能力,有解决复杂系统问题的能力; 5.责任心强,良好的对外沟通和团队协作能力。
-
职位描述: 1、负责数据库架构设计及实施,保证数据库服务的高可用; 2、制定并优化数据库监控策略,提早发现并解决数据库可能出现的问题; 3、建立完善的数据库及备份运维和管理流程,数据库维护管理体系; 4、负责数据库运维过程中的问题排查及快速解决问题。 5、跟踪调研数据库领域的新技术新产品,根据业务发展需求设计解决方案。 职位要求: 1、3 年以上 DBA 相关工作经验(MySQL、Oracle、PostgreSQL 等),互联网工作经验更佳。 2、深入了解 mysql postgresql mongodb oracle 等其中一项主流关系型数据库体系架构; 3、精通 MySQL 高可用方案,灾备方案。能够独立设计并实施数据库高可用架构方案。 4、熟悉 MySQL 高并发,有丰富的故障处理和性能优化经验。熟悉常用的监控工具。 5、熟悉存储相关服务,如分布式系统、ES、redis cluster、fastdfs、gfs等。 6、有大规模 MySQL 、Redis、MongoDB等数据库运维经验者优先。 7、较强的学习能力,良好的沟通能力,熟悉部门间协调及优秀的工作推动能力,工作积极主动,有服务意识和团队协作精神。
-
岗位职责 1、搭建和维护公司的DevOps基础设施,包括代码和镜像仓库,SSO系统,PAM系统等。 2、开发DevOps相关的各种脚本、模版、组件,做到可复用、可升级。 3、推动GitOps, IaC等技术在公司的落地实践。 4、制定公司在云端计算、存储、网络资源上的选型和管理策略,降本增效,提高安全性和可靠性。 任职条件 1、耐心,细致;追求简明的技术方案。 2、三年以上Kubernetes的使用经验,深入了解Kubernetes的各种机制。 3、三年以上公有云使用经验,深入了解各种云端计算、存储、网络资源的特性,能够根据业务需求合理选型。 4、熟悉Kubernetes的资源管理工具,如Kustomize, Helm。 5、熟悉常见的Kubernetes组件,如cert-manger, external-secret, 各种ingress等。 6、有IaC的实战经验,如Terraform, Crossplane, Karpenter等。 7、熟悉Prometheus, Grafana, Loki等开源组件在Kubernetes上的部署和运维。 8、熟悉Mysql, Redis, Kafka等常见数据组件的部署和运维管理。 9、熟悉Linux操作系统原理以及TCP/HTTP/GRPC等网络协议。 10、熟悉脚本语言Bash/Python脚本语言任一种。
-
岗位职责: 1. 负责美团核心交易业务的稳定性保障工作; 2. 参与设计与开发devops工具,包括但不限于容量规划、资源管理、机房容灾、故障分析等; 3. 精细化数据运营,包括可用性指标、历史事故、资源利用率等,挖掘系统薄弱点,落地改进项目; 4. 积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档。 岗位基本要求: 1、 计算机相关专业。深入理解Linux系统,精通TCP/IP、HTTP等协议,具备扎实的网络、计算机体系结构方面的知识; 2、 至少熟悉一门编程语言,java/python/go,能开发工具提升效率; 3、 热爱技术,责任感强,拥有强大的项目执行力和良好的沟通协作能力; 4、 工作细致、善于思考,有较强的分析和解决问题的能力; 5、 具备良好的沟通以及协调能力,能独当一面,也擅长团队作战。
-
25k-35k·13薪 经验5-10年 / 不限科技金融,人工智能服务 / 上市公司 / 500-2000人职位描述: 1、负责数据库架构设计及实施,保证数据库服务的高可用; 2、制定并优化数据库监控策略,提早发现并解决数据库可能出现的问题; 3、建立完善的数据库及备份运维和管理流程,数据库维护管理体系; 4、负责数据库运维过程中的问题排查及快速解决问题。 5、跟踪调研数据库领域的新技术新产品,根据业务发展需求设计解决方案。 职位要求: 1、3 年以上 DBA 相关工作经验(MySQL、Oracle、PostgreSQL 等),互联网工作经验更佳。 2、深入了解 mysql postgresql mongodb oracle 等其中一项主流关系型数据库体系架构; 3、精通 MySQL 高可用方案,灾备方案。能够独立设计并实施数据库高可用架构方案。 4、熟悉 MySQL 高并发,有丰富的故障处理和性能优化经验。熟悉常用的监控工具。 5、熟悉存储相关服务,如分布式系统、ES、redis cluster、fastdfs、gfs等。 6、有大规模 MySQL 、Redis、MongoDB等数据库运维经验者优先。 7、较强的学习能力,良好的沟通能力,熟悉部门间协调及优秀的工作推动能力,工作积极主动,有服务意识和团队协作精神。
-
职位职责: 1、负责火山引擎混合云存储产品的交付运维产品设计与研发,为字节跳动内部业务以及火山引擎客户提供企业级存储产品服务; 2、技术规划和架构设计:深刻理解各存储产品通用能力和架构,在私有化的交付、运维场景,通过领先的架构设计和研发能力解决交付、运维场景的各种复杂问题,完成高质量的工程落地; 3、打造极致效率:深刻理解混合云存储产品研发和交付全流程特点,持续提升研发、POC、交付以及售后效率; 4、提升产品智能化能力:深刻理解大规模系统运营,结合AI for System能力,实现产品原生自治能力以及自治工具产品化,能为客户提供极致的业务连续性以及低运维能力。 职位要求: 1、深入理解linux系统,熟悉分布式系统原理及常见架构; 2、熟悉Go/Python中至少一种,对工程质量有很高的自我要求,有开源社区代码贡献者优先; 3、熟悉容器技术、云原生技术、分布式协调服务者优先,包括但不限于Kubernetes、ZooKeeper、Etcd、Prometheus等等,有源码级的了解优先; 4、有云管平台、DevOps及存储等产品开发和交付经验优先; 5、有混合云、私有云相关产品经验者优先。
-
职位职责: 1、负责基础架构云平台 DevOps 平台设计、开发、维护工作,构建基础架构、公有云、字节业务的中间适配层 DevOps 相关的平台; 2、负责火山引擎管理运维平台和工具的开发,建设火山引擎自举体系; 3、负责公有云IaaS/PaaS/SaaS能力对接和建设,开发DevOps平台管理云相关的资源,支持业务平稳使用公有云服务; 4、践行 DevOps 理念,建立和优化效能指标,推动基础产品质量和效率的提升。 职位要求: 1、2 年及以上后端开发经验; 2、熟悉云计算知识,熟悉IaaS/PaaS层相关能力,包括分布式存储,虚拟机,网络等; 3、熟练掌握 Golang 或者Python; 4、对 DevOps、CI/CD 有丰富的实践经验,不断对现有方案持续迭代,寻找满足业务快速发展需求的最佳技术解决方案; 5、有公有云/私有云设计、开发和运维经验,能快速定位和调试问题; 6、具备优秀的沟通协作能力、分析解决问题能力和学习能力; 7、具备以下条件之一者优先: a. 有公有云/私有云相关DevOps 平台开发者优先; b. 有研发效率工具、云平台的开发经验者优先; c. 有深入理解IaC理念和实践者优先; d. 熟悉 Docker、Kubernetes 及相关云原生技术者优先; e. 掌握OpenStack或Kubernetes定制开发与运维管理,有社区贡献者优先。
-
岗位要求: -重点本科以上学历,1-3年工作经验,校招不受限 -熟悉x86架构、linux系统应用和管理,有linux应用系统运维相关经验 (redhat/centos) -熟悉常见运维工具如nagios/ganglia/zabbix/snmp等,有集群管理经验者优先 -熟练使用shell/python等脚本、有c/java后端开发经验者加分 -优秀的分析和解决问题能力,良好的团队协作精神,有责任心 -非常欢迎喜欢钻研开源技术及自动化技术、linux重度用户、linux全栈工程师 加分项: -对hadoop/spark/hive等技术有所了解、有相关经验 岗位职责: -负责分布式集群的运维和管理 -负责大数据业务日常问题处理、优化和改进 -负责运维相关的项目开发 公司地址: 北京海淀区科学院南路2号院3号楼 搜狐媒体大厦 如果你对我们的职位感兴趣,请尽快发简历给我们 我们会尽快安排面试!
-
要求: - 5年以上工作经验 - 掌握云平台(Azure优先),不仅了解基本概念,而且具有实际操作和架构师设计经验,包括但不限于APIM、负载平衡器、虚拟机、Kubernetes、无服务器服务、微服务、监控和日志收集。 - 有大型微服务架构监控,有Kubernetes 运维经验优先 - 一个或多个关系型或非关系型数据库的开发/操作经验, 有MongoDB,Cassandra, ElasticSearch 运维经验优先 - 消息总线使用/操作经验,有RabbitMQ,kafka 运维经验优先 - 具有3年以上面向对象编程或者脚本开发经验优先 工作职责: 基于云的基础设施架构 - 团队合作设计一个具有高可用性和可靠性的灵活云基础设施。 - 设计集装箱化、Kubernetes和服务网格实施计划。 全栈监测和日志系统设置 - 设计/开发全堆栈监控系统,对整个云资源内的开发和生产场景进行良好监控。 - 设计/开发集中式日志收集系统,收集日志并与调试系统建立清晰的可追溯性,以便团队能快速确定事故原因。 CI/CD工作流/策略/管道设置和维护 - 团队设计工件管理和推广策略 - 与QA团队密切合作,确定产品交付周期的质量标准 - 在Azure DevOps上设置完整的CI/CD工作流和管道,以确保产品的持续交付具有良好的质量和安全/法律法规遵从性。 安全合规性 - 从产品交付生命周期的早期阶段开始构建安全扫描(SAST、DAST、许可证、第三方许可证…) - 可视化安全扫描报告并设置修复跟踪和知识库
-
工作内容: 基于云的基础设施架构 团队合作设计一个具有高可用性和可靠性的灵活云基础设施。 设计集装箱化、Kubernetes和服务网格实施计划。 全堆栈监测和日志系统设置 设计/开发全堆栈监控系统,对整个云资源内的开发和生产场景进行良好监控。 设计/开发集中式日志收集系统,收集日志并与调试系统建立清晰的可追溯性,以便团队能快速确定事故原因。 CI/CD工作流/策略/管道设置和维护 团队设计工件管理和推广策略 与QA团队密切合作,确定产品交付周期的质量标准 在Azure DevOps上设置完整的CI/CD工作流和管道,以确保产品的持续交付具有良好的质量和安全/法律法规遵从性。 安全合规性 从产品交付生命周期的早期阶段开始构建安全扫描(SAST、DAST、许可证、第三方许可证…) 可视化安全扫描报告并设置修复跟踪和知识库
-
岗位职责: 1)针对网络架构与公司业务特点,编制和实施网络安全方案; 2)预防和及时解决网络攻击、入侵等问题,维护公司业务的正常开展与信息安全; 3)编制、整理系统文档,记录IT设备及其使用状况,实现系统管理的规范化; 4)负责公司多种业务系统的服务器、数据库等的日常运维; 负责容灾、备份、恢复的方案制定和定期演练; 5)配合软件开发团队制定新系统容量、部署方案,负责新系统硬件架构的实施部署工作; 6)为公司各部门及分公司计算机及网络正常运作提供技术支持; 任职要求: 1)本科以上学历,计算机、网络工程、软件工程、信息安全等相关专业,3年以上工作经验; 2)了解计算机体系结构和网络体系结构,具有扎实的信息安全理论知识,并有一定的应对网络攻击经验; 3)了解信息资产全生命周期中的安全保护技术; 4)熟悉Windows、Linux等主流操作系统,了解一种或多种编程语言; 5)有多区域复杂网络环境运维经验者优先; 6)有中小型机房建设经验者优先; 7)有云服务、k8s运维经验者优先; 8)做事积极,内驱力强,工作认真、细致、负责、踏实; 9)能适应出差
-
工作内容: 1、负责终端安全相关产品的日常安装、部署、运行及调试工作,及时解决用户日常办公中出现的各种故障和问题; 2、负责公司产品管理端的日常维护、故障处理、数据备份、日志分析等工作,保证相关系统能够稳定、正常运行; 3、协助完成公司其他项目的集成实施和运维工作,包括产品部署、应急处理、故障判断及修复等项目类技术工作。 任职要求: 1、计算机或者相关专业大专及以上学历,有安全类产品实施或运维经验者优先; 2、熟悉常见安全类产品的部署安装、调试、运维工作; 3、丰富的运维故障处理能力,学习能力强,能够独自处理各种线上问题; 4、良好的沟通及文档编写能力; 5、责任心强,工作状态稳定,有团队合作精神。