-
工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的高并发在线服务运维保障经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先),Python等常用运维工具,有一定的脚步编写能力,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用阿里云、腾讯云平台和 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。
-
职位职责: 1、保障公司短视频产品的直播重保平台等核心系统的线上稳定性,对线上事故进行快速响应并建立机制、平台提升处理效率; 2、参与建设运维工具、平台,推进运维自动化; 3、通过持续的全方位数据运营(包括可用性指标、历史事故、资源利用率等),找到系统薄弱点,落地地改进项目; 4、积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档; 5、推动提升服务的可靠性、可扩展性以及性能优化,保障系统SLA。 职位要求: 1、本科及以上学历,计算机及相关专业; 2、扎实的计算机软件基础知识;了解 Linux 操作系统、存储、网络IO等相关原理; 3、熟悉一种或多种编程语言,例如Python/Go/Java/PHP/C/C++; 4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感。
-
工作职责 1、负责辖区数据中心设施运维服务管控,确保服务工单时效性、客户满意度、变更管理、服务SLA等,均满足服务质量要求; 2、负责对数据中心的运行数据进行收集、整理和分析,定期汇报数据中心的运行情况; 3、负责辖区数据中心运营相关成本费用和收入结算的合理规划和把控实施; 4、负责辖区数据中心运维合规和安全审计工作的统筹管理; 5、负责辖区数据中心机柜资源使用规划,推动提升资源利用率; 6、负责辖区合作商管理以及合同管理。 任职要求 1、本科及以上学历; 2、2年以上数据中心维护或相关领域工作经验; 3、了解数据中心行业规范、政策、技术、产品及理念; 4、熟悉数据中心供电、暖通、弱电智能化、消防等系统,熟悉数据中心主要设备的工作原理; 5、熟悉机柜资源的使用规划和管理; 6、熟悉机房租赁的服务合作模式及合同管理; 7、具备良好的沟通能力和团队合作精神,有较强的数据分析和汇报能力。
-
岗位职责 1、负责集团各应用系统运维,保障系统7*24小时稳定运行; 2、负责部门基础组件/中间件和业务的运维工作,设计和规划业务的高可用性、故障解决、容灾部署和节假日保障等; 3、负责运维架构优化、成本优化、高可用运维等技术运营工作; 4、负责推进相关服务问题改进,提高运维效率和质量。 任职要求 1、计算机相关专业,本科以上学历,5年以上的运维工作经验; 2、精通Linux操作系统,熟悉shell或python等语言,熟悉ansible自动化运维的使用 3、熟练nginx、keepalived、jenkins、redis、elasticsearch、kafka 、flink等中间件的集群安装部署; 4、熟悉Prometheus+Grafana监控平台的部署和配置; 5、熟悉Mysql,能熟练掌握Mysql的基本操作,能对Mysql进行性能优化,监控Mysql日常运行情况; 6、熟悉elasticsearch、flink等组件的原理及运维方式,有docker、kubernetes生产实践经验者; 6、精通大型监控架构及原理,熟悉系统、应用,数据库等组件的监控配置经验,熟悉后台分布式系统的架构及容灾设计;熟悉软件发布,运维,优化,对软件全生命周期管理有一定认识;(加分项) 7、良好的沟通、团队协作能力,责任心强,承担较大的工作压力。
-
岗位职责: 1、负责处理系统咨询类、操作类、业务类问题解答和处理; 2、负责系统常见问题和故障的定位和处理; 3、负责中间件,数据库性能的深入分析; 4、负责系统运维手册、应急预案等文档的维护; 5、负责系统日常监控、健康检查、生产应急等; 6、负责投产管理,质控管理及投产上线支持; 7、负责自动化运维,智慧运维的实践和研究; 8、负责运维开发的相关事宜。 职位要求: 1、本科及以上学历;计算机,软件工程等相关专业; 2、了解计算机软硬件、网络、设备等基础设施的基本知识; 3、了解操作系统、数据库、中间件等基础软件基本知识; 4、熟悉Java,python语言,能够编写脚本; 5、了解微服务架构,分布式架构; 6、有较强的沟通协调能力和执行力; 7、具有较好的抗压能力。
-
工作职责: 1、负责服务器的环境搭建及日常维护,保障系统稳定可靠运行; 2、负责公司相关产品的部署运维; 3、负责线上问题排查,紧急事故处理,后续事故分析与优化。 岗位要求: 1. 计算机相关专业本科及以上学历,5年以上工作经验; 2.运维经验丰富,精通python, 熟悉Linux系统管理和性能优化,熟悉docker; 3. 熟悉阿里云、腾讯云、AWS等云平台的操作; 5. 熟悉高并发、高可用、微服务系统架构者优先; 6. 熟悉Prometheus、Grafana等监控报警系统优先; 7. 自主学习能力和兴趣,能承受较强的工作压力,具备良好的沟通及团队协作精神
-
职位描述: 1.保障基础设施/云原生/分布式存储等核心系统的可靠性与正常运行,同时关注系统成本与稳定性; 2.通过监控系统组件可用性、性能指标提升系统可见性,帮助系统开发以及团队快速定位故障; 3.保障产品数据库系统的稳定性和可靠性;进行数据库的故障发现、定位、止损能力建设,提升数据库异常恢复速度; 4.推动提升服务的可靠性、可扩展性以及成本、性能优化,保障系统 SLA; 职位要求: 1.本科以上学历,计算机相关专业,并有5年以上相关领域工作经验; 2.熟悉一种或多种编程语言,例如 Go/Python/Java/Shell等; 3.熟悉K8S与Docker,有K8S集群运维经验者优先; 4.熟悉主流的数据库,例如 MySQL/Redis/MongoDB等,拥有数据库集群管理经验优先; 5.具备系统化解决问题的能力或工程化研发能力,良好的沟通技巧和主人翁责任感;
-
岗位职责: 1. 负责美团核心交易业务的稳定性保障工作; 2. 参与设计与开发devops工具,包括但不限于容量规划、资源管理、机房容灾、故障分析等; 3. 精细化数据运营,包括可用性指标、历史事故、资源利用率等,挖掘系统薄弱点,落地改进项目; 4. 积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档。 岗位基本要求: 1、 计算机相关专业。深入理解Linux系统,精通TCP/IP、HTTP等协议,具备扎实的网络、计算机体系结构方面的知识; 2、 至少熟悉一门编程语言,java/python/go,能开发工具提升效率; 3、 热爱技术,责任感强,拥有强大的项目执行力和良好的沟通协作能力; 4、 工作细致、善于思考,有较强的分析和解决问题的能力; 5、 具备良好的沟通以及协调能力,能独当一面,也擅长团队作战。
-
25k-35k·13薪 经验5-10年 / 不限科技金融,人工智能服务 / 上市公司 / 500-2000人职位描述: 1、负责数据库架构设计及实施,保证数据库服务的高可用; 2、制定并优化数据库监控策略,提早发现并解决数据库可能出现的问题; 3、建立完善的数据库及备份运维和管理流程,数据库维护管理体系; 4、负责数据库运维过程中的问题排查及快速解决问题。 5、跟踪调研数据库领域的新技术新产品,根据业务发展需求设计解决方案。 职位要求: 1、3 年以上 DBA 相关工作经验(MySQL、Oracle、PostgreSQL 等),互联网工作经验更佳。 2、深入了解 mysql postgresql mongodb oracle 等其中一项主流关系型数据库体系架构; 3、精通 MySQL 高可用方案,灾备方案。能够独立设计并实施数据库高可用架构方案。 4、熟悉 MySQL 高并发,有丰富的故障处理和性能优化经验。熟悉常用的监控工具。 5、熟悉存储相关服务,如分布式系统、ES、redis cluster、fastdfs、gfs等。 6、有大规模 MySQL 、Redis、MongoDB等数据库运维经验者优先。 7、较强的学习能力,良好的沟通能力,熟悉部门间协调及优秀的工作推动能力,工作积极主动,有服务意识和团队协作精神。
-
岗位职责: 1. 负责公司微服务架构和容器化平台的高可用性、高性能和安全性运维管理。 2. 设计和实施微服务架构的运维自动化方案,提升运维效率。 3. 负责容器编排系统(如Kubernetes)的日常运维和优化,确保服务的稳定运行。 4. 负责监控和日志系统的设计与优化,实现对微服务架构的全面监控。 5. 负责制定和执行灾难恢复计划,确保业务连续性。 6. 提供技术支持和指导,协助团队解决复杂的运维问题。 7. 参与制定和优化运维流程,提升运维团队的整体能力。 8. 跟踪业界最新的运维技术和趋势,进行技术预研和落地实施。 任职要求: 1. 计算机相关专业本科及以上学历,5年以上相关工作经验。 2. 精通微服务架构设计,有丰富的容器化技术(如Docker)和容器编排系统(如Kubernetes)的实际运维经验。 3. 熟悉至少一种公有云服务(如AWS、Azure、阿里云等),有云原生应用运维经验者优先。 4. 熟练掌握至少一种配置管理工具(如Ansible、Puppet、Chef等)。 5. 精通Linux系统,能够编写高效的Shell/Python等脚本语言,有良好的编程基础。 6. 具备丰富的故障排查和性能优化经验,能够独立解决复杂的服务故障。 7. 具备良好的团队合作精神和领导能力,能够带领团队解决重大运维问题。 8. 熟悉持续集成和持续部署(CI/CD)流程,有自动化运维工具的开发经验。 9. 具备网络安全知识,能够对微服务架构进行安全加固。 10. 具备良好的文档编写能力,能够撰写清晰的技术文档和报告。 11. 有开源项目贡献经验或撰写技术博客者优先。 岗位亮点: 1. 参与公司核心系统的运维架构设计和优化,对技术有深度影响。 2. 有机会领导或参与重要项目的运维工作,提升个人技术和管理能力。 3. 公司提供良好的职业发展路径和培训机会,支持个人职业成长。 备注:该岗位工作地点为南京市建邺区,******,根据个人能力和经验水平而定。
-
岗位职责: 一、客户沟通 1)掌握产品功能特性,理解业务应用场景,及时准确应答用户各类应用咨询类问题(支持ITSM工单、电话、企业微信、邮件等多种形式); 2)需求收集整理,有效识别用户需求并清晰梳理业务需求及应用场景; 二、系统运维 1)协助支持开发进行版本迭代发布流程、UAT测试等工作; 2)输出相应业务的FAQ和操作指导,并完成相关一线培训支持工作; 三、应用运维 1)识别用户反馈的各类问题,快速解决一般性问题,识别判断BUG类复杂类问题并及时准确的将其解决,所有问题有追踪有闭环; 2)客户服务协议或公司内部要求责任范围内的系统其他应用运维相关工作,包括但不限于应用使用咨询与技术支持、复杂故障排查与处理、账号和配置管理等服务; 四、其他 1)完成领导交办的其他工作。 任职资格: 1. 本科及以上,计算机、电子、通信等相关专业; 2. 5年以上软件研发或运维经验; 3. 熟悉计算机基础知识,JAVA等一门或多门技术及相关工具的使用; 4. 对各种 Web 前端技术、网络、多线程、异步处理、缓存等基础框架和机制有深刻理解; 5. 有J2EE架构Spring MVC、Spring boot、Spring cloud/hibernate/AJAX框架/消息队列开发经验者优先; 6.熟练Docker、K8S、Rancher等容器技术,对其原理有较深入理解,有生产环境相关运维或开发经验; 7. 独立运用使用开发相关工具,搭建相关开发环境; 8. 目标管理能力和沟通协作能力; 9. 员工应通过本公司试用期考核。 其他信息: 1.双休,免费供应早餐+午餐补贴,加班餐补; 2.试用期开始购买足额最高标准的五险一金+覆盖正式员工及子女的团体商业保险; 3.限量供应单身集体宿舍+入职满1年后政府人才房; 4.法定的年休假+额外的探亲假; 5.清晰的职业发展通道,可参加公司、集团组织的各类培训; 6.民航工会、集团工会大病互助金; 7.入职满1年后享受年度健康体检; 8.重大节日时的工会慰问品; 9.每月员工生日会+生日当月发放蛋糕券; 10.免费社团活动+不定期的拓展活动(三八节、1024等)。
-
岗位职责: 1.全面负责公司运维项目的系统升级、扩容需求与资源落实,配合开发、需求、测试,调整运维平台; 2.负责服务器系统、常用服务支撑软件的安装、维护、迁移、故障处理; 3.负责网络以及服务器的网络设置、维护和优化、网络的安全监控、系统性能管理和优化、网络性能管理和优化; 4.负责设计并部署相关应用平台,并提出平台的实施、运行报告; 5.负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进; 6.负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告; 7.负责网络监控和应急反应,以确保网络系统有7*24小时的持续运作能力; 8.负责日常系统维护及监控,提供IT软硬件方面的服务和支持,保证系统的稳定。 任职要求: 1.本科及以上学历,计算机相关专业,5年及以上大型系统实施和运维相关经验; 2.熟悉 Linux/Unix 系统、网络、硬件等相关知识,懂搭建服务器集群,至少熟悉一种脚本语言:Shell、Python等; 3.具有主流数据库系统(mysql、oracle)维护管理经验; 4.熟悉 Aliyun、华为云、腾讯云中的一种或几种;熟悉自动化部署工具:Ansible、Saltstack 、Docker、K8S 等技术; 5.熟练掌握自动化运维工具,熟悉网络安全的原理和技术,掌握系统及应用安全维护基本技术; 6.能够熟练排查运维过程中出现的服务故障、系统故障、网络故障; 7.具有良好的沟通能力和执行能力,抗压性好,能够独立处理问题。
-
岗位职责 1. 设计、部署和管理AWS云服务,包括但不限于EC2, VPC, S3, ELB, IAM, RDS, ECS,EKS等。 2. 监控云基础设施的性能,确保高可用性和稳定性。 3. 利用AWS CloudFormation或Terraform等工具自动化基础设施部署。 4. 实施安全最佳实践,管理网络安全策略,确保数据和服务的安全。 5. 与开发团队合作,优化部署流程,实现持续集成和持续部署(CI/CD)。 6. 定期进行系统备份和灾难恢复操作。 7. 响应和解决技术支持票务,进行根本原因分析并制定解决方案。 8. 保持对最新云技术和趋势的了解,并推荐可能的改进和升级。 任职要求 1. 至少5年的IT运维经验,其中3年以上AWS云服务管理经验。 2. 精通AWS服务和管理工具。 3. 熟悉网络协议(如HTTP, TCP/IP)和网络安全。 4. 熟練使用编程或脚本语言(如Python, Bash)。 5. 熟練使用基础设施即代码(IaC)工具,如Terraform或CloudFormation。 6. 优秀的问题解决能力和团队合作精神。 7. AWS认证(如AWS Certified Solutions Architect或AWS Certified DevOps Engineer)优先考虑。
-
1、负责生产系统应用运维工作,包括应用监控、持续交付、应急响应、容量规划和安全漏洞修复等,保障应用系统安全稳定运行; 2、负责评估应用系统运行状态和性能,发现风险和隐患,推动应用系统架构优化; 3、推广应用领域自动化工具使用,提升应用运维效率和质量; 4、负责故障处理,分析定位原因并解决; 5、负责网络安全、系统安全监控运维,安全事件的响应与处理。负责高危漏洞验证、预警和加固。 要求: 1、计算机相关专业,本科以上学历; 2、5年以上应用运维经验;具备丰富的应用系统运维、故障处理经验,熟悉公有云资源的产品服务; 3、熟悉各类主流中间件使用,如tomcat/zookeeper/nginx等,熟悉JVM GC原理并调优,熟悉主流微服务框架,有大型复杂系统的运维经验优先; 5、熟悉Linux操作系统并优化,熟悉Shell/python脚本编写。熟悉使用vim、awk、sed等文本处理工具,熟悉HTTP协议、TCP/IP网络协议; 6、熟悉常用的监控系统如Prometheus 、zabbix等,熟悉APM工具如skywalking等; 7、熟悉自动化运维工具,如salt、ansible等,熟悉CI/CD工具,如jenkins,有kubernetes、docker生产运维经验,熟悉阿里云平台使用; 8、熟悉主流信息安全产品和技术,包括:防火墙、VPN、堡垒机、漏洞扫描、安全审计等。 9、熟悉主流网络攻击技术、方法和原理,及其防御方案; 9、责任心强,具备较强的问题分析能力、沟通能力和团队协作能力,善于学习新技术,有良好的文档编写习惯,有各类运维证书优先,如RHCA。
-
岗位职责: 1、负责快手CDN平台建设和运维管理工作; 2、负责快手CDN监控系统、自动化运维系统的部署、维护工作; 3、负责快手CDN整体质量和稳定性保障工作; 4、负责快手动态加速、边缘计算等业务基础支持工作; 5、负责快手CDN成本优化相关工作。 任职要求: 1、本科以上学历,计算机或相关专业,2年以上CDN厂商运维或技术支持相关经验; 2、精通Linux、熟悉tcp/ip、http协议、quic协议及主流web server; 3、熟悉nginx、squid、lighttpd等开业软件; 4、具备较强的问题分析、排查、解决和沟通协调能力,善于跨部门沟通; 5、做事认真、仔细、负责,具备一定的抗压能力,可以做到7*24响应处理各类应急事件; 6、掌握Shell、python、go等至少一门语言; 7、了解P2P协议、P2P网络架构,有性能优化相关经验优先,有过CDN/P2P开发经验优先。