-
职位职责: 1、保障公司短视频产品的直播重保平台等核心系统的线上稳定性,对线上事故进行快速响应并建立机制、平台提升处理效率; 2、参与建设运维工具、平台,推进运维自动化; 3、通过持续的全方位数据运营(包括可用性指标、历史事故、资源利用率等),找到系统薄弱点,落地地改进项目; 4、积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档; 5、推动提升服务的可靠性、可扩展性以及性能优化,保障系统SLA。 职位要求: 1、本科及以上学历,计算机及相关专业; 2、扎实的计算机软件基础知识;了解 Linux 操作系统、存储、网络IO等相关原理; 3、熟悉一种或多种编程语言,例如Python/Go/Java/PHP/C/C++; 4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感。
-
岗位职责: (1)负责公司计算机类设备配备、使用和管理; (2)负责公司信息化系统应用软件、中间件、数据库等搭建配置工作。 (3)负责协助公司研发团队开展应用配置,技术攻坚工作。 (4)组织系统信息化基础设施建设实施和运维管理; (5)负责承担互联网数据中心监控环境搭建和管理工作; (6)负责组织管理公司容灾备份体系的建设和运维; (7)负责协助网络突发事件、故障等的应急处理,协助制定故障处理流程和应用预案相关工作、对一、二线人员提供技术支持; (8)负责领导交办的其他工作。 任职资格: (1)年龄在28至40周岁,**本科及以上学历(留学回国人员应取得教育部相应学历学位认证),具有国内外知名院校本科及以上学历(留学回国人员应取得教育部相应学历学位认证),计算机科学与技术等相关专业,身体健康,具有正常履行岗位职责的身体条件; (2)5年以上 Linux 相关工作经验,要求熟练掌握 Linux 相关技能; (3)熟悉ORACLE、MYSQL、Redis、MongoDB等数据库日常运维,熟练掌握SQL语句,精通常用数据库调优; (4)熟悉Nginx、Tomcat、MQ、kafaka、zookeeper、zabbix、elk等主流开源软件的配置维护,具备解决web服务管理与维护异常能力; (5)熟悉K8s、Docker、Istio、Gitlab-ci、ansible、Jenkins等运维技术,具有自动化运维、自动化发布部署的运维经验,能独立部署常用k8s等中间件; (6)熟悉开源监控平台prometheus/zabbix/grafana等,对系统的健康监控报警,具有自动化监控运维工具开发及配置经验; (7)有 OpenStack、Cloudstack 等云平台或虚拟化交付运维经验优先; (8)对DevOps理念有深刻理解并具备实践经验; (9)熟练使用 Python、Shell、Ansible 等脚本语言之一,有实际项目或工具开发经验; (10)至少能熟练掌握和运用腾讯云,阿里云或华为云的一种或多种,进行应用系统的部署和日常公有云运维;具有有腾讯专有云 TCE 及产品运维经验优先; (11)良好的内外部沟通、组织、协调能力,有较强的敬业精神与工作责任心;
-
工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的高并发在线服务运维保障经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先),Python等常用运维工具,有一定的脚步编写能力,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用阿里云、腾讯云平台和 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。
-
工作职责 1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力
-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
-
职位职责: 1、负责字节跳动IT办公网络运维、系统运维管理工作,包括园区、骨干、线下相关场景; 2、负责字节跳动IT办公网络、系统等故障的响应和解决、日常维护操作,包括但不限于日常告警、业务咨询、一线小组升级的报障工单等; 3、负责优化工作细节,诸如流程优化、流程自动化等方式提高工作效率; 4、负责历史工单整理及FAQ文档编写; 5、负责协助SME团队完成架构迭代及标准迭代,相关需求研究、方案设计、方案落地。 职位要求: 1、本科及以上学历,网络通信、计算机、通信工程等相关专业,3年以上网络运维工作经验; 2、了解TCP/IP模型,熟悉相关协议栈,如IPV4/IPV6、TCP/UDP、NAT、DHCP、DNS,熟悉常见VPN,如:ipsec/GRE/SSL VPN的原理和使用; 3、熟悉交换&路由等相关协议栈,包括但不限于IEEE802.3/STP/OSPF/BGP/VXLAN等; 4、深入了解无线网络通信原理,熟悉Aruba等无线产品; 5、了解SDN/SDWAN相关场景,能较快学习不同厂商的产品并使用,具备相关运维经验者优先; 6、具备大型园区有线或无线网络规划、部署以及运维经验者优先; 7、具有CCIE、HCIE等高级网络认证或同等能力人员优先; 8、熟悉Python等编程语言,有自动化开发经验者优先; 9、有一定抗压能力,能适应倒班、调休制度,能够适应工作时间特殊性; 10、具有良好的服务意识,优秀的沟通能力,良好的英语读写能力,英语可作为工作语言者优先; 11、有GOC or GNOC的相关工作经验优先。
-
工作职责 1、 负责前沿运营工具产品的日常运维工作,包括系统的运行监控、值班oncall、事件响应及处理、用户服务请求,从业务操作、系统功能特性、接口逻辑等运用角度,对问题进行诊断及跟进解决; 2、 负责运维主动预防工作,从应用系统架构、监控、容量、性能等方面进行分析以提前发现隐患问题,并推动优化解决,不断提高系统运行稳定性; 3、 负责应用系统重大故障快速诊断及解决,跟进及推动故障改进措施实施;制定系统运行应急方案,并使用应急预案优先恢复应用系统; 4、 负责与业务部门交互沟通,协调研发部门、基础架构部门完成运维需求交付,并提供运维服务报告。 任职要求 1、计算机相关专业本科及以上学历; 2、具备很强的ownership、团队协作意识,善于主动思考与自我驱动,很好的技术敏感度和风险识别能力,能承受工作压力; 3、两年及以上应用系统运维或基础架构运维经验,熟悉IT运维相关工作,对监控工具、自动化运维等技术领域有较深了解,对监控方法有较好的理论基础; 4、对操作系统、数据库、中间件、网络、云平台、容器化等一个或多个技术领域有一定运维经验,能够从技术的角度分析异常; 5、良好的系统分析、解决问题的能力,具备清晰的逻辑思维和推理能力,较强的工作推动力;良好的沟通和表达能力; 6、熟悉以下几种技术中的两种或以上:Linux/Unix基本维护和操作,python/perl等脚本语言,Hadoop、Druid、Clickhouse等大数据组件运维,Java应用平台架构,数据库性能优化技术。
-
工作职责: 1.负责公司数据库系统的管理,提供高可用、高性能数据库系统,并保障系统7×24小时正常运行; 2.负责数据库性能监控与优化,故障处理与灾难恢复; 3.为开发人员提供技术支持并提供培训; 4.参与应用系统数据库设计、数据接口开发,提供数据库规范指引、性能优化建议等; 5.参与数据库平台开发,及相关自动化流程开发工作。 任职要求: 1.**本科及以上学历,计算机相关专业优先; 2.3年及以上数据库运维相关工作经验,有大数据技术栈相关工作经验优先; 3.精通MySQL/MongoDB,熟悉TiDB/Oracle等数据库,有相关技术认证的优先; 4.熟悉互联网应用架构模式,掌握数据库高可用架构,熟悉云原生、容器化、虚拟化等基本原理和应用场景; 5.熟悉Linux操作系统,了解服务器硬件、存储、网络等基本知识; 6.至少掌握Perl/Python/Java等任何一门开发语言,能完成自动化运维工作,有开发背景经历优先; 7.具备安全、风险意识,有良好的沟通及处理突发事件的能力,能承受一定的工作压力。
-
岗位描述: 1.负责大数据平台调度作业的日常监控、维护及协助优化; 2.负责建立大数据开发规范并持续完善,能够对技术风险、技术交付质量进行管控; 3.负责常规需求中底层数据开发及数据服务封装开发; 4.深入理解数据平台架构,发现并协助解决性能屏障; 5.新技术研究和应用,并推动适合的技术应用于生产。 任职要求: 1.本科及以上学历,计算机及软件工程相关专业; 2.2年以上大数据系统开发或运维经验,熟悉hadoop生态圈、CDH大数据平台; 3.熟悉数据规范流程及数据维度模型,精通sql、shell,了解spark、python、scala、flink; 4.具有较强的计算机网络、系统运维专业基础,熟悉掌握常用linux命令; 5.有体系化大数据平台运维工作经验优先考虑。
-
岗位职责: 1. 制定和优化运维解决方案,推动完善部署、监控的自动化; 2. 对业务架构中存在的性能问题,能够进行全方位的性能优化; 3. 对运维工作有热情,关注运维前沿技术; 4. 有敏感的安全意识,能及时发现和解决安全问题; 5. 完成日常工作过程中的其他工作。 任职要求: 1. 本科或以上学历,计算机相关专业者优先; 2. 能够使用shell,python完成日常运维工作,完善部署,监控流程; 3. 熟悉系统应用架构和基础架构的部署和设计,并能够提出优化建议; 4. 沟通能够强,有很强的风险识别能力和工作执行力; 5. 有良好的学习能力和工作责任心。
-
岗位职责: (1)负责公司IDC机房设备配备、使用和管理; (2)组织系统信息化基础设施建设实施和运维管理; (3)负责承担互联网数据中心监控环境搭建和管理工作; (4)负责组织管理公司容灾备份体系的建设和运维; (5)负责协助网络突发事件、故障等的应急处理,协助制定故障处理流程和应用预案相关工作、对一、二线人员提供技术支持; (6)负责领导交办的其他工作。 任职资格: (1)计算机、通信、电子工程等相关专业本科及以上学历,3年以上互联网数据中心运维工作经验; (2)熟悉数据中心网络架构、服务器设备、存储设备及相关技术; (3)具备良好的故障排查和问题解决能力,能快速定位和解决各类技术问题; (4)熟悉Linux系统操作和维护,具备Shell脚本编写能力; (5)具备扎实的网络基础知识,熟悉TCP/IP协议栈、路由交换技术; (6)有良好的团队协作和沟通能力,具备强烈的责任心和敬业精神; (7)持有相关认证(如CCNA、CCNP、RHCE等)者优先。
-
工作职责: 1、负责SAP系统的日常维护,监控及解决系统问题,保障系统稳定运行; 2、负责SAP系统的安装、配置、升级等产品部署及系统调优; 3、负责SAP系统高可用建设,灾备环境维护; 4、负责处理用户工作中遇到的问题,分析问题,解决系统运行中发生的错误; 5、对系统性能进行监控与优化,并协助开发人员解决技术难题。 任职资格: 1、**本科及以上学历,计算机相关专业,三年以上相关工作经验; 2、精通sap basis系统管理,熟练掌握basis技术; 3、精通sap系统的基本架构和工作原理,熟练进行sap系统装配和运维; 4、熟练使用至少一种主流的脚本语言(shell、python等),具备开发自动化运维系统的能力; 5、熟悉实施文档、部署文档的编制工作; 6、有较强的逻辑分析能力,良好的沟通能力和团队合作精神; 7、有强烈的责任心,具有细心、踏实、积极主动的工作态度; 8、了解Nginx、Tomcat、Nacos、MQ、ZK、Kafka高可用性架构原理,有实际搭建、运维经验者优先。
-
岗位职责 1、负责集团各应用系统运维,保障系统7*24小时稳定运行; 2、负责部门基础组件/中间件和业务的运维工作,设计和规划业务的高可用性、故障解决、容灾部署和节假日保障等; 3、负责运维架构优化、成本优化、高可用运维等技术运营工作; 4、负责推进相关服务问题改进,提高运维效率和质量。 任职要求 1、计算机相关专业,本科以上学历,5年以上的运维工作经验; 2、精通Linux操作系统,熟悉shell或python等语言,熟悉ansible自动化运维的使用 3、熟练nginx、keepalived、jenkins、redis、elasticsearch、kafka 、flink等中间件的集群安装部署; 4、熟悉Prometheus+Grafana监控平台的部署和配置; 5、熟悉Mysql,能熟练掌握Mysql的基本操作,能对Mysql进行性能优化,监控Mysql日常运行情况; 6、熟悉elasticsearch、flink等组件的原理及运维方式,有docker、kubernetes生产实践经验者; 6、精通大型监控架构及原理,熟悉系统、应用,数据库等组件的监控配置经验,熟悉后台分布式系统的架构及容灾设计;熟悉软件发布,运维,优化,对软件全生命周期管理有一定认识;(加分项) 7、良好的沟通、团队协作能力,责任心强,承担较大的工作压力。
-
岗位职责: 1、负责各公有云(AWS/GCP)和基础核心服务的管理和维护,包括各公有云网络、服务器、存储和k8s集群等,确保其安全、高可用和可扩展 2、负责运维团队及运维体系建设,制定并不断优化各项工作流程,完善公司运维管理规范,保障运维质量; 3、负责运维容量管理和稳定性建设,提升服务的可靠性、可扩展性以及高性能优化; 4、负责多云跨平台建设,包括AWS/GCP/阿里云跨云多活架构,以及多云k8s集群管理; 5、深入了解各项业务系统,参与业务方案讨论与设计,并推进优化服务的响应延迟、性能问题,提升服务可用性; 6、不断探索和研究新的运维技术,推动运维自动化、智能化能力建设,提升整体运维水平和风险控制能力; 7、负责推动云原生技术解决方案的制定、验证及落地,以及重要特性和核心功能的创新、技术攻关; 岗位要求: 1、**本科及以上学历,7年以上运维相关运维;具有5年以上AWS/GCP/Azure等公有云大规模资源的运维和实践管理经验;2年以上团队管理经验; 2、熟悉操作系统、容器技术、Kubernetes架构,熟悉相关网络和存储解决方案,可以独立处理复杂的k8s集群问题; 3、具备多云多中心和国际化部署管理经验; 4、具备项目管理能力和小团队管理能力,良好的沟通能力、应变能力和团队协作能力,有重大项目端到端交付经验优先; 5、具有服务意识,善于思考,积极主动、认真负责、具有高度责任感和敬业精神; 6、具有大型电商运维管理经验优先;
-
职责描述: 1、负责公有云运维工作,故障处理,日常巡检 2、负责公有云环境搭建及监控,包括处理服务请求异常问题定位及修复等运维操作。 3、对公有云环境进行风险识别和评估,提出改进建议并修复。 4、对公有云环境运维建立运维标准和流程。 5、负责企业应用部署、发布系统、CMDB等相关项目维护。 任职要求: 1、本科及以上学历,计算机及相关专业,有3年以上运维经验。 2、熟悉公有云,具有1~2年以上腾讯云或阿里云运维经验。 3、熟悉防火墙、VPN、DNS、HTTPS、TCP/IP等网络技术, 熟练使用高可用/负载均衡技术。 4、具有一定的K8S运维经验,也具备一定的云上虚拟机或者中间件资源运维经验。 5、具有mysql、redis、rabbitmq、elasticsearch、prometheus等常规业务组件丰富的运维经验。 6、有python/shell脚本编程经验,有devops自动化脚本编写开发经验优先。 7、了解基础网络知识和网络设备工作原理。 8、对于网络安全,运维安全,数据安全有一定的认知和处理经验 8、具备良好的团队合作、沟通表达能力,心态沉稳可靠。