-
工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的高并发在线服务运维保障经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先),Python等常用运维工具,有一定的脚步编写能力,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用阿里云、腾讯云平台和 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。
-
岗位职责: 负责证券公司基础设施监控巡检经验:云平台、网络、存储一线监控、转派、协助处理常见故障。 任职要求: 1、计算机及相关专业毕业,本科1年、大专2年以上相关经验; 2、有证券公司数据中心生产系统运行维护经验优先; 3、能够按照操作手册进行证券交易、清算、办公等系统的运维工作的检查; 4、有一定的编写文档的能力,能够收集证券公司信息系统的运行数据,按照模板形成统计报告; 5、证券公司应用系统监控巡检; 6、证券公司交易应用系统监控、转派、协助处理常见故障处理; 7、业务部门以及营业部运维技术问题答疑; 8、运维知识库问题整理维护; 9、推动开发解决代码改造相关问题; 10、熟悉操作系统,能够熟练运行操作系统一般检测命令; 11、良好的沟通表达能力,能够按照知识库解答一般问题; 12、熟悉Windows、Linux、VMWare的安装与调试。
-
工作职责: 1、负责SAP系统的日常维护,监控及解决系统问题,保障系统稳定运行; 2、负责SAP系统的安装、配置、升级等产品部署及系统调优; 3、负责SAP系统高可用建设,灾备环境维护; 4、负责处理用户工作中遇到的问题,分析问题,解决系统运行中发生的错误; 5、对系统性能进行监控与优化,并协助开发人员解决技术难题。 任职资格: 1、**本科及以上学历,计算机相关专业,三年以上相关工作经验; 2、精通sap basis系统管理,熟练掌握basis技术; 3、精通sap系统的基本架构和工作原理,熟练进行sap系统装配和运维; 4、熟练使用至少一种主流的脚本语言(shell、python等),具备开发自动化运维系统的能力; 5、熟悉实施文档、部署文档的编制工作; 6、有较强的逻辑分析能力,良好的沟通能力和团队合作精神; 7、有强烈的责任心,具有细心、踏实、积极主动的工作态度; 8、了解Nginx、Tomcat、Nacos、MQ、ZK、Kafka高可用性架构原理,有实际搭建、运维经验者优先。
-
岗位职责 1、负责集团各应用系统运维,保障系统7*24小时稳定运行; 2、负责部门基础组件/中间件和业务的运维工作,设计和规划业务的高可用性、故障解决、容灾部署和节假日保障等; 3、负责运维架构优化、成本优化、高可用运维等技术运营工作; 4、负责推进相关服务问题改进,提高运维效率和质量。 任职要求 1、计算机相关专业,本科以上学历,5年以上的运维工作经验; 2、精通Linux操作系统,熟悉shell或python等语言,熟悉ansible自动化运维的使用 3、熟练nginx、keepalived、jenkins、redis、elasticsearch、kafka 、flink等中间件的集群安装部署; 4、熟悉Prometheus+Grafana监控平台的部署和配置; 5、熟悉Mysql,能熟练掌握Mysql的基本操作,能对Mysql进行性能优化,监控Mysql日常运行情况; 6、熟悉elasticsearch、flink等组件的原理及运维方式,有docker、kubernetes生产实践经验者; 6、精通大型监控架构及原理,熟悉系统、应用,数据库等组件的监控配置经验,熟悉后台分布式系统的架构及容灾设计;熟悉软件发布,运维,优化,对软件全生命周期管理有一定认识;(加分项) 7、良好的沟通、团队协作能力,责任心强,承担较大的工作压力。
-
职责描述: 1、负责公有云运维工作,故障处理,日常巡检 2、负责公有云环境搭建及监控,包括处理服务请求异常问题定位及修复等运维操作。 3、对公有云环境进行风险识别和评估,提出改进建议并修复。 4、对公有云环境运维建立运维标准和流程。 5、负责企业应用部署、发布系统、CMDB等相关项目维护。 任职要求: 1、本科及以上学历,计算机及相关专业,有3年以上运维经验。 2、熟悉公有云,具有1~2年以上腾讯云或阿里云运维经验。 3、熟悉防火墙、VPN、DNS、HTTPS、TCP/IP等网络技术, 熟练使用高可用/负载均衡技术。 4、具有一定的K8S运维经验,也具备一定的云上虚拟机或者中间件资源运维经验。 5、具有mysql、redis、rabbitmq、elasticsearch、prometheus等常规业务组件丰富的运维经验。 6、有python/shell脚本编程经验,有devops自动化脚本编写开发经验优先。 7、了解基础网络知识和网络设备工作原理。 8、对于网络安全,运维安全,数据安全有一定的认知和处理经验 8、具备良好的团队合作、沟通表达能力,心态沉稳可靠。
-
职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
-
1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力
-
职位职责: 1、设计、实施和维护高可用、高性能的豆包大模型服务架构; 2、使用Terraform和其他IaC工具管理和自动化云基础设施部署; 3、开发和优化自动化运维工具,提高模型部署效率和系统可靠性; 4、优化大规模分布式模型训练和推理的基础设施; 5、与AI研究团队密切合作,确保新模型和功能的顺利部署和稳定运行; 6、使用Terraform管理多云环境,确保基础设施的一致性和可重复性。 职位要求: 1、本科及以上学历,计算机相关专业,3年以上云计算或者大模型领域的开发或稳定性建设经验; 2、熟练掌握Python/Golang/Java中的一种语言,具备云原生相关技术栈。 加分项: 1、了解机器学习模型部署和服务化的最佳实践; 2、具备在多云环境(如AWS,GCP,Azure)中工作的经验; 3、熟悉 CI/CD 流程,有使用Jenkins,GitLab CI等工具的经验; 4、有大语言模型或其他AI大模型相关运维经验。
-
岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
-
岗位职责: 1、负责各公有云(AWS/GCP)和基础核心服务的管理和维护,包括各公有云网络、服务器、存储和k8s集群等,确保其安全、高可用和可扩展 2、负责运维团队及运维体系建设,制定并不断优化各项工作流程,完善公司运维管理规范,保障运维质量; 3、负责运维容量管理和稳定性建设,提升服务的可靠性、可扩展性以及高性能优化; 4、负责多云跨平台建设,包括AWS/GCP/阿里云跨云多活架构,以及多云k8s集群管理; 5、深入了解各项业务系统,参与业务方案讨论与设计,并推进优化服务的响应延迟、性能问题,提升服务可用性; 6、不断探索和研究新的运维技术,推动运维自动化、智能化能力建设,提升整体运维水平和风险控制能力; 7、负责推动云原生技术解决方案的制定、验证及落地,以及重要特性和核心功能的创新、技术攻关; 岗位要求: 1、**本科及以上学历,7年以上运维相关运维;具有5年以上AWS/GCP/Azure等公有云大规模资源的运维和实践管理经验;2年以上团队管理经验; 2、熟悉操作系统、容器技术、Kubernetes架构,熟悉相关网络和存储解决方案,可以独立处理复杂的k8s集群问题; 3、具备多云多中心和国际化部署管理经验; 4、具备项目管理能力和小团队管理能力,良好的沟通能力、应变能力和团队协作能力,有重大项目端到端交付经验优先; 5、具有服务意识,善于思考,积极主动、认真负责、具有高度责任感和敬业精神; 6、具有大型电商运维管理经验优先;
-
职责描述: 1、负责生产系统的操作系统和中间件日常运维管理; 2、负责生产系统的软硬件环境配置部署,系统升级、系统扩容等; 3、数据库的日常维护,包含数据库的故障排查、性能优化、备份与恢复; 4、负责系统的容量管理、故障分析、性能优化等 任职要求: 1、至少熟悉一种监控系统搭建,如Zabbix、Prometheus等; 2、至少熟悉一种集群管理工具,如Ansible等; 3、有使用集成发布工具发布构建经验优先。如:Jenkins; 4、熟悉Linux操作系统,掌握容器化部署 docker、rancher、k8s 5、精通中间件 ES、redis、zookeeper、tomcat、Nginx等中间件系统的安装、配置、升级、故障诊断、性能调优 6、熟悉Python、Shell至少1种语言; 7、熟悉关系型和非关系型数据仓库的相关知识与技能; 8、熟悉天翼云、阿里云平台相关配置及服务优先; 9、具有国家承认的本科及以上学历、学位。
-
职位职责: 1、通过在线/远程/短期驻场等方式服务企业核心客户,解决客户在使用飞书过程中遇到的各类产品问题,和企业建立良好合作关系,达成个人业务指标(续约率/DNR),对业务结果负责; 2、系统性、数据化分析企业用户需求和反馈,了解用户核心需求,提炼服务价值形成报告定期更新; 3、通过自身专业能力,和产品研发等团队协同配合,推动产品优化迭代及维护产品知识等方式降低客户问题反馈率,保证目标达成。 职位要求: 1、专科以上学历,具备两年以上技术支持、客户运维等岗位工作经验; 2、具备良好的沟通表达能力和团队合作意识,可以快速理解客户业务场景/需求/痛点,维持良好的合作关系; 3、具备良好的产品思维,清楚产品的设计理念、价值点、功能点以及可以解决的具体问题; 4、具备良好的抗压能力,能够在繁杂的工作中迅速找到应对的方法和良好的心态解决问题; 5、具备良好的数据分析能力,能从大量数据中提取有效信息,发现可优化点,并进行总结和落地。
-
岗位职责: 1. 负责美团核心交易业务的稳定性保障工作; 2. 参与设计与开发devops工具,包括但不限于容量规划、资源管理、机房容灾、故障分析等; 3. 精细化数据运营,包括可用性指标、历史事故、资源利用率等,挖掘系统薄弱点,落地改进项目; 4. 积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档。 岗位基本要求: 1、 计算机相关专业。深入理解Linux系统,精通TCP/IP、HTTP等协议,具备扎实的网络、计算机体系结构方面的知识; 2、 至少熟悉一门编程语言,java/python/go,能开发工具提升效率; 3、 热爱技术,责任感强,拥有强大的项目执行力和良好的沟通协作能力; 4、 工作细致、善于思考,有较强的分析和解决问题的能力; 5、 具备良好的沟通以及协调能力,能独当一面,也擅长团队作战。
-
岗位职责: 1、负责运维室出入审核、授权,根据值班计划进行值班 2、负责机房视频监控与现场巡检。 任职要求: 1、本科及以上学历,计算机及相关专业; 2、有 Linux、网络、数据中心维护经验; 3、熟练掌握office等办公类应用软件; 4、具备较好的沟通能力和执行力,工作责任心强,抗压力强; 5、能适应夜间及周末值班要求。
-
岗位职责: (1)负责公司网络设备配备、使用和管理; (2)组织系统信息化网络设施建设实施和运维管理; (3)负责承担网络专线运行维护和管理工作; (4)负责协助网络突发事件、故障等的应急处理,协助制定故障处理流程和应用预案的相关工作,对一、二线人员提供技术支持; (5)负责领导交办的其他工作。 任职资格: (1)计算机、通信、电子工程等相关专业本科及以上学历,2年以上网络运维工作经验; (2)熟悉主流网络设备(如交换机、路由器、防火墙等)的配置、管理和维护; (3)精通TCP/IP协议栈,熟悉网络原理和技术; (4)具备良好的网络故障排查和问题解决能力,能独立处理复杂的网络问题; (5)具备较强的学习能力和团队合作精神,能适应高强度的工作压力; (6)有网络认证(如CCNA、CCNP、HCIE等)者优先; (7)有大型网络项目经验或云网络运维经验者优先。