-
岗位职责: 负责监IT系统、网络和服务器的监控,确保系统的正常运转和稳定性,及时发现和解决问题,对于一体化监控平台提出规划和建设方向,为集团以及子公司提供一体化监控的服务和管理能力 岗位要求: 1、有一体化监控平台(metrics、log、trace)建设经验者优先 2、具有良好的沟通协调能力、学习能力以及服务意识 3、熟悉zabbix、prometheus、grafana等常用工具 4、熟悉容器等云原生技术环境 6、了解技术运维体系
-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
-
美团平台为用户的基础产品体验负责,还承担了美团的用户增长、市场和品牌营销、前端技术基础设施建设以及多条业务线的产品设计职责,建立了融合文字、图片、视频和直播等不同形式的內容生态系统,同时整合地图服务部、客户服务和体验部、企业业务部、网约车业务部等部门,致力于用科技提升美团数亿消费者、近千万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 负责终端技术平台监控方向的服务端的技术方案设计、需求把控、核心功能开发,将业务需求拆解细化并实施 指导并参与产品的架构规划、性能优化、故障排查和解决、安全加固等工作; 驱动团队与产品和其他技术团队密切合作; 构建团队并培养团队成员,组织技术分享,促进团队成员进步 岗位基本需求 岗位基本要求: 3年以上互联网研发工作经验;具有扎实的计算机科学功底,扎实的编程基础和数据结构算法基础,极强的编程能力和问题解决能力; 深入理解面向服务的架构、熟悉JavaWeb应用框架和工具链、熟悉Linux/MySQL/NoSQL等; 精通Java及面向对象设计开发、设计模式,面对复杂系统、复杂问题有化繁为简的能力; 有业务开发经验,对原有系统有深度和广度的了解,以及对原有系统的改进意见(包括业务架构,业务流程等善于交流,有良好的团队合作精神和协调沟通能力,有与产品、前端、移动端等多方密切配合的经验和意识; 本科及以上学历。 具备以下者优先 具备大前端监控告警、DevOps&AIOps、大数据处理经验者 岗位亮点 有机会构建服务于全美团的大前端自动化&智能化运维系统
-
工作职责 1、负责公司业务系统运维工作,提升业务稳定性和工程效率,与业务方保持高效沟通,建立良好的合作关系。 2、负责重大项目的业务上线评审,配置变更,状态监控,容量管理,应急响应工作。 3、负责线上重大问题排查,紧急事故处理,后续事故分析与优化。 4、负责业务高可用建议与管理,包括限流,降级,容错,容灾,双活,确保业务连续性。 5、负责业务故障演练,应急预案,SOP手册编写工作,确保故障时的快速恢复。 6、负责运维规范,流程文档编制,并协同devops团队将其工具化,平台化,确保运维稳定性,提升运维效率。 任职要求 1、本科以上学历,3年以上互联网公司运维相关经验。 2、有丰富的系统故障排查和解决经验,拥有良好的解决问题的能力。 3、熟悉Nginx,消息队列,Nacos,配置中心等常用中间件的维护与使用。 4、熟悉常见监控系统,如Grafana,Prometheus,Zabbix,Cat等。 5、熟悉主流运维批量管理工具,如ansible,salt-stack,puppet等。 6、熟悉主流公有云厂商IaaS和PaaS产品,以及相应配置和维护经验。 7、掌握Python/Shell/Golang等1-2种语言,有项目开发经验者优先。 8、熟悉JVM虚拟机的内存机制,GC机制,能进行Java运行异常的故障定位及排查优先。 9、良好的团队合作意识,高度的责任感,较强的学习能力。
-
岗位描述: 1.负责大数据平台调度作业的日常监控、维护及协助优化; 2.负责建立大数据开发规范并持续完善,能够对技术风险、技术交付质量进行管控; 3.负责常规需求中底层数据开发及数据服务封装开发; 4.深入理解数据平台架构,发现并协助解决性能屏障; 5.新技术研究和应用,并推动适合的技术应用于生产。 任职要求: 1.本科及以上学历,计算机及软件工程相关专业; 2.2年以上大数据系统开发或运维经验,熟悉hadoop生态圈、CDH大数据平台; 3.熟悉数据规范流程及数据维度模型,精通sql、shell,了解spark、python、scala、flink; 4.具有较强的计算机网络、系统运维专业基础,熟悉掌握常用linux命令; 5.有体系化大数据平台运维工作经验优先考虑。
-
工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的高并发在线服务运维保障经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先),Python等常用运维工具,有一定的脚步编写能力,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用阿里云、腾讯云平台和 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。
-
【岗位职责】 1. 负责中间件的全生命周期管理,包括安装部署、日常监控、故障诊断与性能优化,确保系统高效稳定运行; 2. 建立并优化中间件预警、告警、巡检机制,提前识别风险,提升运维效率和系统可靠性; 3. 负责日志平台的整体运维,确保高可用运行,包括设计并实施高效的应用日志收集机制,以及进行深入的异常分析,同时保障日志数据的合规存储与安全处理; 4. 负责私有云产品的运维,专项工作管理与推进,保证专项目标达成。 【任职要求】 1. 本科及以上学历,计算机相关专业,4~7年运维工作经验; 2. 精通Nginx、Kafka、RockerMQ、Zookeeper等主流中间件的安装部署、日常运维、故障诊断及性能调优; 3. 熟练掌握Vector、Filebeat等日志收集组件,具备日志系统的日常运维、故障排查及性能优化能力; 4. 具备丰富的Linux系统运维经验,熟悉TCP/IP、HTTP/HTTPS等网络通信协议,能够独立解决复杂的系统和网络问题 ; 5. 精通Shell、Python或Go等至少一种编程语言,能够编写高效的运维自动化脚本或工具,提升运维效率; 6. 熟悉Docker等容器技术的构建、部署及运维管理,具备Kubernetes(K8s)集群的运维管理经验,能够高效管理容器化应用; 7. 具备良好的沟通协调能力和团队合作精神,能够与开发团队紧密配合,共同解决技术难题,推动项目顺利进行。
-
岗位职责: (1)负责公司网络设备配备、使用和管理; (2)组织系统信息化网络设施建设实施和运维管理; (3)负责承担网络专线运行维护和管理工作; (4)负责协助网络突发事件、故障等的应急处理,协助制定故障处理流程和应用预案的相关工作,对一、二线人员提供技术支持; (5)负责领导交办的其他工作。 任职资格: (1)计算机、通信、电子工程等相关专业本科及以上学历,2年以上网络运维工作经验; (2)熟悉主流网络设备(如交换机、路由器、防火墙等)的配置、管理和维护; (3)精通TCP/IP协议栈,熟悉网络原理和技术; (4)具备良好的网络故障排查和问题解决能力,能独立处理复杂的网络问题; (5)具备较强的学习能力和团队合作精神,能适应高强度的工作压力; (6)有网络认证(如CCNA、CCNP、HCIE等)者优先; (7)有大型网络项目经验或云网络运维经验者优先。
-
岗位职责: 1、参与设计、实现能够保障业务稳定,提供运维工作效能的自动化平台; 2、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等; 3、为大型系统构建自动化运营解决方案;与系统开发团队合作,从系统设计到上线的整个生命周期内保障系统可靠性; 4、通过监控系统组件可用性、性能指标提升系统可见性,帮助系统开发以及团队快速定位故障。 岗位要求: 1、***大学本科及以上学历,计算机或相关专业,3年以上相关工作经验; 2、扎实的计算机软件基础知识:了解 Linux 操作系统、存储、网络IO等相关原理,能熟练配置及优化Nginx、Tomcat、Redis、ELK等中间件; 3、熟悉一种或多种编程语言,例如 Python/Go/Java/Shell;精通python,有web开发能力优先; 4、熟练使用Ansible、Puppet等运维自动化工具; 5、具备系统化解决问题的能力,有良好的沟通技巧和主人翁责任感; 6、熟悉k8s容器平台,对部署、调度、监控等有深入理解; 7、参与或发布过开源项目,有运维平台开发经验者优先。
-
职位职责: 1、运用先进的网络技术,实时监控数据中心网络状态,快速发现、定位网络故障,提升网络可用性及效率; 2、开发和完善数据中心网络监控基础服务,优化网络数据采集、处理及可视化工具; 3、开发网络告警系统,运用训练学习算法提供实时准确的异常检测及故障定位; 4、与网络工程师协作,开发自动化网络故障诊断系统,为业务提供排障分析服务; 5、基于网络元数据,开发网络数据平台,提供实时准确反映网络状况及趋势的指标。 职位要求: 1、计算机科学、电子工程及相关专业,本科及以上学历; 2、2年及以上网络监控和报警系统实践经验,对网络协议和TCP/IP协议栈有深入的了解; 3、具有网络监控和报警系统领域的实践或研究经验,并在开发大数据处理方面具有坚实的基础优先。
-
工作经历:3年以上网络运维管理相关工作经验,网络集成商优先。 证书:CCIE、HCIE或者同等级别认证。 技术要求: 1. 网络基础知识扎实; 2. 熟练配置主流品牌数通设备、防火墙,理解其工作原理,可以通过查文档和做实验,理解网络设备特性,解决网络问题; 3. 了解F5的配置和工作原理; 4. 具备一定的文档编写能力; 5. 了解Linux常用命令。 6. 了解AAA产品使用、流量回溯分析系统产品使用者优先。 7. 掌握python者优先。 8. 有网络监控系统搭建和运维经验者优先。 项目要求:有大中型网络方案设计、实施、运维经验者优先。
-
岗位职责: 1. 制定和优化运维解决方案,推动完善部署、监控的自动化; 2. 对业务架构中存在的性能问题,能够进行全方位的性能优化; 3. 对运维工作有热情,关注运维前沿技术; 4. 有敏感的安全意识,能及时发现和解决安全问题; 5. 完成日常工作过程中的其他工作。 任职要求: 1. 本科或以上学历,计算机相关专业者优先; 2. 能够使用shell,python完成日常运维工作,完善部署,监控流程; 3. 熟悉系统应用架构和基础架构的部署和设计,并能够提出优化建议; 4. 沟通能够强,有很强的风险识别能力和工作执行力; 5. 有良好的学习能力和工作责任心。
-
岗位描述: 1、负责招商银行业务系统的运维保障工作; 2、负责业务系统的架构审核、业务监控、持续交付、应急响应、容量规划; 3、负责线上服务高效稳定运行,支撑业务和数据量的快速扩张; 4、深入理解业务系统的整体架构,发现并解决重大故障及性能瓶颈; 5、理解业务需求,协调研发团队与资源供给团队,推动业务系统的部署落地。 岗位要求: 1、2年以上相关运维经验,了解原生云技术原理,有实际部署维护经验优先。 2、熟悉金融行业主要业务和应用系统,对金融行业应用软件、系统软件管理有较深入理解,熟悉金融行业应用软件开发设计、测试和运维特点。 3、熟悉tomcat、MQ、nginx各类中间件等优先。 4、精通一门以上脚本语言(Shell/Python等),有自动化、智能化系统应用及研发架构的经验。 5、熟悉当前热门的容器生态核心开源项目,如Docker、Kubernetes等。 6、对自己的工作有要求,对自己成长有规划;有较好的学习能力、抗压能力和自我管理能力。有很好的技术敏感度和风险识别能力,有不断钻研和探索的精神,有解决疑难问题的毅力和决心。 7、良好的服务意识,善于团队协作,项目管理,主动思考,自我驱动力强。
-
熟恶业界主流Linux操作系统(SUSE、麒麟等)基础运维,了解现代操作系统原理,熟悉常用系统、网络、数据库的操作;熟悉主流云平台(华为云优先),具备大规模云平台运维经验,熟悉计算、存储、网络虚拟化技术,具备Openstack建设维护经验,有HCIE等技术认证优先熟悉脚本编程语言(shell、python等),具备编写自动化运维工具的能力; 数悉常用监控工具(Prometheus、Zabbix等),具备建设OS性能监控平台以及进行数据分析和性能分析的能力;了解VMware虚拟化系列产品原理和运维操作:了解FC-SAN、RoCE SAN、集中存储、分布式存储的相关技术和运维操作。
-
岗位职责 1,主要进行自动化运维工具系统,和公司相关内部系统的开发 2,监控体系优化和开发,配置相关监控面板 3,Linux环境服务器调优,故障处理,日常巡检,Linux为主 4,协助处理腾讯云/阿里云等公共云上的运维工作 任职资格 1,**专科以上学历,能使用VUE/React开发简单的前端界面 2,较深度掌握linux操作系统,shell达到非常熟悉程度 3,python开发熟练,有至少一个以上项目开发经验,熟悉flask web、sqlalchemy优先 4,安全/数据库(mysql)/虚拟化和容器/自动化运维, 具备在海量环境下的独立运维能力优先 5,了解ansible,saltstack自动化运维工具优先 6. 具备良好的团队合作、沟通表达能力,心态沉稳可靠。