-
[ 职位描述 ] 1.负责公司各系统的日常运行,确保系统稳定可靠地服务于公司的日常业务。 2.负责公司各系统的用户权限管理,确保权限配置符合职责分离矩阵,满足内控、风控管理要求。 3.处理系统运行过程中出现的各种操作问题以及事件,快速响应并解决问题以减少对业务的影响。 4.分析系统及应用程序的性能问题,并提出相应的优化方案,以提高系统效率和用户体验。 5.负责系统的监控工作,实时监控系统状态,确保系统的健康运行。 6.负责系统生产环境的变更管理,确保系统安全和功能的最新状态。 7.按照要求编制运维文档,记录相关信息及解决方案,定期进行分析汇总,提交运维报告。 8.完成领导交办的其他工作。 [ 职位要求 ] 1.本科及以上学历,计算机相关专业优先考虑。 2.熟悉运维管理方法和流程,具有良好的问题分析和解决能力。 3.熟悉Linux系统的基本操作和常用命令,有Shell脚本编写经验者优先。 4.具备良好的团队合作精神和沟通能力,能够有效与用户和团队沟通交流。 5.英语四级及以上水平,能够流利地阅读和书写技术文档,口语流利者优先考虑。 [ 以上职位均要求 ] 1.有良好的团队合作精神及口头与书面的交流能力; 2.逻辑思考能力强,工作细致、踏实,有责任心与时间观念; 3.能接受工作时间着职业装,穿皮鞋。着装应庄重、大方、整洁、得体。 [其他要求] 1.有强烈的责任感,对待工作认真负责。 2.对技术有激情,对新的知识充满无穷的好奇心,能在技术道路上孜孜不倦的学习进步。 3.熟练使用英语,能用英语进行日常沟通可加分。 4.应届生在校担任过社团、学生会干部优先考虑。
-
工作职责: 1、负责服务器部署,优化整个大规模应用架构的设计、实施、后期疑难问题解决; 2、熟悉服务性能测试,对服务器资源进行统一规划与优化; 3、完善自动监控报警系统,对业务层面、资源等关键指标进行监控与报警通知; 4、搭建完善高可用集群环境,及实现负载均衡,保证公司业务的高性能和稳定性; 5、对服务器宕机等异常等突发事件做出及时处理。 任职要求: 1、大学本科及以上学历,3年以上运维相关工作经验; 2、精通Python,Shell,熟悉网络TCP/IP/HTTPS等网络协议; 3、精通Linux操作系统以及服务器集群的搭建、设置和维护。 4、精通Redis、MongoDB、ES、RabbitMQ、Kafka的维护、调优域故障排除; 5、熟练掌握Docker容器技术,对Kubernetes等容器编排工具使用有深入理解,有生产环境使用经验; 6、熟练掌握SaltStack/Ansible等几种配置管理工具,并且能集成到Jenkins或者ci/cd系统中,并且能调优; 7、熟练使用ELK日志收集与分析系统;熟悉Jenkins持续集成,了解DevOps; 8、了解云服务相关技术,具备阿里云等云平台运维使用经验; 9、良好的沟通,团队合作意识,主动思考,学习能力和强烈责任感。
-
职责描述: 1、负责生产系统的操作系统和中间件日常运维管理; 2、负责生产系统的软硬件环境配置部署,系统升级、系统扩容等; 3、数据库的日常维护,包含数据库的故障排查、性能优化、备份与恢复; 4、负责系统的容量管理、故障分析、性能优化等 任职要求: 1、至少熟悉一种监控系统搭建,如Zabbix、Prometheus等; 2、至少熟悉一种集群管理工具,如Ansible等; 3、有使用集成发布工具发布构建经验优先。如:Jenkins; 4、熟悉Linux操作系统,掌握容器化部署 docker、rancher、k8s 5、精通中间件 ES、redis、zookeeper、tomcat、Nginx等中间件系统的安装、配置、升级、故障诊断、性能调优 6、熟悉Python、Shell至少1种语言; 7、熟悉关系型和非关系型数据仓库的相关知识与技能; 8、熟悉天翼云、阿里云平台相关配置及服务优先; 9、具有国家承认的本科及以上学历、学位。
-
岗位职责: 1.为应用平台设计规范的运维解决方案及运维工具开发工作; 2.提高现有系统的自动化程度,包括Linux下的部署、运维平台、CMDB平台、监控系统等; 3.研发基础服务组件,解决共性需求,减少重复开发与运维; 4.参与部分生产系统开发及维护工作,解决生产系统问题及进行系统调优 5.领导安排的其他工作 岗位要求: 1、3年以上运维开发经验,1年以上系统运维经验。 2、熟练掌握Django REST framework 开发框架、Celery开发框架和熟悉restful规范 3、熟悉运维方面基础组件以及运维工具使用 4、熟悉Linux,能够以Linux作为工作环境,熟悉命令行操作 5、良好的沟通能力和解决问题能力,强烈的责任心和主动性
-
职位描述: 1.保障基础设施/云原生/分布式存储等核心系统的可靠性与正常运行,同时关注系统成本与稳定性; 2.通过监控系统组件可用性、性能指标提升系统可见性,帮助系统开发以及团队快速定位故障; 3.保障产品数据库系统的稳定性和可靠性;进行数据库的故障发现、定位、止损能力建设,提升数据库异常恢复速度; 4.推动提升服务的可靠性、可扩展性以及成本、性能优化,保障系统 SLA; 职位要求: 1.本科以上学历,计算机相关专业,并有5年以上相关领域工作经验; 2.熟悉一种或多种编程语言,例如 Go/Python/Java/Shell等; 3.熟悉K8S与Docker,有K8S集群运维经验者优先; 4.熟悉主流的数据库,例如 MySQL/Redis/MongoDB等,拥有数据库集群管理经验优先; 5.具备系统化解决问题的能力或工程化研发能力,良好的沟通技巧和主人翁责任感;
-
工作职责: 1、运维平台建设:基于业务迭代需要,建设大型规模生产环境管理运维平台,包含服务发布、资源管理、监控体系等; 2、运维自动化工具开发:基于SRE运维工作,理解需求背景和业务发展,开发自动化工具和平台提升效率; 3、效能效率平台建设:优化CI/CD产研流程,参与流程与规范设计,基于业务研发场景建设效能平台; 4、SRE高可用保障:参与故障应急、稳定性优化等工作,并设计系统助力运维能力提升; 5、知识沉淀:相关技术调研与文档输出。 任职要求: 1、拥有三年以上的 Golang、Python 3.x 和 Vue 实际开发经验; 2、拥有具备规模的容器平台、监控平台开发管理经验; 3、熟悉Linux (Ubuntu 优先)常用运维工具,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 4、各类效能效能效率与运维开源系统使用和开发经验:Prometheus、ELK等; 5、了解常用中间件:数据库、消息队列、服务发现等。
-
职位职责: 1、负责火山引擎混合云存储产品的交付运维产品设计与研发,为字节跳动内部业务以及火山引擎客户提供企业级存储产品服务; 2、技术规划和架构设计:深刻理解各存储产品通用能力和架构,在私有化的交付、运维场景,通过领先的架构设计和研发能力解决交付、运维场景的各种复杂问题,完成高质量的工程落地; 3、打造极致效率:深刻理解混合云存储产品研发和交付全流程特点,持续提升研发、POC、交付以及售后效率; 4、提升产品智能化能力:深刻理解大规模系统运营,结合AI for System能力,实现产品原生自治能力以及自治工具产品化,能为客户提供极致的业务连续性以及低运维能力。 职位要求: 1、深入理解linux系统,熟悉分布式系统原理及常见架构; 2、熟悉Go/Python中至少一种,对工程质量有很高的自我要求,有开源社区代码贡献者优先; 3、熟悉容器技术、云原生技术、分布式协调服务者优先,包括但不限于Kubernetes、ZooKeeper、Etcd、Prometheus等等,有源码级的了解优先; 4、有云管平台、DevOps及存储等产品开发和交付经验优先; 5、有混合云、私有云相关产品经验者优先。
-
职位职责: 1、设计、实施和维护高可用、高性能的豆包大模型服务架构; 2、使用Terraform和其他IaC工具管理和自动化云基础设施部署; 3、开发和优化自动化运维工具,提高模型部署效率和系统可靠性; 4、优化大规模分布式模型训练和推理的基础设施; 5、与AI研究团队密切合作,确保新模型和功能的顺利部署和稳定运行; 6、使用Terraform管理多云环境,确保基础设施的一致性和可重复性。 职位要求: 1、本科及以上学历,计算机相关专业,3年以上云计算或者大模型领域的开发或稳定性建设经验; 2、熟练掌握Python/Golang/Java中的一种语言,具备云原生相关技术栈。 加分项: 1、了解机器学习模型部署和服务化的最佳实践; 2、具备在多云环境(如AWS,GCP,Azure)中工作的经验; 3、熟悉 CI/CD 流程,有使用Jenkins,GitLab CI等工具的经验; 4、有大语言模型或其他AI大模型相关运维经验。
-
岗位职责 搭建区块链节点以提供高可用服务 维护节点及服务的高可用性 确保产品与服务访问的可用性与可靠性 搭建稳定多云高可用架构 任职要求 211院校计算机相关专业本科及以上学历 1-3年运维工作经验 精通云平台(AWS,GCP,Azura等) 精通常见编程架构语言(Python, Golang, Shell) 英文可作为工作语言 符合以下条件者优先 了解区块链,或运行过区块链节点
-
工作职责: 1、负责服务器的环境搭建及日常维护,保障系统稳定可靠运行; 2、负责公司相关产品的部署运维; 3、负责线上问题排查,紧急事故处理,后续事故分析与优化。 岗位要求: 1. 计算机相关专业本科及以上学历,5年以上工作经验; 2.运维经验丰富,精通python, 熟悉Linux系统管理和性能优化,熟悉docker; 3. 熟悉阿里云、腾讯云、AWS等云平台的操作; 5. 熟悉高并发、高可用、微服务系统架构者优先; 6. 熟悉Prometheus、Grafana等监控报警系统优先; 7. 自主学习能力和兴趣,能承受较强的工作压力,具备良好的沟通及团队协作精神
-
岗位职责: 1、负责运维团队协调、管理,包括基础运维、数据库运维、应用运维、PaaS运维及运维平台等; 2、建立和完善规范化的运维制度、流程、管理策略和安全策略,保障运维质量; 3、负责公司各业务平台的日常维护管理工作,保障运营系统的正常工作和应急响应; 4、负责在线服务的7*24监控响应,解决业务平台运维中遇到的各种问题; 5、负责运维团队技能提升,保证运维团队的职业化水平。 任职要求: 1、本科及以上学历,5年以上工作经验,具有通信设备全程全网3年以上维护经验,有运维团队管理经验优先; 2、 精通自动化运维工具,如Ansible;精通Linux系统管理,熟练使用python、perl、go等至少一门脚本语言; 3、了解ITIL,熟悉相关运维流程管理;有电信级平台维护经验者优先; 4、 熟悉主流的大数据软件的安装、配置及维护。如:Hadoop、Hbase、Seaweedfs、Apache Flume、 ZooKeeper等,具备相关证书者优先。 5、 熟悉常用的中间件、数据库,如mysql、mongoDB、Keepalived、LVS、Redis、Rabbit MQ、Nginx等安装、配置、使用及安全维护; 6、熟悉容器技术底层原理、K8S架构,以及PaaS组件技术,并有相关的实施和维护经验。 7、具有分析大型应用系统架构并进行改进的能力,拥有快速排查系统瓶颈、故障定位的能力; 熟悉大型平台架构规划设计和容灾备份,熟悉监控系统; 8、 熟悉操作系统、中间件及数据库的搭建、配置、监控、性能优化和维护; 9、 制定过平台运维规范,有较强的运维团队管理能力; 10、有较强的沟通及协调能力,学习能力强,做事沉稳细致、具有良好文档编写和文字表达能力。
-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、*****本科以上学历,五年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
运维工程师 工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。 任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
-
岗位职责: 1.负责卡中心生产环境服务器操作系统的升级、补丁更新、漏洞修复等; 2.负责卡中心生产环境服务器操作系统的巡检、日常投产变更、业务连续性保障等工作; 3.负责操作系统安全配置的检查及整改; 4.参与重保活动、节假日的值班工作,关注操作系统的各项指标,并在出现问题时配合团队进行故障排查; 5.在系统日常运维工作中,参与处置系统的告警,解决系统异常故障相关的疑难问题; 6.根据实际情况,完成所分配的其他工作。 任职资格: 1.计算机等相关专业本科及以上学历,三年及以上系统运维相关工作经验; 2.熟悉Linux环境基本操作,熟练使用Linux命令,具备较强的脚本或语言开发能力,熟练使用shell、pathon等至少一种脚本语言;熟练运用自动化运维工具ansible、saltstack等; 3.熟悉linux-redhat、SuSELinux、Kylin、windows等常用操作系统的运维和配置优化,可以进行安装、调测和管理操作系统;熟练操作系统的性能分析、故障处理等; 4.较强的分析和解决问题能力,较强的责任感、缜密的逻辑思维能力,有解决复杂系统问题的能力; 5.责任心强,良好的对外沟通和团队协作能力。
-
职位描述: 1、负责业务系统的运维保障工作,通过不断优化技术架构,为业务提供安全、稳定,高效,易用的系统服务能力,支撑业务和数据量的快速扩张 2、负责公司关键业务线的高可用能力保障,沉淀业务保障关键能力,如应急响应、故障恢复、故障演练,健康巡检等 3、负责业务系统相关各组件运行状态的整体把控,根据业务需要,快速进行优化调整,解决组件相关系统瓶颈 4、具备自主学习思考能力,通过不断提高技术能力解决运维体系的稳定性、效率、成本、管理等场景问题 职位要求: 1、计算机相关专业,五年以上互联网运维工作经验 2、深入理解Linux系统,对内核参数、系统参数有优化经验 3、熟悉Haproxy、LVS、DNS、Nginx、MySql、Redis、Tomcat、Zookeeper、RabbitMQ、Kafka、Prometheus等主流开源软件技术及相关高可用架构 4、熟悉分布式对象存储,如:seaweedFS、minio、ceph等 5、熟悉shell或python脚本编写和开发,能根据需求开发脚本工具 6、熟悉Docker,Kubernetes容器化环境 7、有高并发业务系统运维经验 8、熟悉java类应用系统、微服务架构、分布式系统等运维工作 9、具有一定网络基础知识,了解常见网络设备日常配置 10、有很好的技术敏感度和风险识别能力,能够独立分析、排查疑难问题