-
工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的高并发在线服务运维保障经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先),Python等常用运维工具,有一定的脚步编写能力,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用阿里云、腾讯云平台和 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。
-
职位职责: 1、设计、实施和维护高可用、高性能的豆包大模型服务架构; 2、使用Terraform和其他IaC工具管理和自动化云基础设施部署; 3、开发和优化自动化运维工具,提高模型部署效率和系统可靠性; 4、优化大规模分布式模型训练和推理的基础设施; 5、与AI研究团队密切合作,确保新模型和功能的顺利部署和稳定运行; 6、使用Terraform管理多云环境,确保基础设施的一致性和可重复性。 职位要求: 1、本科及以上学历,计算机相关专业,3年以上云计算或者大模型领域的开发或稳定性建设经验; 2、熟练掌握Python/Golang/Java中的一种语言,具备云原生相关技术栈。 加分项: 1、了解机器学习模型部署和服务化的最佳实践; 2、具备在多云环境(如AWS,GCP,Azure)中工作的经验; 3、熟悉 CI/CD 流程,有使用Jenkins,GitLab CI等工具的经验; 4、有大语言模型或其他AI大模型相关运维经验。
-
1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力
-
工作职责: 1、负责服务器部署,优化整个大规模应用架构的设计、实施、后期疑难问题解决; 2、熟悉服务性能测试,对服务器资源进行统一规划与优化; 3、完善自动监控报警系统,对业务层面、资源等关键指标进行监控与报警通知; 4、搭建完善高可用集群环境,及实现负载均衡,保证公司业务的高性能和稳定性; 5、对服务器宕机等异常等突发事件做出及时处理。 任职要求: 1、大学本科及以上学历,3年以上运维相关工作经验; 2、精通Python,Shell,熟悉网络TCP/IP/HTTPS等网络协议; 3、精通Linux操作系统以及服务器集群的搭建、设置和维护。 4、精通Redis、MongoDB、ES、RabbitMQ、Kafka的维护、调优域故障排除; 5、熟练掌握Docker容器技术,对Kubernetes等容器编排工具使用有深入理解,有生产环境使用经验; 6、熟练掌握SaltStack/Ansible等几种配置管理工具,并且能集成到Jenkins或者ci/cd系统中,并且能调优; 7、熟练使用ELK日志收集与分析系统;熟悉Jenkins持续集成,了解DevOps; 8、了解云服务相关技术,具备阿里云等云平台运维使用经验; 9、良好的沟通,团队合作意识,主动思考,学习能力和强烈责任感。
-
岗位职责: 1. 负责美团核心交易业务的稳定性保障工作; 2. 参与设计与开发devops工具,包括但不限于容量规划、资源管理、机房容灾、故障分析等; 3. 精细化数据运营,包括可用性指标、历史事故、资源利用率等,挖掘系统薄弱点,落地改进项目; 4. 积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档。 岗位基本要求: 1、 计算机相关专业。深入理解Linux系统,精通TCP/IP、HTTP等协议,具备扎实的网络、计算机体系结构方面的知识; 2、 至少熟悉一门编程语言,java/python/go,能开发工具提升效率; 3、 热爱技术,责任感强,拥有强大的项目执行力和良好的沟通协作能力; 4、 工作细致、善于思考,有较强的分析和解决问题的能力; 5、 具备良好的沟通以及协调能力,能独当一面,也擅长团队作战。
-
岗位职责: (1)负责公司网络设备配备、使用和管理; (2)组织系统信息化网络设施建设实施和运维管理; (3)负责承担网络专线运行维护和管理工作; (4)负责协助网络突发事件、故障等的应急处理,协助制定故障处理流程和应用预案的相关工作,对一、二线人员提供技术支持; (5)负责领导交办的其他工作。 任职资格: (1)计算机、通信、电子工程等相关专业本科及以上学历,2年以上网络运维工作经验; (2)熟悉主流网络设备(如交换机、路由器、防火墙等)的配置、管理和维护; (3)精通TCP/IP协议栈,熟悉网络原理和技术; (4)具备良好的网络故障排查和问题解决能力,能独立处理复杂的网络问题; (5)具备较强的学习能力和团队合作精神,能适应高强度的工作压力; (6)有网络认证(如CCNA、CCNP、HCIE等)者优先; (7)有大型网络项目经验或云网络运维经验者优先。
-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
-
岗位描述: 1.负责大数据平台调度作业的日常监控、维护及协助优化; 2.负责建立大数据开发规范并持续完善,能够对技术风险、技术交付质量进行管控; 3.负责常规需求中底层数据开发及数据服务封装开发; 4.深入理解数据平台架构,发现并协助解决性能屏障; 5.新技术研究和应用,并推动适合的技术应用于生产。 任职要求: 1.本科及以上学历,计算机及软件工程相关专业; 2.2年以上大数据系统开发或运维经验,熟悉hadoop生态圈、CDH大数据平台; 3.熟悉数据规范流程及数据维度模型,精通sql、shell,了解spark、python、scala、flink; 4.具有较强的计算机网络、系统运维专业基础,熟悉掌握常用linux命令; 5.有体系化大数据平台运维工作经验优先考虑。
-
职位职责: 1、通过在线/远程/短期驻场等方式服务企业核心客户,解决客户在使用飞书过程中遇到的各类产品问题,和企业建立良好客情关系,达成个人业务指标(续约率/DNR),对业务结果负责; 2、系统性、数据化分析企业用户需求和反馈,了解用户核心需求,提炼服务价值形成报告定期更新; 3、通过自身专业能力,和产品研发等团队协同配合,推动产品优化迭代及维护产品知识等方式降低客户问题反馈率,保证目标达成。 职位要求: 1、本科及以上学历,具备技术支持、客户运维等相关岗位工作经验; 2、具备良好的沟通表达能力和团队合作意识,可以快速理解客户业务场景/需求/痛点,维持良好的客情关系; 3、具备良好的产品思维,清楚产品的设计理念、价值点、功能点以及可以解决的具体问题; 4、具备良好的抗压能力,能够在繁杂的工作中迅速找到应对的方法和良好的心态解决问题; 5、具备良好的数据分析能力,能从大量数据中提取有效信息,发现可优化点,并进行总结和落地。
-
岗位职责: (1)负责公司计算机类设备配备、使用和管理; (2)负责公司信息化系统应用软件、中间件、数据库等搭建配置工作。 (3)负责协助公司研发团队开展应用配置,技术攻坚工作。 (4)组织系统信息化基础设施建设实施和运维管理; (5)负责承担互联网数据中心监控环境搭建和管理工作; (6)负责组织管理公司容灾备份体系的建设和运维; (7)负责协助网络突发事件、故障等的应急处理,协助制定故障处理流程和应用预案相关工作、对一、二线人员提供技术支持; (8)负责领导交办的其他工作。 任职资格: (1)年龄在28至40周岁,**本科及以上学历(留学回国人员应取得教育部相应学历学位认证),具有国内外知名院校本科及以上学历(留学回国人员应取得教育部相应学历学位认证),计算机科学与技术等相关专业,身体健康,具有正常履行岗位职责的身体条件; (2)5年以上 Linux 相关工作经验,要求熟练掌握 Linux 相关技能; (3)熟悉ORACLE、MYSQL、Redis、MongoDB等数据库日常运维,熟练掌握SQL语句,精通常用数据库调优; (4)熟悉Nginx、Tomcat、MQ、kafaka、zookeeper、zabbix、elk等主流开源软件的配置维护,具备解决web服务管理与维护异常能力; (5)熟悉K8s、Docker、Istio、Gitlab-ci、ansible、Jenkins等运维技术,具有自动化运维、自动化发布部署的运维经验,能独立部署常用k8s等中间件; (6)熟悉开源监控平台prometheus/zabbix/grafana等,对系统的健康监控报警,具有自动化监控运维工具开发及配置经验; (7)有 OpenStack、Cloudstack 等云平台或虚拟化交付运维经验优先; (8)对DevOps理念有深刻理解并具备实践经验; (9)熟练使用 Python、Shell、Ansible 等脚本语言之一,有实际项目或工具开发经验; (10)至少能熟练掌握和运用腾讯云,阿里云或华为云的一种或多种,进行应用系统的部署和日常公有云运维;具有有腾讯专有云 TCE 及产品运维经验优先; (11)良好的内外部沟通、组织、协调能力,有较强的敬业精神与工作责任心;
-
工作职责: 1、负责SAP系统的日常维护,监控及解决系统问题,保障系统稳定运行; 2、负责SAP系统的安装、配置、升级等产品部署及系统调优; 3、负责SAP系统高可用建设,灾备环境维护; 4、负责处理用户工作中遇到的问题,分析问题,解决系统运行中发生的错误; 5、对系统性能进行监控与优化,并协助开发人员解决技术难题。 任职资格: 1、**本科及以上学历,计算机相关专业,三年以上相关工作经验; 2、精通sap basis系统管理,熟练掌握basis技术; 3、精通sap系统的基本架构和工作原理,熟练进行sap系统装配和运维; 4、熟练使用至少一种主流的脚本语言(shell、python等),具备开发自动化运维系统的能力; 5、熟悉实施文档、部署文档的编制工作; 6、有较强的逻辑分析能力,良好的沟通能力和团队合作精神; 7、有强烈的责任心,具有细心、踏实、积极主动的工作态度; 8、了解Nginx、Tomcat、Nacos、MQ、ZK、Kafka高可用性架构原理,有实际搭建、运维经验者优先。
-
职责描述: 1、负责生产系统的操作系统和中间件日常运维管理; 2、负责生产系统的软硬件环境配置部署,系统升级、系统扩容等; 3、数据库的日常维护,包含数据库的故障排查、性能优化、备份与恢复; 4、负责系统的容量管理、故障分析、性能优化等 任职要求: 1、至少熟悉一种监控系统搭建,如Zabbix、Prometheus等; 2、至少熟悉一种集群管理工具,如Ansible等; 3、有使用集成发布工具发布构建经验优先。如:Jenkins; 4、熟悉Linux操作系统,掌握容器化部署 docker、rancher、k8s 5、精通中间件 ES、redis、zookeeper、tomcat、Nginx等中间件系统的安装、配置、升级、故障诊断、性能调优 6、熟悉Python、Shell至少1种语言; 7、熟悉关系型和非关系型数据仓库的相关知识与技能; 8、熟悉天翼云、阿里云平台相关配置及服务优先; 9、具有国家承认的本科及以上学历、学位。
-
所有岗位均可远程办公,以下是每个岗位的重点要求,详细JD可私信发送 -golang:熟悉中间件开发,或者熟悉Docker, Kubernetes(K8s),或者处理过高并发业务 -编译器开发:掌握编译原理和基本概念、编译器开发经验、解释器开发经验 -引擎开发:交易系统、分布式事务、分布式交易方向,开发语言golang或者LinuxC都可以;互联网背景优先 -数据负责人:数据组负责人,负责数据组日常管理及数据工作流程制定等;数据要求:千万级以上用户量,总处理数据规模大于100T,单日处理数据居量在亿级别; 管理经验:有带领10-20人团队经验,并且可独立参与技术细节; -数据开发:需要有flink经验 -运维负责人:运维小组负责人,负责运维组工作统筹规划、流程制度建设 -运维工程师:大厂体系化工作经验优先;分系统运维、应用运维、运维体系建设等三个大方向,有k8s/AWS云等经验优先 -研发工程师:最好有大厂体系化工作经验;分系统运维、应用运维、运维体系建设等三个大方向,有k8s/AWS云等经验优先 -前端:react技术栈
-
岗位职责: 1、IT安全管理规划及体系建设,完成对系统纵深防御体系建设,部署维护安全检测、监控或阻断系统; 2、保障系统自身业务安全、运维安全、网络安全、数据安全、主机安全等; 3、负责包括WAF、IPS、审计、态势感知、审计、端点检测和响应工具(如防**)等安全设备的配置和管理; 4.负责系统自身安全风险及隐患发现分析,针对存在的安全问题,设计安全策略和解决方案。 岗位要求: 1、本科以上学历,网络通信、信息安全、计算机及其相关专业; 2、具有3年以上的网络和计算机安全方面的工作经验; 3、具有CISSP、CISA、COBIT、CCIE、CCNP、CISP、CIW等认证者优先考虑; 4、熟悉国内外主流的网络安全产品和技术,如防火墙、IPS、WAF、堡垒机、终端产品等,具有使用经验并能熟练操作和配置; 5、熟悉国家信息安全相关政策、法规与标准,熟悉信息安全管理体系与信息安全风险评估的理论、过程和方法; 6、熟悉主流网络设备、操作系统、网络应用系统配置和安全加固,熟悉黑客攻防技术,能够处理突发性安全事件; 7、具有良好的沟通能力和文档撰写能力,能够适应较大的工作压力。
-
岗位职责: 1.为应用平台设计规范的运维解决方案及运维工具开发工作; 2.提高现有系统的自动化程度,包括Linux下的部署、运维平台、CMDB平台、监控系统等; 3.研发基础服务组件,解决共性需求,减少重复开发与运维; 4.参与部分生产系统开发及维护工作,解决生产系统问题及进行系统调优 5.领导安排的其他工作 岗位要求: 1、3年以上运维开发经验,1年以上系统运维经验。 2、熟练掌握Django REST framework 开发框架、Celery开发框架和熟悉restful规范 3、熟悉运维方面基础组件以及运维工具使用 4、熟悉Linux,能够以Linux作为工作环境,熟悉命令行操作 5、良好的沟通能力和解决问题能力,强烈的责任心和主动性