-
职位职责: 1、负责火山引擎混合云存储产品的交付运维产品设计与研发,为字节跳动内部业务以及火山引擎客户提供企业级存储产品服务; 2、技术规划和架构设计:深刻理解各存储产品通用能力和架构,在私有化的交付、运维场景,通过领先的架构设计和研发能力解决交付、运维场景的各种复杂问题,完成高质量的工程落地; 3、打造极致效率:深刻理解混合云存储产品研发和交付全流程特点,持续提升研发、POC、交付以及售后效率; 4、提升产品智能化能力:深刻理解大规模系统运营,结合AI for System能力,实现产品原生自治能力以及自治工具产品化,能为客户提供极致的业务连续性以及低运维能力。 职位要求: 1、深入理解linux系统,熟悉分布式系统原理及常见架构; 2、熟悉Go/Python中至少一种,对工程质量有很高的自我要求,有开源社区代码贡献者优先; 3、熟悉容器技术、云原生技术、分布式协调服务者优先,包括但不限于Kubernetes、ZooKeeper、Etcd、Prometheus等等,有源码级的了解优先; 4、有云管平台、DevOps及存储等产品开发和交付经验优先; 5、有混合云、私有云相关产品经验者优先。
-
职位职责: 1. 负责企业服务存储或数据库产品的测试设计和测试开发工作, 包括数据库、存储、KV、中间件等; 2. 对测试方案进行有效的落地与执行,以确保项目进度和软件质量,形成自动化测试用例并进一步形成服务化; 3. 架构并实现自动化测试平台,打造业界领先的云测平台; 职位要求: 1. 1年以上软件或软硬一体化产品系统测试经验,主导过产品或模块级测试用例的设计; 2. 熟悉一门以上脚本语言(Python/Shell等),了解一门以上开发语言(Go/Java/C/C++); 3. 熟悉数据库、存储、KV、中间件中至少一种产品 ,有相关的开发或测试经验。
-
工作职责: 1.打造贝壳的高性能存储解决方案及推动系统落地, 支撑模型开发的全链路,提高深度学习开发效率以及加速模型训练。 工作内容: 1.调研并设计高性能存储解决方案; 2.高性能存储系统落地及业务适配; 3.提高系统的吞吐及稳定性,建设完善的监控与运维体系. 任职资格: 1. 3~5 年以上后端开发经验; 2.熟悉计算机体系结构、数据结构和算法、操作系统、数据库、网络等基础原理; 3.精通 Golang 或至少一类后端编程语言(C++/JAVA/Python 等)且具备快速转向 Golang 的能力; 4.有分布式的软件架构设计、开发和运维经验,能快速定位和调试问题; 5.有良好的测试习惯以保证高质量软件的产出; 6.优秀的沟通协作能力、分析解决问题能力和学习能力; 7.熟悉 juicefs、alluxio、fluid等系统优先;
-
工作职责 1、作为公司三线专家,支持公司一线、二线工程师关于存储的疑难问题解决,能作为专项技术的托底角色; 2、速响应和解决生产环境中的故障,执行紧急修复措施,并分析根本原因,提出长期解决方案; 3、编写相关技术方案、应急演练和应急操作方案、技术和运维规范,对历史问题进行复盘管理和提炼体系化改善方案; 4、参与存储运维提效的整体的设计、数字化转型和运维数字化建模、数据采集分析和治理的方案设计; 5、团队内开展深度技术的分享;公司存储技术的知识库建设,团队技术能力成长的有计划的、可衡量的培训方案。 任职要求 1、本科及以上学历,6年以上存储故障处理实战工作经验; 2、精通主流SAN,NAS存储技术,熟悉对象存储技术,熟悉存储硬件及软件架构; 3、精通集中式存储产品,对至少一家SAN、NAS全球头部产品相关技术及其故障处理思路和业务规划及配置流程非常熟悉; 4、精通分布式存储产品,对Ceph、Glusterfs、daos存储原理及其故障处理思路和业务规划及配置流程非常熟悉; 5、精通存储压力测试参数及调优方式,至少熟悉以下压测工具中的一种 (vdbench,fio,lOmeter,lOzone,cosbench); 6、精通存储数据保护技术,对存储解决方案,例如raid2.0+,快照,克隆,远程复制,双活,0拷贝有较深入解; 7、熟悉存储网络 (SAN) 技术,对scsi协议、FC协议、nvme的协议格式和命令能参照文档进行解读; 8、熟悉主流操作系统和开源数据库架构、存储技术栈的调用关系,如linux的IO技术栈、数据库数据存储结构和数据操作进程; 9、熟悉存储常用业务场景,包括不限于数据库,虚拟化等; 10、有阿里云、华为云认证优先。
-
工作职责 1、负责分布式或集中式存储系统的部署以及日常运维工作; 2、解决项目实施运维过程中的技术难题,并提供相应的技术支持; 3、负责存储系统的运维保障、效率提升、风险管控; 4、负责存储系统复杂的服务交付、变更、事件、问题处理、服务可用性及连续性的管理; 5、负责存储系统的监控和运维工具建设、主动预防、运营分析等运维安全保障性工作。 任职要求 1、负责分布式或集中式存储系统的部署以及日常运维工作; 2、解决项目实施运维过程中的技术难题,并提供相应的技术支持; 3、负责存储系统的运维保障、效率提升、风险管控; 4、负责存储系统复杂的服务交付、变更、事件、问题处理、服务可用性及连续性的管理; 5、负责存储系统的监控和运维工具建设、主动预防、运营分析等运维安全保障性工作。
-
岗位职责: 1. 大数据平台组件运维及优化,进行必要的二次开发; 2. 数据湖、数据仓库技术研究及落地; 3. 实时、离线数据产品设计及开发。 任职要求: 1. 本科及以上学历,计算机及相关专业; 2. 3-5年Java/Scala开发经验,熟悉多线程编程; 3. 熟悉大数据生态相关技术,有二次开发经验者优先; 4. 熟悉实时及离线数仓架构及开发流程,有Phoenix/StarRocks使用经验优先; 5. 熟悉常见设计模式,熟悉如Spring/SpringMVC/Mybatis等主流框架; 6. 有较强的学习能力与逻辑思维能力,良好的团队合作精神。
-
工作内容: 1、负责自如大数据平台组件的运维 2、负责自如一站式大数据开发平台的建设 任职要求: 1、大学本科及以上学历,计算机或相关专业; 2、精通clichouse、hbase运维及封装 3、熟练掌握haoop、atlas、ranger、hive、flink、夜莺监控等大数据组件的运维,对大数据组件具备源码改造能力 4、熟练掌握Java、Python、shell,熟悉springboot; 5、有大数据项目开源社区贡献者优先
-
工作职责: 1、负责服务器的环境搭建及日常维护,保障系统稳定可靠运行; 2、负责公司相关产品的部署运维; 3、负责线上问题排查,紧急事故处理,后续事故分析与优化。 岗位要求: 1. 计算机相关专业本科及以上学历,5年以上工作经验; 2.运维经验丰富,精通python, 熟悉Linux系统管理和性能优化,熟悉docker; 3. 熟悉阿里云、腾讯云、AWS等云平台的操作; 5. 熟悉高并发、高可用、微服务系统架构者优先; 6. 熟悉Prometheus、Grafana等监控报警系统优先; 7. 自主学习能力和兴趣,能承受较强的工作压力,具备良好的沟通及团队协作精神
-
岗位职责 1,主要进行自动化运维工具系统,和公司相关内部系统的开发 2,监控体系优化和开发,配置相关监控面板 3,Linux环境服务器调优,故障处理,日常巡检,Linux为主 4,协助处理腾讯云/阿里云等公共云上的运维工作 任职资格 1,**专科以上学历,能使用VUE/React开发简单的前端界面 2,较深度掌握linux操作系统,shell达到非常熟悉程度 3,python开发熟练,有至少一个以上项目开发经验,熟悉flask web、sqlalchemy优先 4,安全/数据库(mysql)/虚拟化和容器/自动化运维, 具备在海量环境下的独立运维能力优先 5,了解ansible,saltstack自动化运维工具优先 6. 具备良好的团队合作、沟通表达能力,心态沉稳可靠。
-
岗位职责: 1、参与设计、实现能够保障业务稳定,提供运维工作效能的自动化平台; 2、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等; 3、为大型系统构建自动化运营解决方案;与系统开发团队合作,从系统设计到上线的整个生命周期内保障系统可靠性; 4、通过监控系统组件可用性、性能指标提升系统可见性,帮助系统开发以及团队快速定位故障。 岗位要求: 1、***大学本科及以上学历,计算机或相关专业,3年以上相关工作经验; 2、扎实的计算机软件基础知识:了解 Linux 操作系统、存储、网络IO等相关原理,能熟练配置及优化Nginx、Tomcat、Redis、ELK等中间件; 3、熟悉一种或多种编程语言,例如 Python/Go/Java/Shell;精通python,有web开发能力优先; 4、熟练使用Ansible、Puppet等运维自动化工具; 5、具备系统化解决问题的能力,有良好的沟通技巧和主人翁责任感; 6、熟悉k8s容器平台,对部署、调度、监控等有深入理解; 7、参与或发布过开源项目,有运维平台开发经验者优先。
-
工作职责: 1、运维平台建设:基于业务迭代需要,建设大型规模生产环境管理运维平台,包含服务发布、资源管理、监控体系等; 2、运维自动化工具开发:基于SRE运维工作,理解需求背景和业务发展,开发自动化工具和平台提升效率; 3、效能效率平台建设:优化CI/CD产研流程,参与流程与规范设计,基于业务研发场景建设效能平台; 4、SRE高可用保障:参与故障应急、稳定性优化等工作,并设计系统助力运维能力提升; 5、知识沉淀:相关技术调研与文档输出。 任职要求: 1、拥有三年以上的 Golang、Python 3.x 和 Vue 实际开发经验; 2、拥有具备规模的容器平台、监控平台开发管理经验; 3、熟悉Linux (Ubuntu 优先)常用运维工具,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 4、各类效能效能效率与运维开源系统使用和开发经验:Prometheus、ELK等; 5、了解常用中间件:数据库、消息队列、服务发现等。
-
岗位职责: 1.编写基本的运维命令; 2.参与编写变更实施方案和运维手册; 3.独立管理小型项目版本基线和配置项,发布软件版本; 4.执行软件安装部署,记录部署问题; 5.参与排查软件开发和测试过程中的问题,支持开发和测试过程; 6.受理IT服务请求,执行系统或工具点检、监控、备份和应急演练。 任职资格: 1.学历:本科及以上学历,计算机及其相关专业; 2.经验:参与过中、小型项目/产品的配置管理、集成发布或IT技术支持工作; 3.知识技能:掌握一种主流语言(Java、Python)/开发工具,了解主流操作系统(Linux),了解主流数据库(Mysql、Mongodb、Redis);具备版本管理和配置管理能力,能够执行软件安装部署;能够在指导下编写安装测试报告以及运维手册,文档结构条理清晰,内容详实准确;了解配置管理规范,或掌握基本的IT运维知识; 4.能力:具有良好的沟通、协调和表达能力,具备较强的工作责任心和抗压能力;
-
【岗位职责】 1. 负责蓝凌OA系统上线对接工作,协助项目组完成上线前系统的部署实施、性能调优、数据库调优工作; 2. 负责蓝凌OA系统日常运维及异常处理; 3. 协同办公需求分析,进行方案设计及开发实现,规范需求受理及开发流程。能利用OA开发平台和工具,开发配置新的业务管理和业务流程模块; 4. 负责蓝凌OA类二次开发项目的推进,保障项目进度和交付质量及时效; 5. 定期组织OA等信息系统的使用培训。 【任职要求】 1. ***本科以上学历,计算机相关专业; 2. 使用蓝凌系统开发年限不少3年,熟悉蓝凌系统运行底层逻辑,熟练常见OA需求场景的蓝凌开发; 3. 熟练使用蓝凌EKP开发平台,并可独立完成二次开发,有OA周边系统接口技术开发经验:熟悉蓝凌EKP系统,并可独立维护系统,确保系统的高效运行; 4. 具备良好的文档编写习惯和代码编写规范; 5. 具备一定的项目管理经验,有较强的问题分析和问题解决能力,有较强的抗压能力,具备较强的沟通协作能力,具有团队精神; 6. 自驱力强,好学,具备良好的抗压能力。
-
负责分布式存储集群各个组件(硬件,软件)的监控,数据收集以及存储,展示功能 负责分布式存储系统的监控,告警系统 负责分布式存储集群的自动化运维设计与开发,通过技术手段提升运维效率和运维质量 负责运维系统的开发和版本迭代 负责存储管理web界面的后端功能实现与监控告警功能 探索智能运维的技术方向,实现自动化故障分析,预警,以及自动化故障处理决策 对线上故障进行排查,总结自动化运维的改进点 完善运维体系和流程 能力要求: 1.计算机或者相关背景,有良好的数据结构和算法基础 2.熟悉Linux系统,掌握 C/Golang/shell至少一种编程语言 3.对使用技术手段提高生产效率有极致追求 4.了解web后端相关技术,如nginx 优先条件 1.熟悉常用的开源产品如Prometheus,Alertmanager等开源运维工具 2.熟悉容器存储以及容器技术,例如kubernetes, Docker 3.熟悉开源分布式存储产品如(Ceph, Gluster, HDFS) 4.熟悉web后端框架
-
主要岗位职责: 1、参与设计、开发存储自动化运维、监控平台,负责 存储故障处理自动化、自动化部署、灰度发布相关功能开发。 2、对存储服务的SLA负责,包含存储故障的及时处理,故障的复盘,制定改善计划;以及推动存储服务的可靠性持续改善。 3、参与运维体系建设、包含但不限于 容量规划、链路优化、巡检方案制定以及流程机制的改善。 任职资格要求: 1、本科及以上学历,计算机软件或相关专业; 2、对于分布式存储、传统存储、数据库有2年以上运维或开发经验; 3、熟悉linux系统运维、shell或pyhon 编程,熟悉linux 网络故障的排查,熟悉linux相关存储 知识。 4、有互联网大规模系统运维平台开发或运维经验,有ceph相关开发、运维经验优先。