-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
-
职位职责: 1、保障公司短视频产品的直播重保平台等核心系统的线上稳定性,对线上事故进行快速响应并建立机制、平台提升处理效率; 2、参与建设运维工具、平台,推进运维自动化; 3、通过持续的全方位数据运营(包括可用性指标、历史事故、资源利用率等),找到系统薄弱点,落地地改进项目; 4、积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档; 5、推动提升服务的可靠性、可扩展性以及性能优化,保障系统SLA。 职位要求: 1、本科及以上学历,计算机及相关专业; 2、扎实的计算机软件基础知识;了解 Linux 操作系统、存储、网络IO等相关原理; 3、熟悉一种或多种编程语言,例如Python/Go/Java/PHP/C/C++; 4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感。
-
工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的高并发在线服务运维保障经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先),Python等常用运维工具,有一定的脚步编写能力,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用阿里云、腾讯云平台和 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。
-
岗位职责: 1. 负责美团核心交易业务的稳定性保障工作; 2. 参与设计与开发devops工具,包括但不限于容量规划、资源管理、机房容灾、故障分析等; 3. 精细化数据运营,包括可用性指标、历史事故、资源利用率等,挖掘系统薄弱点,落地改进项目; 4. 积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档。 岗位基本要求: 1、 计算机相关专业。深入理解Linux系统,精通TCP/IP、HTTP等协议,具备扎实的网络、计算机体系结构方面的知识; 2、 至少熟悉一门编程语言,java/python/go,能开发工具提升效率; 3、 热爱技术,责任感强,拥有强大的项目执行力和良好的沟通协作能力; 4、 工作细致、善于思考,有较强的分析和解决问题的能力; 5、 具备良好的沟通以及协调能力,能独当一面,也擅长团队作战。
-
岗位职责: 1、负责处理系统咨询类、操作类、业务类问题解答和处理; 2、负责系统常见问题和故障的定位和处理; 3、负责中间件,数据库性能的深入分析; 4、负责系统运维手册、应急预案等文档的维护; 5、负责系统日常监控、健康检查、生产应急等; 6、负责投产管理,质控管理及投产上线支持; 7、负责自动化运维,智慧运维的实践和研究; 8、负责运维开发的相关事宜。 职位要求: 1、本科及以上学历;计算机,软件工程等相关专业; 2、了解计算机软硬件、网络、设备等基础设施的基本知识; 3、了解操作系统、数据库、中间件等基础软件基本知识; 4、熟悉Java,python语言,能够编写脚本; 5、了解微服务架构,分布式架构; 6、有较强的沟通协调能力和执行力; 7、具有较好的抗压能力。
-
if strings.Contains(passions, "coding") { switch techstack { case "Go": fallthrough case "Node.js": fallthrough case "Python": fallthrough case "Kubernetes": fallthrough case "Serverless": fmt.Println("Join AfterShip") } } 岗位职责 1、保障公司业务的稳定,积极解决业务问题;负责公司各类公有云 PaaS、SaaS 产品的维护; 2、通过自研、开源软件二开等手段提升自动化能力,提升运维效率; 3、深入业务架构,结合运维相关的最佳实践,对线上系统进行优化; 4、通过架构优化、工具平台、流程机制建设,持续提升网站稳定性,持续优化云成本; 5、梳理和完善运维文档,沉淀技术经验;参与 On-Call 值班,及时响应处理线上报警等事件。 岗位要求 1、本科及以上学历,良好的英语书写能力;至少 3 年以上互联网系统的运维经验; 2、熟悉 Linux 操作系统、计算机网络等,基础知识扎实;至少熟练掌握 Shell/Python/Go一种语言; 3、有生产环境下 K8s 的使用和维护经验;熟悉 Prometheus、Grafana 等监控工具; 4、有 GCP、AWS 等国外公有云使用经验优先,比如 GKE、Pub/Sub、Cloud Storage、Dataflow、Cloud Run 等产品; 5、有良好的线上安全意识、学习能力、团队精神和客户意识;有高度的责任感,对于工作积极严谨。 加分项 1、有丰富的 GCP 或 AWS 云平台使用经验; 2、有运维自动化平台或者 API 开发经验。 为什么加入我们 1、朝阳行业:国际电商 SaaS 服务赛道,国际一线投资机构加持; 2、稳健发展:团队稳健扩张,业务规模及营收每年持续稳健增长; 3、多元文化:团队来自全球 20 多个不同城市,国际化视角、扁平化管理; 4、极客氛围:拥抱开源技术,实践敏捷开发,崇尚通过工具和自动化来解决问题; 5、特色福利:学习基金、 一对一帮带、内部商城、提供 MacBook 及可升降办公桌。
-
【岗位职责】 1. 保障业务系统群7*24H高效稳定运行,在此期间对出现的各种问题可以快速定位并解决;在日常工作中不断优化系统架构和部署的合理性,以提升系统服务的稳定性; 2. 负责持续优化运维解决方案,包括但不限于容灾预案、智能调度、弹性扩容、精细化监控等; 3. 参与技术方案和系统设计方案评审,掌握相关的技术架构和原理,能够从运维架构角度主动识别方案风险,并给出专业的解决方案 4. 通过技术手段优化服务架构、性能调优;通过资源优化组合降低成本; 5. 设计并参与开发高效的运维工具,使用机器学习、大模型等方法推进运维AIOPS能力,利用自动化&AI能力落地运维场景下的智能化巡检、智能化监控分析、容量管理等解决方案; 6. 设计并参与开发高效的问题&故障流程,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务;通过分析问题发生时系统的各种表现(日志、变更、监控)确定问题发生的根本原因,制定并开发预案工具; 7. 架构优化:为了支持业务的不断迭代,需要不断的进行架构优化调整。以确保整个业务系统群能够在功能不断丰富和复杂的条件下,同时保持高可用性; 【任职要求】 1. 本科及以上学历,计算机及相关专业,至少五年以上大型互联网或大型金融机构相关工作经验; 2. 对Linux系统有深入理解,熟悉与理解cgroup、namespace、文件系统、内存管理、进程管理等的原理与机制; 3. 熟悉TCP/IP、HTTP等协议的实现、熟悉CDN、DNS、路由、负载均衡等工作原理与技术实现,具备机房级网络设计能力; 4. 熟练掌握和理解如nginx、lvs、redis、kafka等常见中间件的工作原理、部署和使用; 5. 精通Shell/Perl/Python/GoLang等一种及以上的脚本语言编程,具备实用提升效率; 6. 精通至少一种主流监控体系:Zabbix/Prometheus/Open falcon,具备监控体系的设计与落地能力; 7. 深入理解ITSM服务管理体系、深入理解事件管理、问题管理、变更管理、配置管理等ITIL标准流程体系,并具备一定的实践落地经验; 8. 能针对多个业务或技术领域内的系统群或集群持续优化运维体系和解决方案,包括但不限于容灾预案、成本管控、弹性扩容、精细化监控等; 9. 对于复杂问题的解决有自己的见解,对于问题的识别、优先级分配有见解,善于寻求资源解决问题,能成熟运用目标管理、项目管理等方法,有效控制复杂、多元的工作进程,以终为始地紧扣目标工作,做好过程监控并达成相关任务。
-
工作职责 1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力
-
1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力
-
工作职责 : 1、负责系统运维工作,主要包括应用系统的部署上线、变更发布、监控及故障处理等; 2、负责所负责定期的应用系统风险点梳理,监控及发现生产环境的问题和隐患,提升系统可用性; 3、所负责应用系统,协同并解决业务部门在系统使用中的问题跟踪 4、负责定期复盘和完善运维及监控体系。 任职资格 : 1、大学本科及以上学历,3年以上应用系统运维经验,具备3年以上运维管理经验; 2、熟悉linux/unix、中间件、容器,k8s相关技术,有运维开发或SRE经验优先; 3、熟悉PG/MYSQL/Redis使用及性能优化技术; 4、熟悉java/golang/python中至少一种开发语言; 5、具体良好的沟通能力,逻辑思维能力和团队合作精神,极强的工作责任心,能承担一定的工作压力。
-
职位职责: 1、承担AI私有化产品数据库及中间件的运维支持、性能优化、监控与故障诊断等任务; 2、负责AI私有化产品的容量规划、自动化部署、容灾演练,以及故障处理所需工具和系统的开发; 3、推进AI私有化产品的持续集成与交付,实现高效且自动化的运维优化,增强服务的稳定性并提升研发效率。 职位要求: 1、本科及以上学历,计算机、软件工程等相关专业优先; 2、熟悉Linux,熟练掌握Mysql/Redis/PostgreSQL/MongoDB等数据库技术原理之一,具备生产问题的快速定位与解决能力; 3、熟悉Python/Golang等开发语言之一; 4、有向量数据库领域工作经验,了解主流向量数据库系统,如Milvus、Faiss、Vector等; 5、熟悉Kubernetes、Docker、Operator等云原生/容器相关技术; 6、逻辑思维能力强,责任心强,学习能力和钻研精神突出,对技术充满热情,具备快速定位和独立解决问题的能力,以及良好的逻辑表达、沟通和技术文档撰写能力。 加分项: 1、具有公有云或企业私有云平台相关实践经验者优先,有大规模数据库运维经验者优先; 2、有大模型应用平台使用经验者优先,例如:扣子、百炼和千帆等。
-
岗位描述: 1.负责大数据平台调度作业的日常监控、维护及协助优化; 2.负责建立大数据开发规范并持续完善,能够对技术风险、技术交付质量进行管控; 3.负责常规需求中底层数据开发及数据服务封装开发; 4.深入理解数据平台架构,发现并协助解决性能屏障; 5.新技术研究和应用,并推动适合的技术应用于生产。 任职要求: 1.本科及以上学历,计算机及软件工程相关专业; 2.2年以上大数据系统开发或运维经验,熟悉hadoop生态圈、CDH大数据平台; 3.熟悉数据规范流程及数据维度模型,精通sql、shell,了解spark、python、scala、flink; 4.具有较强的计算机网络、系统运维专业基础,熟悉掌握常用linux命令; 5.有体系化大数据平台运维工作经验优先考虑。
-
一、公司简介 彩讯股份(创业板股票代码:300634)是一家软件互联网上市公司,是协同办公、 智慧渠道、云和大数据领域的龙头企业。拥有五地研发中心和遍布全国的运营网络,员工超过 3000 人。 公司坚持“以大场景运营效果为导向,全面数字化、智能化”的发展战略,持续加大在人工智能等领域的投入,将成为中国领先的智能数字化企业。 二、项目介绍 融合通信是一种新型基础通信服务,其特点是保留用户原有通信习惯、继承运营商基础通信业务全球可达性和电信级服务质量,采用网络和业务新技术升级电信运营商开展多年的基础通信服务。短信小程序、移动办公、和飞信及其他业务等应用都是结合融合通信概念打造出来的适用于各种不同业务场景的产品。 三、岗位职责: 1、负责机房日常巡检工作,按照流程上报各类故障情况; 2、负责服务器、存储、网络设备的硬件维护(故障排查、配件更换、诊断测试); 3、负责使用常用检测和维修工具,诊断设备硬件常见故障; 4、按客户要求完成设备资产管理工作。 岗位要求: 1、本科3年以上学历; 2、3年及以上运维工作经验 3、具有良好的服务意识、工作严谨细致、勤奋踏实、有责任心,具有良好的沟通能力和团队协作能力。 4、具有RHCE认证、CCNP、HCNP(HCIP)、VCP、软考中级工程师等认证或同类更高级别证书之一。 四、薪酬福利与职业发展: 我们提供竞争力的薪资待遇和福利待遇,包括期权激励、五险一金、带薪年假、节假日福利、健康体检、培训及晋升机会等。 同时,我们还为员工提供广阔的职业发展空间,鼓励员工在工作中不断成长和进步。 我们的团队充满活力、激情和创新精神,致力于打造一个开放包容、信任互助的工作环境,并定期举行各种团队建设活动,增强彼此之间的沟通和理解。 期待您的加入,一起探索未来无限可能!
-
岗位职责: 负责监IT系统、网络和服务器的监控,确保系统的正常运转和稳定性,及时发现和解决问题,对于一体化监控平台提出规划和建设方向,为集团以及子公司提供一体化监控的服务和管理能力 岗位要求: 1、有一体化监控平台(metrics、log、trace)建设经验者优先 2、具有良好的沟通协调能力、学习能力以及服务意识 3、熟悉zabbix、prometheus、grafana等常用工具 4、熟悉容器等云原生技术环境 6、了解技术运维体系
-
工作职责: 1、负责服务器的环境搭建及日常维护,保障系统稳定可靠运行; 2、负责公司相关产品的部署运维; 3、负责线上问题排查,紧急事故处理,后续事故分析与优化。 岗位要求: 1. 计算机相关专业本科及以上学历,5年以上工作经验; 2.运维经验丰富,精通python, 熟悉Linux系统管理和性能优化,熟悉docker; 3. 熟悉阿里云、腾讯云、AWS等云平台的操作; 5. 熟悉高并发、高可用、微服务系统架构者优先; 6. 熟悉Prometheus、Grafana等监控报警系统优先; 7. 自主学习能力和兴趣,能承受较强的工作压力,具备良好的沟通及团队协作精神