• 35k-70k 经验5-10年 / 本科
    企业服务,工具 / 未融资 / 15-50人
    1、ceph分布式存储系统的维护及性能优化。 2、ceph分布式存储的产品应用以及业务需求开发。 3、ceph分布式存储bug解决和定制开发。 4、ceph分布式存储系统的运维支持,及时发现系统隐患、瓶颈,并解决问题。 1、计算机或相关专业本科以上学历,5年以上开发经验。 2、精通C/C++或golang语言,熟悉Linux/Unix平台开发,至少熟悉一种脚本语言。 3、了解KVM,QEMU,libvirt等虚似化组件,熟悉VFS、Block Layer内核机制和磁盘读写原理。 4、熟悉ceph的源代码和内在工作原理,能对其进行性能优化、问题修复。 5、熟悉ceph,有丰富的线上部署、日常运维、扩缩容、性能分析、故障定位处理能力。 6、有钻研精神,态度积极,自我驱动。 加分条件: 1、熟悉windows RBD,有iSCSI协议协议的开发经验优先。 2、有无盘系统搭建和维护经验优先。
  • 20k-30k·13薪 经验5-10年 / 本科
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    职位描述: 1、负责业务系统的运维保障工作,通过不断优化技术架构,为业务提供安全、稳定,高效,易用的系统服务能力,支撑业务和数据量的快速扩张 2、负责公司关键业务线的高可用能力保障,沉淀业务保障关键能力,如应急响应、故障恢复、故障演练,健康巡检等 3、负责业务系统相关各组件运行状态的整体把控,根据业务需要,快速进行优化调整,解决组件相关系统瓶颈 4、具备自主学习思考能力,通过不断提高技术能力解决运维体系的稳定性、效率、成本、管理等场景问题 职位要求: 1、计算机相关专业,五年以上互联网运维工作经验 2、深入理解Linux系统,对内核参数、系统参数有优化经验 3、熟悉Haproxy、LVS、DNS、Nginx、MySql、Redis、Tomcat、Zookeeper、RabbitMQ、Kafka、Prometheus等主流开源软件技术及相关高可用架构 4、熟悉分布式对象存储,如:seaweedFS、minio、ceph等 5、熟悉shell或python脚本编写和开发,能根据需求开发脚本工具 6、熟悉Docker,Kubernetes容器化环境 7、有高并发业务系统运维经验 8、熟悉java类应用系统、微服务架构、分布式系统等运维工作 9、具有一定网络基础知识,了解常见网络设备日常配置 10、有很好的技术敏感度和风险识别能力,能够独立分析、排查疑难问题
  • 25k-40k 经验5-10年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、作为公司三线专家,支持公司一线、二线工程师关于存储的疑难问题解决,能作为专项技术的托底角色; 2、速响应和解决生产环境中的故障,执行紧急修复措施,并分析根本原因,提出长期解决方案; 3、编写相关技术方案、应急演练和应急操作方案、技术和运维规范,对历史问题进行复盘管理和提炼体系化改善方案; 4、参与存储运维提效的整体的设计、数字化转型和运维数字化建模、数据采集分析和治理的方案设计; 5、团队内开展深度技术的分享;公司存储技术的知识库建设,团队技术能力成长的有计划的、可衡量的培训方案。 任职要求 1、本科及以上学历,6年以上存储故障处理实战工作经验; 2、精通主流SAN,NAS存储技术,熟悉对象存储技术,熟悉存储硬件及软件架构; 3、精通集中式存储产品,对至少一家SAN、NAS全球头部产品相关技术及其故障处理思路和业务规划及配置流程非常熟悉; 4、精通分布式存储产品,对Ceph、Glusterfs、daos存储原理及其故障处理思路和业务规划及配置流程非常熟悉; 5、精通存储压力测试参数及调优方式,至少熟悉以下压测工具中的一种 (vdbench,fio,lOmeter,lOzone,cosbench); 6、精通存储数据保护技术,对存储解决方案,例如raid2.0+,快照,克隆,远程复制,双活,0拷贝有较深入解; 7、熟悉存储网络 (SAN) 技术,对scsi协议、FC协议、nvme的协议格式和命令能参照文档进行解读; 8、熟悉主流操作系统和开源数据库架构、存储技术栈的调用关系,如linux的IO技术栈、数据库数据存储结构和数据操作进程; 9、熟悉存储常用业务场景,包括不限于数据库,虚拟化等; 10、有阿里云、华为云认证优先。
  • 35k-70k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责字节跳动的自研对象存储 (EB级) 的基础研发工作,提供稳定可靠的存储服务; 2、深入理解业务场景的需求,实现对象存储平台化。 职位要求: 1、熟悉Ceph, Minio等,阅读过相关的代码实现,有相关开源项目的代码贡献优先; 2、熟练掌握Linux环境下的C/C++/Go/Python/Shell/PHP等一种以上语言; 3、具备一定的网络知识,熟悉TCP/IP通信原理; 4、熟悉分布式系统的基本架构,并清晰不同架构的优缺点以及适用的场景优先。 具备以下条件之一者优先: 1、具有内核、操作系统相关开发经验者优先; 2、具有扎实的Linux系统编程能力,熟悉Linux系统的I/O栈优先; 3、具有熟悉Go语言,并且有一年以上的使用经验优先。
  • 15k-25k 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、参与平安云分布式存储建设工作,保证生产系统稳定运行; 2、熟悉常见的云存储产品功能、特点,参与云存储产品规划,思考并提出建议; 3、参与云存储系统核心功能的设计、开发工作; 4、保证云存储生产运行中的系统稳定运行,了解其运行情况,对问题及时进行诊断及解决; 5、与关联系统团队保持良好沟通及协作,保证各项工作稳定开展。 任职要求 1、熟悉Linux环境编程, 具有3年以上的后台开发经验 ; 2、掌握基础网络协议(TCP、HTTP等)知识,熟悉网络编程和网络服务框架等; 3、具有扎实的编程基础,熟练掌握至少一门语言c/c++/python/go/java,如无go语言经验,愿意转go; 4、追求高品质代码,对工程质量有深刻认识, 注重模块化、单元测试、异常测试; 5、熟练掌握常用数据结构和算法,熟悉多线程编程技术,熟悉分布式协议(如Paxos/Raft/Zab等) ; 6、有较强的学习能力,有强烈的求知欲和进取心,能及时关注和学习业界最新技术。 满足以下条件者优先: 1、有大规模对象、文件、块存储或数据库等项目相关经验; 2、有Ceph开发运维经验; 3、熟悉以下任一开源存储系统源码:beegfs、ZFS、TiKV,Redis、HDFS、LevelDB、RocksDB、Mysql、MongoDB等; 4、熟悉Linux下 I/O协议栈; 5、具有内核,操作系统相关开发经验。
  • 25k-35k 经验5-10年 / 本科
    居住服务 / C轮 / 2000人以上
    岗位职责 1、通过设计及监控可用性,延时等服务整体健康性指标,来运维线上服务 2、负责线上系统的可靠性改进,工作包括主导SLI/SLO制定,监控改进,容量管理,变更管理,应急响应,故障演练,OP改进等各种提升可靠性工作 3、保障云原生/分布式存储/消息中心/注册中心等多个核心系统的可靠性与正常运行,同时关注系统成本与稳定性; 4、负责自如网的核心基础设施架构设计、研发和持续交付 任职要求 1、大学本科及以上学历,3年以上运维工作经验; 2、具有云原生相关组件/分布式存储/消息中心/注册中心等系统运维经验(Nginx/Kubernetes/MQ/ZK/ETCD/Ceph等) 3、熟悉go、python等常用运维开发语言及框架; 4、熟悉主流容器化技术,具备Kubernetes使用经验; 5、有丰富的系统运维经验,对常见的系统隐患、系统故障有系统性总结和实际处理经验; 加分项 1、有自动化构建系统、配置管理、CI/CD系统、监控报警等自动化运维平台建设经验者优先; 2、有ServiceMesh使用维护经验者优先;
  • 14k-26k 经验3-5年 / 本科
    金融 / 不需要融资 / 50-150人
    运维工程师   工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。   任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:Ads Infra(广告系统架构)是负责建设字节跳动中国区广告业务架构与基础架构的中台团队。Ads Infra的工作职责包括:负责字节跳动中国区的广告投放系统、广告算法服务和深度学习能力的架构设计与实现;负责抖音、今日头条等各端上的广告业务中台系统研发;负责构建高并发、高性能、高可用的服务框架,设计和研发多数据中心的广告系统架构。我们一端链接广告主的海量营销需求,一端承载字节跳动中国区产品、媒体合作伙伴的海量流量,依托可靠的计算广告技术和深度学习能力,精准匹配广告与用户需求,让营销更高效、更智能、更可持续。 1、为字节跳动商业化场景定制专属的存储、缓存等数据基架,支撑抖音、今日头条、西瓜视频、番茄小说、穿山甲等各类产品广告业务的快速构建与持续发展; 2、参与建设广告新一代特征存储系统(ACache),持续优化性能、成本、稳定性,加强其扩展定制能力; 3、参与建设广告数据平台与数据生态,优化业务在数据存储、流转、使用、加工等各方面的体验,提升业务迭代效率,降低运营成本; 4、承担广告业务需求洞察与存储方案指导的职责,深入了解各类广告业务需求,参与各类存储方案的指导、审核与纠错工作,推动技术架构的整体迭代与不断演进。 职位要求: 1、本科及以上学历,计算机、软件工程等相关专业,具备扎实的计算机基础; 2、熟练掌握C/C++程序开发,追求高品质代码,注重代码的工程质量; 3、熟悉Linux操作系统和开发环境,具备良好的数据结构和系统设计能力,熟悉任意一种语言的多线程、网络编程和分布式开发; 4、善于独立思考,能够主动发现问题,具备系统化的问题分析和问题解决能力,对未知领域有一定的学习、探索和研究能力; 5、具备存储经验(熟悉LevelDB/RocksDB、Redis、Cassandra/HBase/Hdfs/Ceph等)者优先; 6、具备互联网广告系统、搜索引擎、个性化推荐系统开发经验者优先,开源社区活跃贡献者优先。
  • 14k-25k·15薪 经验1-3年 / 本科
    软件服务|咨询,人工智能服务 / 天使轮 / 50-150人
    关于我们: 1. MetaGPT 已在 GitHub 上获得 4w+ Stars,是全球领先的多智能体框架; 2. 团队拥有世界尖端的AI落地经验,获 NeurIPS / KDDCup 多个世界**,工作发表于 TPAMI、ICLR、KDD、CVPR、AAAI 等顶会顶刊; 3. 我们致力于通过多智能体实现自然语言编程,希望你具有 Critical Thinking,热爱解决难题; 4. 你将与一群充满热情的小伙伴一起,深入研究 LLM Agent,直面前沿难题,贡献开源、撰写论文,高速提升; 岗位职责: 1. 参与公司通用的中台技术体系的构建; 2. 参与后台基础建设工作,包括新技术的调研、基础工具的设计与开发; 3. 负责高质量的设计和编码,承担有挑战的技术攻坚; 任职要求: 1. 1-3年后端开发经验,计算机/软件工程等相关专业**本科以上学历; 2. 计算机基础扎实,有良好的数据结构与算法功底,有良好的代码设计能力和编码规范; 3. 熟练掌握Linux环境编程,熟悉Python,有python tornado、flask等后端技术者优先; 4. 能完成后端架构、接口的实现与设计,对ceph/hdfs等分布式文件系统、kubernetes等容器生态链、分布式服务、高可用系统等有接触或者经验的优先; 5. 责任心强,热爱技术,有良好的协作能力和逻辑思维,善于分析和闭环解决问题; 6. 有智能体的规划、工具、指令遵循、RAG、经验、需求理解、环境、人机交互、多智能体协同、构建数据、benchmark,优化效果等认知; 7. 加分点:Python 能力、开源贡献、LLM 微调、RL 经历、相关论文。
  • 25k-35k 经验5-10年 / 本科
    IT技术服务|咨询 / D轮及以上 / 500-2000人
    工作职责: 1、负责青云自研分布式块存储产品中元数据管理、多副本分布、集群管理与RDMA网络的研发工作; 2、承担分布式块存储、云原生存储中RDMA链接管理、读写流程优化等关键技术攻关、产品研发和线上运维工作; 3、洞察网络和存储前沿趋势,深入理解存储业务场景需求,针对性提供辅助工具,提升产品易用性、稳定性和运维能力。 岗位要求: 1、本科及以上学历,计算机相关专业,精通c/c++/golang 2、熟悉分布式存储系统原理,熟悉Poxos/Raft协议,具有存储软件系统研发5年以上工作经验,具备ceph研发运维经验者优先 3、精通RDMA Roce网络、OFED驱动及Mellanox硬件,有网络性能调优经验者优先; 4、具备扎实的linux kernel知识,熟悉kernel IO栈优先。
  • 40k-60k 经验3-5年 / 本科
    电商 / 上市公司 / 2000人以上
    京东文件存储团队服务于京东商城各个业务方,主要产品有:京东图片系统,对象存储系统,和分布式文件系统(chubaofs论文已经被sigmod2019大会接受,并进入cncf基金会),诚邀架构师,软件开发工程师加盟,与京东存储专家一道,自研业界领先的存储系统。薪酬不限  1.熟悉分布式存储理论,对分布式存储有浓厚的兴趣  2.熟悉go,c编程  3.熟悉分布式存储软件优先(hdfs,ceph等) 
  • 20k-40k 经验1-3年 / 本科
    通讯电子 / 不需要融资 / 2000人以上
    【岗位类型】 od岗位 【团队介绍】 我们是2012中软下面的数据库存储团队,负责下一代gaussdb的分布式存储组件开发 【岗位职责】 参与华为下一代云原生数据库构建,负责高可用raft,元数据管理,gc,流控,高性能,高可靠,可观测性,分布式文件锁,ndp等关键能力的设计与实现 【岗位要求】 1.具备软件开发经验,熟练掌握c++开发 2.对数据库存储方向感兴趣,学习能力强 3.具备良好的沟通和协作能力 4.本科及以上学历 【加分项】 1.了解postgresql,mysql,opengauss,leveldb,rocksdb,ceph等项目 2.有性能调优相关经验,熟悉相关工具 3.了解分布式一致性协议,raft/paxos 4.了解存储顶会fast,数据库顶会vldb,sigmod,icde相关最新动态
  • 15k-20k 经验5-10年 / 大专
    教育 / 不需要融资 / 150-500人
    岗位职责 1:承担相关培训课程讲授,把控授课质量,提升班级学员技术 2:参与培训课程研发与升级,优化课程质量 3:配合学院内部课程研发工作 4:完成上级交办的其他事项,协助同事完成临时性工作 岗位要求 1:本科及以上学历,计算机、电子信息、云计算相关专业; 2:精通阿里云计算产品及其相关技术,通过阿里云计算ACP认证者优先; 3:精通VMWare、KVM的虚拟化及Docker容器化和kubernetes管理技术; 4:精通TCP/IP路由交换技术,具备华为HCIP认证优先考虑; 5:精通Linux系统相关知识,具备RHCE认证者优先考虑; 6:掌握Shell、Python、Java、Golang其中至少两门开发语言; 7:掌握MySQL、Oracle12c、Redis和MongoDB数据库技术; 8:掌握Ansible、Saltstack自动化运维分布式架构; 9:掌握DevOps流水线部署工具链中CI/CD技术; 10:精通Zabbix监控应用; 11:精通Openstack私有云体系; 12:掌握GFS、FastDFS、Ceph分布式存储;
  • 15k-20k 经验不限 / 本科
    IT技术服务|咨询 / D轮及以上 / 500-2000人
    负责分布式存储集群各个组件(硬件,软件)的监控,数据收集以及存储,展示功能 负责分布式存储系统的监控,告警系统 负责分布式存储集群的自动化运维设计与开发,通过技术手段提升运维效率和运维质量 负责运维系统的开发和版本迭代 负责存储管理web界面的后端功能实现与监控告警功能 探索智能运维的技术方向,实现自动化故障分析,预警,以及自动化故障处理决策 对线上故障进行排查,总结自动化运维的改进点 完善运维体系和流程 能力要求: 1.计算机或者相关背景,有良好的数据结构和算法基础 2.熟悉Linux系统,掌握 C/Golang/shell至少一种编程语言 3.对使用技术手段提高生产效率有极致追求 4.了解web后端相关技术,如nginx 优先条件 1.熟悉常用的开源产品如Prometheus,Alertmanager等开源运维工具 2.熟悉容器存储以及容器技术,例如kubernetes, Docker 3.熟悉开源分布式存储产品如(Ceph, Gluster, HDFS) 4.熟悉web后端框架
  • 25k-50k 经验不限 / 本科
    IT技术服务|咨询 / 天使轮 / 50-150人
    T4-T8都有HC 工作职责: - 参与新一代数据分析平台查询引擎和存储引擎研发。 - 包括但不限于SQL解析规划器,查询优化器,分布式执行,单机执行引擎,资源调度,列式存储、存算分离等模块的研发和调优。 岗位要求: - 熟悉C/C++/Java/Python/Golang/Rust等任意一门编程语言,熟悉数据结构和算法等基础知识 - 熟悉系统结构原理和编程(多线程编程、网络编程、高并发高性能调优) - 有较强的责任心,良好的沟通协作能力,较强的学习能力 - 加分项:熟悉大数据分析平台原理和源代码(包括但不限于hadoop, spark, flink, doris, clickhouse, impala, presto, greenplum, snowflake, redshift, druid, hive, iceberg等) - 加分项:熟悉关系型数据库原理和源代码 (包含但不限于 mysql, postgresql, oracle, sql server等) - 加分项:熟悉存储系统原理和源代码(包括但不限于 hbase, kudu, rocksdb, parquet, ceph,对象存储, 云磁盘等)