• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、设计、实施和维护高可用、高性能的豆包大模型服务架构; 2、使用Terraform和其他IaC工具管理和自动化云基础设施部署; 3、开发和优化自动化运维工具,提高模型部署效率和系统可靠性; 4、优化大规模分布式模型训练和推理的基础设施; 5、与AI研究团队密切合作,确保新模型和功能的顺利部署和稳定运行; 6、使用Terraform管理多云环境,确保基础设施的一致性和可重复性。 职位要求: 1、本科及以上学历,计算机相关专业,3年以上云计算或者大模型领域的开发或稳定性建设经验; 2、熟练掌握Python/Golang/Java中的一种语言,具备云原生相关技术栈。 加分项: 1、了解机器学习模型部署和服务化的最佳实践; 2、具备在多云环境(如AWS,GCP,Azure)中工作的经验; 3、熟悉 CI/CD 流程,有使用Jenkins,GitLab CI等工具的经验; 4、有大语言模型或其他AI大模型相关运维经验。
  • 15k-30k·14薪 经验3-5年 / 本科
    金融 软件开发 / 不需要融资 / 2000人以上
    职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
  • 12k-20k·13薪 经验3-5年 / 本科
    企业服务,金融 / 不需要融资 / 2000人以上
    工作职责: 1、负责ACS国产化云平台大模型推理集群日常的监控、标准处理、可控风险变更、报表制作和性能容量分析等运维工作; 2、根据行里运维目标,参与AI大模型云平台的运维开发工作,通过运维工具的不断优化运维质量和效率; 3、负责处理来自研发的标准化问题,以及处理研发的标准服务请求; 4、参与AI基础设施建设和测试等工作。 任职要求: 1、本科及以上学历,计算机科学与技术、软件工程、人工智能、数据科学与大数据技术等IT相关专业; 2、熟练掌握至少一种编程语言:Java、Python、Go语言等,掌握数据结构、函数、模块等基础知识,能够进行简单的算法实现; 3、掌握常见算法和数据结构:掌握排序等算法,数组、链表、栈、队列、树、图等数据结构; 4、具备良好的沟通能力,能够清晰高效理解运维产品设计思路,具备交互思维,具有全局观,能独立推动项目前进; 5、具备较强的学习能力,能够快速掌握新的知识和技能,对IT技术有一定热情。 6、具备英伟达NVIDIA DLI相关培训和认证资质的优先。 "
  • 15k-20k·15薪 经验3-5年 / 本科
    其他,金融 / 不需要融资 / 2000人以上
    岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
  • 20k-40k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、探索和研究数据中心网络自动化与智能化技术; 2、研发字节跳动全球数据中心网络监控与运维平台。 职位要求: 1、本科及以上学历,计算机、通信及相关专业; 2、两年及以上Linux平台开发经验; 3、熟悉数据中心网络架构,至少掌握C/C++/Python/Go等语言之一; 4、良好的分析问题、解决问题的能力,具有一定的攻坚能力; 5、责任感强,有良好的服务意识与团队合作意识。 具备以下条件者优先: 1、有机器学习、分布式系统、大数据开发经验者优先; 2、有大型管理平台或运维平台系统开发经验者优先。
  • 19k-28k·15薪 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    岗位职责: 1. 大数据平台组件运维及优化,进行必要的二次开发; 2. 数据湖、数据仓库技术研究及落地; 3. 实时、离线数据产品设计及开发。 任职要求: 1. 本科及以上学历,计算机及相关专业; 2. 3-5年Java/Scala开发经验,熟悉多线程编程; 3. 熟悉大数据生态相关技术,有二次开发经验者优先; 4. 熟悉实时及离线数仓架构及开发流程,有Phoenix/StarRocks使用经验优先; 5. 熟悉常见设计模式,熟悉如Spring/SpringMVC/Mybatis等主流框架; 6. 有较强的学习能力与逻辑思维能力,良好的团队合作精神。
  • 25k-40k·14薪 经验3-5年 / 本科
    区块链 / 上市公司 / 150-500人
    岗位职责: 1、负责大数据相关组件的架构规划、设计、运维、治理,保障平台服务的稳定性及可用性; 2、负责制定和完善大数据全链路风险评估、变更流程、运维规范、应急预案相关SRE体系建设; 3、深入参与大数据基础设施建设及性能优化,问题定位处理,; 4、负责大数据组件性能POC工作,协助解决组件技术问题。 岗位要求: 1、本科以上学历,计算机类、数学类、数据类相关专业,并有三年以上大数据领域工作经验; 2、熟悉java, go, python等至少一种开发语言; 3、深入理解hadoop大数据生态组件(Hadoop、Hive、Spark、Flink),从事过相关组件的架构设计、研发运维、性能调优或迁移工作; 4、有过组件二次开发经验或者AWS云数据仓库使用经验,加分项; 5、了解SRE方法和原则的实际经验,能够设计和执行故障演练和混沌工程,加分项; 6、具备系统化解决问题的能力,有良好的沟通能力,积极主动、自驱力强,有责任心,并且有一定抗压能力;
  • 9k-16k 经验5-10年 / 本科
    其他 / 不需要融资 / 2000人以上
    岗位职责 1、负责集团各应用系统运维,保障系统7*24小时稳定运行; 2、负责部门基础组件/中间件和业务的运维工作,设计和规划业务的高可用性、故障解决、容灾部署和节假日保障等; 3、负责运维架构优化、成本优化、高可用运维等技术运营工作; 4、负责推进相关服务问题改进,提高运维效率和质量。 任职要求 1、计算机相关专业,本科以上学历,5年以上的运维工作经验; 2、精通Linux操作系统,熟悉shell或python等语言,熟悉ansible自动化运维的使用 3、熟练nginx、keepalived、jenkins、redis、elasticsearch、kafka 、flink等中间件的集群安装部署; 4、熟悉Prometheus+Grafana监控平台的部署和配置; 5、熟悉Mysql,能熟练掌握Mysql的基本操作,能对Mysql进行性能优化,监控Mysql日常运行情况; 6、熟悉elasticsearch、flink等组件的原理及运维方式,有docker、kubernetes生产实践经验者; 6、精通大型监控架构及原理,熟悉系统、应用,数据库等组件的监控配置经验,熟悉后台分布式系统的架构及容灾设计;熟悉软件发布,运维,优化,对软件全生命周期管理有一定认识;(加分项) 7、良好的沟通、团队协作能力,责任心强,承担较大的工作压力。
  • 消费生活 / 上市公司 / 2000人以上
    美团平台为用户的基础产品体验负责,还承担了美团的用户增长、市场和品牌营销、前端技术基础设施建设以及多条业务线的产品设计职责,建立了融合文字、图片、视频和直播等不同形式的內容生态系统,同时整合地图服务部、客户服务和体验部、企业业务部、网约车业务部等部门,致力于用科技提升美团数亿消费者、近千万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、负责活动营销和投放平台建设,包括基于用户完整生命周期的营销工具、自动化营销平台、多渠道用户触达平台、业务管理系统的业务支持; 2、负责日均过亿PV流量的美团营销活动核心能力研发、活动平台建设,围绕拉新召回、承接转化、留存等场景做互动营销、游戏化沉淀、玩法探索,达到业界先进的性能和用户体验; 3、根据业务中长期规划,制定合理的前端项目/技术规划,并负责规划落地执行,带领团队拿到结果,推动业务高效、有序迭代; 4、参与前端架构设计、规范、研发流程、团队文化建设; 5、参与前端技术规划、生态构建、方案演进、以及前沿技术的预研和落地; 6、参与项目的研发、发布、监控等各种基础建设,参与编码按照产品需求和技术需求实现,保障产品高效稳定运行; 7、高质量的设计和编码,优秀的技术热情,不断优化用户体验; 8、能在理解产品业务的基础上,提升产品用户体验,技术驱动业务发展; 9、通过对系统的设计和实现承载技术创新思想、技术驱动业务变革,同时给团队成员设计和创造提升能力的时间和锻炼机会; 10、对团队的中长期整体布局产生影响,为团队的质量带来变革 岗位基本需求 1、大学本科及以上学历,计算机或相关专业,5年及以上前端经验; 2、扎实的前端基本功(JS/HTML5/CSS3/HTTP 协议),编码能力优秀,具有良好的工程方法和设计能力; 3、对主流前端技术栈有全面、深入的理解,包括不限于源码透读、框架的二次开发等; 4、独立思考,具备良好的抽象能力和架构设计经验,能独立负责中大型跨团队项目的前端技术选型及推进实施,以架构角色参与过中大型前端项目; 5、热爱研究和探索创新的开发思路和前端技术,优化前端框架、设计方案,提高前端的开发交付效率; 6、良好的技术嗅觉、产品意识、想象力、执行力,并且具备优秀的程序设计、架构和编码能力; 7、对前端技术发展有前瞻性,对前沿技术领域有深刻理解、重视性能和开发效率; 8、深入了解 JavaScript 的和浏览器工作原理,技术攻坚能力; 9、善于发现产品体验中的问题,优秀的分析和解决问题能力、抽象延展能力,能分析、解决和归纳一类问题; 10、业务敏感度强,拥有良好的自驱力、推动力、沟通协作和学习能力,热爱思考,注重效率,善于总结和分享,能够深刻影响其他人; 11、对技术有强烈的进取心,具有良好的沟通能力和团队合作精神、优秀的分析问题和解决问题的能力; 12、有丰富的前端研发和架构经验,对技术方案的关键优缺点以及限制有近乎直觉的判断力,有行业一流的实践结果; 13、研究和探索创新的开发思路和新的前端技术,解决产品开发过程中的疑难问题;持续进行产品交互体验改进及性能优化提升;基础框架、工具链、组件库等基础设施设计、开发和维护 14、能基于现有技术栈,结合业务场景提出最优方案,能很好的平衡需求与时间的矛盾; 15、熟悉跨浏览器、跨终端的前端开发,有NodeJs开发及运维经验者优化; 16、良好的学习能力、沟通能力,追求完美,有工作激情,能承受较高的阶段性压力 17、具有良好的逻辑思维能力和业务敏感度,乐于创新,良好的团队沟通和协作能力,善于挖掘用户需求,能够利用技术推动业务发展和提升用户体验 具备以下者优先 痴迷技术,有推进技术发展的热情和用技术推动生产力发展的经验,参与被业界广泛使用的开源架构者优先; 有大型营销活动前端经验,对游戏化、新玩法方向有沉淀者优先; 有自己的技术产品、参与或拥有开源项目、活跃的开源社区贡献者; 有丰富项目管理或团队管理经验优先; 岗位亮点 亿级流量产品,技术氛围浓厚,重视前沿技术研究,发展空间大; 能和互联网一流研发团队的技术大牛一起,综合学习,共同进步;
  • 20k-30k·14薪 经验3-5年 / 本科
    电商平台 / C轮 / 2000人以上
    岗位职责: 1. 负责AI平台的开发及维护 2. 大语言模型对接、参数调优、系统插件开发 3. 参与技术决策、技术选型、技术架构和技术风险评估,解决各类型系统潜在的风险,保证系统安全性、稳定性及可用性 4. 追踪AIGC相关技术,快速学习并应用于平台 任职要求: 1. 有3年及以上后端开发经验,了解工作流和自动化相关的系统 2. 熟练掌握Java体系结构,包括基础类库、多线程、JVM、IO等,并熟练运用各种流行的开源框架和互联网技术组件,并有相关的常见问题处理经验 3. 具有良好的软件工程知识和编码规范意识,注重代码质量,有一定的代码追求,研究过Java优秀开源软件的源码并有一定心得 4. 熟悉消息队列、缓存技术、服务优化,系统性能调优等技术 5. 参与过大型复杂分布式系统的设计开发,对设计高可用、高性能、可拓展、可伸缩系统有深刻的理解 6. 具有较好的沟通协作能力,责任心强;能独立分析和解决问题,具备良好的团队合作精神和抗压能力 7. 对AIGC、大模型有一定理解和使用经验者优先
  • 电商平台 / C轮 / 2000人以上
    岗位职责: -电商场景下的策略平台建设 -电商场景下的流量分发体系建设 岗位要求: -计算机及相关专业本科及以上学历,具有扎实的代码功底,熟悉常用的算法和数据结构 -精通Java语言和框架,熟悉了解Python语言,具有良好的编程习惯,熟悉Linux开发环境,掌握设计模式 -掌握多线程及高性能的设计编码及性能调优,有高并发应用开发经验,对服务治理体系有充分的理解和应用 -熟悉Hadoop/Hive/HBase/Spark/Flink/ES等计算框架,熟悉Docker技术及Kubernetes容器调度系统 -具备推荐系统、广告系统、搜索系统后台开发经验者优先 -具备一定的架构能力,有大容量、高性能、分布式系统的设计开发经验优先 -有广告或者电商场景下的流量分发策略开发经验优先
  • 15k-30k·15薪 经验5-10年 / 本科
    消费生活 / 上市公司 / 2000人以上
    岗位职责: 1.优化平台内商家治理机制,搭建合规治理体系,保证平台公平秩序和长期健康发展; 2.基于业务商业模式、行业和平台发展现状,识别重点治理场景,制定治理策略,并驱动产品化、系统化闭环落地; 3.协同内外部资源,确保关键风险治理项目保质按时交付,并长效持续运营; 岗位基本要求: 1.本科及以上学历,5年以上大型公司商户运营相关经验;2年以上平台或商户治理运营经验;具备平台治理、行业管控规则制定、商户治理体系设计和落地经验优先; 2.出色行业洞察、业务和数据分析能力,善于应用数据分析工具,独立分析发现和挖掘问题;能拆解战略方向落地到目标和可执行计划层; 3.出色的策略制定和组织设计能力;强执行,有协调多方资源、推落地、拿结果能力; 4.具备快速学习成长的自驱力;工作态度严谨,责任心强,关注细节,有较强的独立分析及解决问题的能力。
  • 15k-20k 经验3-5年 / 本科
    IT技术服务|咨询 / 不需要融资 / 50-150人
    1. 负责业务平台的支持、部署、故障处理等工作。 2. 与腾讯联合开发DevOps平台的私有化版本,并制定部署、运维方案。 3. 参与DevOps平台的建设,提升开发运维自动化水平 4. 制定部署、发布、运维相关标准与规范。 5. 对DevOps平台的实施负责,为DevOps平台的实施提供技术支撑。 职位要求: 1. 计算机相关专业本科及以上学历,3年以上运维相关经验 2. 具备Docker、Kubernetes的运维技能与排障能力 3. 掌握java、python、shell等1-2门语言 4. 掌握git原理,对git的各种业务逻辑和技术逻辑有理解的优先 5. 具备SQL数据库运维能力,熟悉NoSQL、ansible、ES一种或以上的优先 6. 具有良好的沟通表达、协调组织及解决应用系统问题的能力 7.必须熟练K8S
  • 25k-50k 经验5-10年 / 不限
    工具类产品,内容社区,音频|视频媒体 / 上市公司 / 2000人以上
    岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
  • 25k-35k·14薪 经验3-5年 / 本科
    金融 / 未融资 / 500-2000人
    工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的高并发在线服务运维保障经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先),Python等常用运维工具,有一定的脚步编写能力,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用阿里云、腾讯云平台和 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。