-
职位职责: 1、设计、实施和维护高可用、高性能的豆包大模型服务架构; 2、使用Terraform和其他IaC工具管理和自动化云基础设施部署; 3、开发和优化自动化运维工具,提高模型部署效率和系统可靠性; 4、优化大规模分布式模型训练和推理的基础设施; 5、与AI研究团队密切合作,确保新模型和功能的顺利部署和稳定运行; 6、使用Terraform管理多云环境,确保基础设施的一致性和可重复性。 职位要求: 1、本科及以上学历,计算机相关专业,3年以上云计算或者大模型领域的开发或稳定性建设经验; 2、熟练掌握Python/Golang/Java中的一种语言,具备云原生相关技术栈。 加分项: 1、了解机器学习模型部署和服务化的最佳实践; 2、具备在多云环境(如AWS,GCP,Azure)中工作的经验; 3、熟悉 CI/CD 流程,有使用Jenkins,GitLab CI等工具的经验; 4、有大语言模型或其他AI大模型相关运维经验。
-
职位职责: 1、负责数据中心管理平台的建设工作,制定专业的产品规划和设计方案,并推动落地实施; 2、深入挖掘业务需求,开展业务调研与需求收集,运用数字化手段解决业务痛点; 3、建立并完善数据中心基础设施的数字化模型,为自动化、智能化运营提供可靠的技术和数据支撑; 4、与运营、研发团队紧密协作,构建并迭代创新的数字化解决方案,提升数据中心基础设施的整体管理水平; 5、承担部分产品运营工作,推进产品的持续优化和迭代,确保产品价值持续提升。 职位要求: 1、拥有数据中心、电力行业或工业自动化相关数字化平台产品设计或研发工作经验者优先; 2、深入了解配电自动化、电力监控等相关技术体系,具备电力系统运行监控、分析、诊断等平台能力建设的实践经验; 3、优秀的逻辑思维和战略分析能力,能将复杂的业务需求抽象成具体的产品方案; 4、出色的文档撰写能力,能够高质量完成产品需求文档、产品说明书等关键文档; 5、认真严谨,具备高度的责任心和强烈的自驱力;具有卓越的沟通能力和团队协作精神,能协调多方资源达成目标。
-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
岗位职责: 1. 大数据平台组件运维及优化,进行必要的二次开发; 2. 数据湖、数据仓库技术研究及落地; 3. 实时、离线数据产品设计及开发。 任职要求: 1. 本科及以上学历,计算机及相关专业; 2. 3-5年Java/Scala开发经验,熟悉多线程编程; 3. 熟悉大数据生态相关技术,有二次开发经验者优先; 4. 熟悉实时及离线数仓架构及开发流程,有Phoenix/StarRocks使用经验优先; 5. 熟悉常见设计模式,熟悉如Spring/SpringMVC/Mybatis等主流框架; 6. 有较强的学习能力与逻辑思维能力,良好的团队合作精神。
-
工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的高并发在线服务运维保障经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先),Python等常用运维工具,有一定的脚步编写能力,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用阿里云、腾讯云平台和 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。
-
岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
-
岗位职责 1.负责美团全业务的广告投放平台的整体规划、目标制定、项目推进和效果评估;深入了解美团多业务对广告投放产品的目标和使用诉求,从业务发展角度出发提炼需求并设计通用方案:包括媒体自投平台、 DSP平台、网盟&联盟平台、投放数据平台、投放归因平台等,建设满足美团多业务x多流量渠道的全链路的广告投放产品平台; 2.持续提升平台工具产品的自动化能力和易用性,为投放的人效指标和用户体验负责; 3.负责投放平台产品团队管理,项目资源进度把控,协调沟通研发、运营、及其他合作部门,保证项目进展和落地并拿到结果。 岗位基本需求 1.3年及以上互联网商业后台产品设计经验,熟悉国内各大媒体平台广告系统(抖音、快手、Tencent);有商业广告平台产品设计经验、TD、DSP产品、自动化投放产品经验的优先。 2.对工具产品的用户体验有极高敏感度;有良好的逻辑结构化思考、数据分析和业务解读能力,善于用抽象整合的能力解决多业务的复杂问题。 3.具备良好的计划、组织、沟通和执行能力,具备极高的工作热情,善于学习;有较强的自我驱动能力,能主动发现问题、解决问题、达成目标。 4.有相关团队管理经验优先。
-
岗位职责: 1.优化平台内商家治理机制,搭建合规治理体系,保证平台公平秩序和长期健康发展; 2.基于业务商业模式、行业和平台发展现状,识别重点治理场景,制定治理策略,并驱动产品化、系统化闭环落地; 3.协同内外部资源,确保关键风险治理项目保质按时交付,并长效持续运营; 岗位基本要求: 1.本科及以上学历,5年以上大型公司商户运营相关经验;2年以上平台或商户治理运营经验;具备平台治理、行业管控规则制定、商户治理体系设计和落地经验优先; 2.出色行业洞察、业务和数据分析能力,善于应用数据分析工具,独立分析发现和挖掘问题;能拆解战略方向落地到目标和可执行计划层; 3.出色的策略制定和组织设计能力;强执行,有协调多方资源、推落地、拿结果能力; 4.具备快速学习成长的自驱力;工作态度严谨,责任心强,关注细节,有较强的独立分析及解决问题的能力。
-
岗位职责: 1、负责星辰低代码平台的发展规划、方案设计、需求分析、业务流程设计、评审等; 2、负责与产品部协作,持续完善星辰业务中台能力,推动星辰中台能力建设落地; 3、负责星辰生态伙伴的需求和整理,并推动规划设计落地; 4、关注行业动态,负责竞争分析,进行竞品产品动态与行业资讯收集研究,深入了解竞品,提出合理的产品发展建议; 5、参与生态产品的客户反馈处理、对生态伙伴赋能培训和业务应用支持等; 6、分配的其他工作。 任职要求: 1、本科及以上学历,计算机及相关专业; 2、3年以产品设计工作经验, 具有产品规划与设计经验,输出产品方案,较强的文档撰写能力; 3、有较强的业务应用规划方案或技术方案规划能力; 4、关注行业趋势、用户体验等,有良好的用户感知和缜密的逻辑思维,对产品生命周期有清晰认识; 5、较强的沟通协调能力,能与不同角色人员快速高效的开展工作; 6、较强的自我学习能力和快速适应能力,能承受工作压力; 7、具备SAAS模式下的低代码平台应用设计、实施经验等优先考虑;具有苍穹平台,ERP领域相关工作经验者优先考虑。
-
岗位职责 1、负责集团各应用系统运维,保障系统7*24小时稳定运行; 2、负责部门基础组件/中间件和业务的运维工作,设计和规划业务的高可用性、故障解决、容灾部署和节假日保障等; 3、负责运维架构优化、成本优化、高可用运维等技术运营工作; 4、负责推进相关服务问题改进,提高运维效率和质量。 任职要求 1、计算机相关专业,本科以上学历,5年以上的运维工作经验; 2、精通Linux操作系统,熟悉shell或python等语言,熟悉ansible自动化运维的使用 3、熟练nginx、keepalived、jenkins、redis、elasticsearch、kafka 、flink等中间件的集群安装部署; 4、熟悉Prometheus+Grafana监控平台的部署和配置; 5、熟悉Mysql,能熟练掌握Mysql的基本操作,能对Mysql进行性能优化,监控Mysql日常运行情况; 6、熟悉elasticsearch、flink等组件的原理及运维方式,有docker、kubernetes生产实践经验者; 6、精通大型监控架构及原理,熟悉系统、应用,数据库等组件的监控配置经验,熟悉后台分布式系统的架构及容灾设计;熟悉软件发布,运维,优化,对软件全生命周期管理有一定认识;(加分项) 7、良好的沟通、团队协作能力,责任心强,承担较大的工作压力。
-
1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力
-
岗位职责: 1.负责CDH大数据平台的安装和部署; 2.负责CDH大数据平台各组件的性能优化; 3.负责CDH大数据平台各组件的运行维护和状态监控; 4.负责新技术调研,并能在团队内进行推广应用。 任职资格: 1.理解大数据计算原理,精通Hadoop/Spark体系,了解大数据平台运营基本思路; 2.熟悉HDFS、HBASE、KUDU、SPARK、HIVE等hadoop核心组件,具有两年以上hadoop/Spark技术的运维经验; 3.理解MapReduce计算框架的思想,熟悉分布式计算模型; 4.至少精通一种大数据开发语言,如JAVA、scala等; 5.至少熟练使用一种脚本语言,如Shell、Python等; 6.热爱技术,工作认真、严谨,有团队精神。
-
工作职责 1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力
-
岗位职责: (1)负责公司计算机类设备配备、使用和管理; (2)负责公司信息化系统应用软件、中间件、数据库等搭建配置工作。 (3)负责协助公司研发团队开展应用配置,技术攻坚工作。 (4)组织系统信息化基础设施建设实施和运维管理; (5)负责承担互联网数据中心监控环境搭建和管理工作; (6)负责组织管理公司容灾备份体系的建设和运维; (7)负责协助网络突发事件、故障等的应急处理,协助制定故障处理流程和应用预案相关工作、对一、二线人员提供技术支持; (8)负责领导交办的其他工作。 任职资格: (1)年龄在28至40周岁,**本科及以上学历(留学回国人员应取得教育部相应学历学位认证),具有国内外知名院校本科及以上学历(留学回国人员应取得教育部相应学历学位认证),计算机科学与技术等相关专业,身体健康,具有正常履行岗位职责的身体条件; (2)5年以上 Linux 相关工作经验,要求熟练掌握 Linux 相关技能; (3)熟悉ORACLE、MYSQL、Redis、MongoDB等数据库日常运维,熟练掌握SQL语句,精通常用数据库调优; (4)熟悉Nginx、Tomcat、MQ、kafaka、zookeeper、zabbix、elk等主流开源软件的配置维护,具备解决web服务管理与维护异常能力; (5)熟悉K8s、Docker、Istio、Gitlab-ci、ansible、Jenkins等运维技术,具有自动化运维、自动化发布部署的运维经验,能独立部署常用k8s等中间件; (6)熟悉开源监控平台prometheus/zabbix/grafana等,对系统的健康监控报警,具有自动化监控运维工具开发及配置经验; (7)有 OpenStack、Cloudstack 等云平台或虚拟化交付运维经验优先; (8)对DevOps理念有深刻理解并具备实践经验; (9)熟练使用 Python、Shell、Ansible 等脚本语言之一,有实际项目或工具开发经验; (10)至少能熟练掌握和运用腾讯云,阿里云或华为云的一种或多种,进行应用系统的部署和日常公有云运维;具有有腾讯专有云 TCE 及产品运维经验优先; (11)良好的内外部沟通、组织、协调能力,有较强的敬业精神与工作责任心;