-
职位职责: 1、负责字节跳动服务器产品供电架构、单板电源技术规划研究,并推动相关技术产品化; 2、负责服务器产品电源开发过程,紧密协作ODM厂商及内外部资源;包括系统电源需求分析、电源供电方案设计、电源选型、测试验证等工作; 3、跟进服务器硬件电源发展趋势,研究新技术&新方案,结合产品需求持续进行技术创新,并推动在新产品项目落地应用; 4、负责服务器产品电源设计质量,组织疑难问题技术攻关,结合上线应用持续优化电源质量。 职位要求: 1、本科及以上学历,通信、电子、计算机等相关专业,具有扎实的硬件基础知识; 2、5年以上服务器电源设计和开发经验,精通电源调测及问题定位,熟练使用示波器、负载仪、VRTT等测试工具; 3、有服务器主板/GPU主板等硬件电源设计及调测经验,在VRM多相电源、大功率芯片供电方案、电源效率调优、48V供电设计等方面具有积累; 4、优秀的沟通协调能力、逻辑思维能力和抗压能力;主动管理、解决问题和推动问题解决;善于思考,有团队合作精神、责任心强。
-
职位描述: 1、参与服务器的架构和模块设计 2、参与游戏团队协作,实现服务器端游戏功能 3、参与数据与业务中台的设计与建设,为产品提供灵活支持 4、研究最新技术落地实践,为产品提供竞争力 任职要求: 1、热爱技术,对优秀的技术框架和架构设计有浓厚的兴趣 2、精通各种网络通讯协议,熟悉Socket、TCP/IP编程 3、熟悉以下任意一种语言和相关框架:Java,C++,Javascript(Node.js),Go 4、熟悉任意一种 Web 前端技术, 包括但不限于 AngularJS、VueJs、React 5、熟悉 Redis,MySQL,MongoDB 等各种类型数据库 6、了解服务器监控和优化 7、五年以上游戏或互联网服务器开发经验 8、有较强的责任心,善于学习,优秀的团队精神 9、为人踏实,积极主动,具有优秀的沟通能力
-
职位职责: 1、负责服务器系统、集群的可靠性、可用度、易用性测试设计及优化,保证服务器产品RAS竞争力的落地;帮助业务团队实现系统可靠性的提升,降低业务运营成本; 2、通过对业务系统的可靠性研究,识别业务系统可靠性瓶颈和机会,从系统可靠性视角给出软硬件优化建议,促进服务器系统在关键应用场景的可靠性能力提升; 3、针对业务应用、数据中心运维等场景,识别服务器系统、软硬件、关键芯片的RAS需求,并针对相关需求制定完备的测试方案及用例,保证可靠性方案系统性的落地。 职位要求: 1、5年以上服务器或存储产品的系统集成测试经验,有复杂产品的可靠性测试经验或系统可靠性分析设计经验; 2、有服务器可靠性、可用度相关开发测试经验,熟悉FMEA等可靠性分析方法,对GPU、x86、ARM处理器至少一种的RAS体系架构及平台相关RAS特性有深入研究; 3、深入理解服务器硬件系统架构,熟悉平台硬件系统、BIOS、设备管理软件,了解操作系统、虚拟化技术、数据库、分布式存储系统和深度学习等服务器应用场景及系统架构; 4、具有在跨职能团队中协同工作的经验,具备良好的沟通能力和领导力,能够带领团队解决复杂的技术问题,推动项目的成功实施。
-
运维工程师 工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。 任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
-
工作职责 1.负责云平台计算和虚拟化集群的稳定性维护; 2.负责解决客户云主机,云备份等计算产品的售后问题,对故障定位持续进行改进和优化; 3.负责支撑云计算底座产品的迭代和演进,提高迭代和演进的效率和稳定性; 4.负责和指导开发自动化运维工具,不断研发与探索运维自动化及各类创新途径,缩短运维响应时间,降低运维成本; 5.负责客户侧上云用云方案支持工作。 技能要求 1.熟悉TCP/IP的基本原理和实际应用,精通linux操作系统,网络相关协议栈; 2.精通虚拟化相关技术,如vmware,kvm,docker,containerd等; 3.熟悉常见监控工具,如Prometheus、Grafana、ELK等; 4.至少掌握一门语言,python,go,shell优先; 5.熟悉常用linux服务,包括但不限于iptables,nginx,keepalived,lvs,等。 6.具备openstack、kubernetes等集群管理经验,具备中大规模(500+服务器)公有云或者私有云集群维护经验者优先。 任职要求 1.计算机相关专业优先; 2.具备5年以上云计算相关工作经历,有大型互联网企业云计算架构设计及维护经验者优先; 3.具备良好的学习能力及抗压能力; 4.有较强的团队意识及沟通能力。
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
职位描述: 1、负责CentOS等主流linux操作系统的运维管理,负责日常运维等工作; 2、负责公司数据中心、办公网络及设备维护工作。 3、负责及时排除运维工作过程中出现的故障,保障系统可靠稳定的运行; 4、负责相关服务的监控和预警以及故障跟进和解决。 5、负责服务过程中各部门的沟通协调工作,保障运维工作的顺利开展。 职位要求: 1,3 年以上linux系统实际维护经验,有互联网工作经验更佳。 2,熟练使用Linux命令,熟悉计算机系统和网络原理,掌握至少一门脚本语言,如python、shell、perl等; 3,熟悉nginx、tomcat、java、ftp、redis等常用服务和环境。 4,熟悉网络相关设备的基础配置,如cisco、h3c等路由器及交换机、IDC网络布线、服务器上下架等。 5,较强的学习能力,良好的沟通能力;工作积极主动,有服务意识和团队协作精神。
-
岗位职责: 1.负责卡中心生产环境服务器操作系统的升级、补丁更新、漏洞修复等; 2.负责卡中心生产环境服务器操作系统的巡检、日常投产变更、业务连续性保障等工作; 3.负责操作系统安全配置的检查及整改; 4.参与重保活动、节假日的值班工作,关注操作系统的各项指标,并在出现问题时配合团队进行故障排查; 5.在系统日常运维工作中,参与处置系统的告警,解决系统异常故障相关的疑难问题; 6.根据实际情况,完成所分配的其他工作。 任职资格: 1.计算机等相关专业本科及以上学历,三年及以上系统运维相关工作经验; 2.熟悉Linux环境基本操作,熟练使用Linux命令,具备较强的脚本或语言开发能力,熟练使用shell、pathon等至少一种脚本语言;熟练运用自动化运维工具ansible、saltstack等; 3.熟悉linux-redhat、SuSELinux、Kylin、windows等常用操作系统的运维和配置优化,可以进行安装、调测和管理操作系统;熟练操作系统的性能分析、故障处理等; 4.较强的分析和解决问题能力,较强的责任感、缜密的逻辑思维能力,有解决复杂系统问题的能力; 5.责任心强,良好的对外沟通和团队协作能力。
-
岗位职责: 1、负责运维团队协调、管理,包括基础运维、数据库运维、应用运维、PaaS运维及运维平台等; 2、建立和完善规范化的运维制度、流程、管理策略和安全策略,保障运维质量; 3、负责公司各业务平台的日常维护管理工作,保障运营系统的正常工作和应急响应; 4、负责在线服务的7*24监控响应,解决业务平台运维中遇到的各种问题; 5、负责运维团队技能提升,保证运维团队的职业化水平。 任职要求: 1、本科及以上学历,5年以上工作经验,具有通信设备全程全网3年以上维护经验,有运维团队管理经验优先; 2、 精通自动化运维工具,如Ansible;精通Linux系统管理,熟练使用python、perl、go等至少一门脚本语言; 3、了解ITIL,熟悉相关运维流程管理;有电信级平台维护经验者优先; 4、 熟悉主流的大数据软件的安装、配置及维护。如:Hadoop、Hbase、Seaweedfs、Apache Flume、 ZooKeeper等,具备相关证书者优先。 5、 熟悉常用的中间件、数据库,如mysql、mongoDB、Keepalived、LVS、Redis、Rabbit MQ、Nginx等安装、配置、使用及安全维护; 6、熟悉容器技术底层原理、K8S架构,以及PaaS组件技术,并有相关的实施和维护经验。 7、具有分析大型应用系统架构并进行改进的能力,拥有快速排查系统瓶颈、故障定位的能力; 熟悉大型平台架构规划设计和容灾备份,熟悉监控系统; 8、 熟悉操作系统、中间件及数据库的搭建、配置、监控、性能优化和维护; 9、 制定过平台运维规范,有较强的运维团队管理能力; 10、有较强的沟通及协调能力,学习能力强,做事沉稳细致、具有良好文档编写和文字表达能力。
-
岗位职责: 1.负责CDH大数据平台的安装和部署; 2.负责CDH大数据平台各组件的性能优化; 3.负责CDH大数据平台各组件的运行维护和状态监控; 4.负责新技术调研,并能在团队内进行推广应用。 任职资格: 1.理解大数据计算原理,精通Hadoop/Spark体系,了解大数据平台运营基本思路; 2.熟悉HDFS、HBASE、KUDU、SPARK、HIVE等hadoop核心组件,具有两年以上hadoop/Spark技术的运维经验; 3.理解MapReduce计算框架的思想,熟悉分布式计算模型; 4.至少精通一种大数据开发语言,如JAVA、scala等; 5.至少熟练使用一种脚本语言,如Shell、Python等; 6.热爱技术,工作认真、严谨,有团队精神。
-
职位描述: 1、负责业务系统的运维保障工作,通过不断优化技术架构,为业务提供安全、稳定,高效,易用的系统服务能力,支撑业务和数据量的快速扩张 2、负责公司关键业务线的高可用能力保障,沉淀业务保障关键能力,如应急响应、故障恢复、故障演练,健康巡检等 3、负责业务系统相关各组件运行状态的整体把控,根据业务需要,快速进行优化调整,解决组件相关系统瓶颈 4、具备自主学习思考能力,通过不断提高技术能力解决运维体系的稳定性、效率、成本、管理等场景问题 职位要求: 1、计算机相关专业,五年以上互联网运维工作经验 2、深入理解Linux系统,对内核参数、系统参数有优化经验 3、熟悉Haproxy、LVS、DNS、Nginx、MySql、Redis、Tomcat、Zookeeper、RabbitMQ、Kafka、Prometheus等主流开源软件技术及相关高可用架构 4、熟悉分布式对象存储,如:seaweedFS、minio、ceph等 5、熟悉shell或python脚本编写和开发,能根据需求开发脚本工具 6、熟悉Docker,Kubernetes容器化环境 7、有高并发业务系统运维经验 8、熟悉java类应用系统、微服务架构、分布式系统等运维工作 9、具有一定网络基础知识,了解常见网络设备日常配置 10、有很好的技术敏感度和风险识别能力,能够独立分析、排查疑难问题
-
岗位职责: 1. 负责美团核心交易业务的稳定性保障工作; 2. 参与设计与开发devops工具,包括但不限于容量规划、资源管理、机房容灾、故障分析等; 3. 精细化数据运营,包括可用性指标、历史事故、资源利用率等,挖掘系统薄弱点,落地改进项目; 4. 积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档。 岗位基本要求: 1、 计算机相关专业。深入理解Linux系统,精通TCP/IP、HTTP等协议,具备扎实的网络、计算机体系结构方面的知识; 2、 至少熟悉一门编程语言,java/python/go,能开发工具提升效率; 3、 热爱技术,责任感强,拥有强大的项目执行力和良好的沟通协作能力; 4、 工作细致、善于思考,有较强的分析和解决问题的能力; 5、 具备良好的沟通以及协调能力,能独当一面,也擅长团队作战。
-
1.负责windows线上应用服务器日常维护,配合开发及产品上线、升级、问题排查 2.负责windows erp系统的日常维护,对接外包开发配合上线、升级问题排查 3.三套堡垒机系统维护、迁移合并及权限管理 4.负责外网及国外域名续费提醒及操作 5.协助it管理域账号、企业微信及部分内部系统权限 1.熟悉windows系统及iis服务维护,掌握powershell或python脚本的日常使用 2.熟悉linux系统及mysql,sqlserver,oracle等常见应用的配置,具备判断故障点的能力 3.了解tcp/ip网络协议,能够定位系统常见的网络问题 4.具有强烈的责任心和良好的职业操守 5.从事系统运维工程师1-3年工作经验,有独立运维生产系统能力 6.**本科以上学历
-
[ 职位描述 ] 1.负责公司各系统的日常运行,确保系统稳定可靠地服务于公司的日常业务。 2.负责公司各系统的用户权限管理,确保权限配置符合职责分离矩阵,满足内控、风控管理要求。 3.处理系统运行过程中出现的各种操作问题以及事件,快速响应并解决问题以减少对业务的影响。 4.分析系统及应用程序的性能问题,并提出相应的优化方案,以提高系统效率和用户体验。 5.负责系统的监控工作,实时监控系统状态,确保系统的健康运行。 6.负责系统生产环境的变更管理,确保系统安全和功能的最新状态。 7.按照要求编制运维文档,记录相关信息及解决方案,定期进行分析汇总,提交运维报告。 8.完成领导交办的其他工作。 [ 职位要求 ] 1.本科及以上学历,计算机相关专业优先考虑。 2.熟悉运维管理方法和流程,具有良好的问题分析和解决能力。 3.熟悉Linux系统的基本操作和常用命令,有Shell脚本编写经验者优先。 4.具备良好的团队合作精神和沟通能力,能够有效与用户和团队沟通交流。 5.英语四级及以上水平,能够流利地阅读和书写技术文档,口语流利者优先考虑。 [ 以上职位均要求 ] 1.有良好的团队合作精神及口头与书面的交流能力; 2.逻辑思考能力强,工作细致、踏实,有责任心与时间观念; 3.能接受工作时间着职业装,穿皮鞋。着装应庄重、大方、整洁、得体。 [其他要求] 1.有强烈的责任感,对待工作认真负责。 2.对技术有激情,对新的知识充满无穷的好奇心,能在技术道路上孜孜不倦的学习进步。 3.熟练使用英语,能用英语进行日常沟通可加分。 4.应届生在校担任过社团、学生会干部优先考虑。
-
岗位职责 搭建区块链节点以提供高可用服务 维护节点及服务的高可用性 确保产品与服务访问的可用性与可靠性 搭建稳定多云高可用架构 任职要求 211院校计算机相关专业本科及以上学历 1-3年运维工作经验 精通云平台(AWS,GCP,Azura等) 精通常见编程架构语言(Python, Golang, Shell) 英文可作为工作语言 符合以下条件者优先 了解区块链,或运行过区块链节点