• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、结合对云平台异构类AI加速器(GPU)应用特点,深入理解及上层应用迭代路标,整理输出清晰的GPU类硬件产品规划路标,确保硬件方案的领先性; 2、负责异构类GPU产品业务场景资源需求画像、跨代跨平台场景化性能收益测试验证,设计性能测试方案,执行性能测试,针对系统性能瓶颈分析,提出调优建议并协助调试验证完成,输出性能测试报告;协调解决新硬件、新技术落地过程中遇到的技术问题; 3、异构类GPU产品业务场景收益对比评估,确定选型方案,输出方案迭代标准算力/资源折算方案; 4、结合产业链的最新技术能力和硬件产品架构特点,提供综合竞争力领先的异构硬件解决方案,输出自主研发硬件服务器产品资料; 5、监控和分析异构云硬件在实际应用中的质量、性能表现,并提供系统的技术支持能力,推动改进识别和落地。 职位要求: 1、本科及以上学历,电子工程或者计算机相关专业,5年及以上异构领域的硬件开发、测试或性能调优基础经验; 2、良好的Unix/Linux操作系统基础及熟练使用常用命令,具备独立分析定位问题、分析和解决问题的能力; 3、熟悉各类常见异构类平台,如大模型训练、GPU推理场景等硬件平台; 熟悉主流厂商服务器硬件产品组件,如处理器、硬盘、网卡、SAS卡及测试方法,熟悉掌握Speccpu/Fio/Iperf/Stream/Mlc/lmbench/MLperf等工具及相关调优手段;深入理解操作系统内核、虚拟化、GPU架构原理、DPDK等技术原理; 4、具有直接的互联网业务组件/场景的性能测试开发经验更好,精通压力、负载测试; 5、具备较强的团队沟通和协作能力,有较强的全局视野、沟通组织能力、项目推动能力;具备较强的学习能力和逻辑思维能力,关注前沿技术,较好的团队协作及团队意识,有较强的责任心和执行力,工作态度积极向上,具备正能量; 6、对ToB产品的端到端交付过程、产品逻辑有较系统的理解。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、结合对云平台异构类AI加速器(GPU)应用特点,深入理解及上层应用迭代路标,整理输出清晰的GPU类硬件产品规划路标,确保硬件方案的领先性; 2、负责异构类GPU产品业务场景资源需求画像、跨代跨平台场景化性能收益测试验证,设计性能测试方案,执行性能测试,针对系统性能瓶颈分析,提出调优建议并协助调试验证完成,输出性能测试报告;协调解决新硬件、新技术落地过程中遇到的技术问题; 3、异构类GPU产品业务场景收益对比评估,确定选型方案,输出方案迭代标准算力/资源折算方案; 4、结合产业链的最新技术能力和硬件产品架构特点,提供综合竞争力领先的异构硬件解决方案,输出自主研发硬件服务器产品资料; 5、监控和分析异构云硬件在实际应用中的质量、性能表现,并提供系统的技术支持能力,推动改进识别和落地。 职位要求: 1、本科及以上学历,电子工程或者计算机相关专业,5年及以上异构领域的硬件开发、测试或性能调优基础经验; 2、良好的Unix/Linux操作系统基础及熟练使用常用命令,具备独立分析定位问题、分析和解决问题的能力; 3、熟悉各类常见异构类平台,如大模型训练、GPU推理场景等硬件平台;熟悉主流厂商服务器硬件产品组件,如处理器、硬盘、网卡、SAS卡及测试方法,熟悉掌握Speccpu/Fio/Iperf/Stream/Mlc/lmbench/MLperf等工具及相关调优手段;深入理解操作系统内核、虚拟化、GPU架构原理、DPDK等技术原理; 4、具有直接的互联网业务组件/场景的性能测试开发经验更好,精通压力、负载测试; 5、具备较强的团队沟通和协作能力,有较强的全局视野、沟通组织能力、项目推动能力;具备较强的学习能力和逻辑思维能力,关注前沿技术,较好的团队协作及团队意识,有较强的责任心和执行力,工作态度积极向上,具备正能量; 6、对ToB产品的端到端交付过程、产品逻辑有较系统的理解。
  • 20k-30k 经验3-5年 / 本科
    游戏 / 不需要融资 / 500-2000人
    职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
  • 9k-14k·14薪 经验不限 / 本科
    游戏 / A轮 / 50-150人
    工作职责 ● 负责业务系统服务的日常部署与维护 ● 负责PC、服务器、网络等硬件设备的日常维护,定期巡检及故障排查 ● 负责办公系统和应用软件的维护管理,故障排查及安全优化 ● 负责优化公司IT实施方案 职位需求 ● 具备较强的网络基础知识,对局域网组网技术有较深认知 ● 具备基础的linux服务器运维能力,熟练搭建和配置linux常用服务 ● 熟悉IT服务管理体系,了解IT常用服务和协议 ● 熟悉Windows操作系统,了解目前主流PC硬件设备 ● 熟悉机房综合布线,合规及安全管理。有电路相关知识优先 ● 有shell,python,golang编程能力优先 ● 本科以上学历,计算机网络、通信相关专业优先 ● 热爱PC/主机游戏优先
  • 6k-10k 经验不限 / 本科
    其他 / 不需要融资 / 2000人以上
    岗位职责: 1.负责集团/工厂的网络&基础设施日常运维工作; 2.负责集团/工厂的网络&基础设施建设实施; 3.负责集团/工厂的网络优化工作; 4.负责集团/工厂的三网分离的网络建设工作; 5.保障稳定的办公,生产,监控网络,辅助日常网络质量的监控,问题故障分析与处理,应急方法的设计与演练等工作; 6.负责PC、打印机、会议终端等设备维护及会议保障工作; 7.协助集团/工厂的数字化业务转型; 8.保障机房、IDC机房以及云网络、安全、服务器设备正常运行。 岗位要求: 1.本科学历优先,以软件工程,网络工程,计算机专业,人工智能,信息管理方向(计算机相关专业优先); 能力优秀者放宽到大专以上 2.熟悉Windows,Linux,Mac等操作系统,能独立处理各种计算机软硬件、打印机、会议终端等设备故障; 3.熟悉网络基础知识以及TCP/IP的工作原理; 4.熟悉网络拓扑,了解网络综合布线; 5.熟悉思科、华为、H3C等主流厂商的网络、安全设备配置、调试、故障诊断及处理方法; 6.具备硬件设备维修维护能力和基础网络维护管理技术; 7.了解Wireshark、Nmap、zabbix等网络抓包、扫描、监控工具的使用; 8.熟悉Linux基础配置命令,了解shell语言; 9.了解Mysql、Oracle、Sqlserver、PostgreSQL数据库配置和使用; 10.熟悉Visio、PPT,Work, Excel等办公软件的使用; 11.工作积极性强,责任心强,具备良好的职业素养,有独立分析解决问题的能力,且具备沟通协调、文字整理等能力; 12.具备网络方向相关证书优先考虑,具备网络运维经验者优先考虑。
  • 14k-26k 经验3-5年 / 本科
    金融 / 不需要融资 / 50-150人
    运维工程师   工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。   任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
  • 15k-25k·14薪 经验3-5年 / 本科
    移动互联网,广告营销 / 上市公司 / 2000人以上
    工作职责: 1.负责公司数据库系统的管理,提供高可用、高性能数据库系统,并保障系统7×24小时正常运行; 2.负责数据库性能监控与优化,故障处理与灾难恢复; 3.为开发人员提供技术支持并提供培训; 4.参与应用系统数据库设计、数据接口开发,提供数据库规范指引、性能优化建议等; 5.参与数据库平台开发,及相关自动化流程开发工作。 任职要求: 1.**本科及以上学历,计算机相关专业优先; 2.3年及以上数据库运维相关工作经验,有大数据技术栈相关工作经验优先; 3.精通MySQL/MongoDB,熟悉TiDB/Oracle等数据库,有相关技术认证的优先; 4.熟悉互联网应用架构模式,掌握数据库高可用架构,熟悉云原生、容器化、虚拟化等基本原理和应用场景; 5.熟悉Linux操作系统,了解服务器硬件、存储、网络等基本知识; 6.至少掌握Perl/Python/Java等任何一门开发语言,能完成自动化运维工作,有开发背景经历优先; 7.具备安全、风险意识,有良好的沟通及处理突发事件的能力,能承受一定的工作压力。
  • 25k-35k·13薪 经验5-10年 / 本科
    移动互联网,游戏 / 不需要融资 / 150-500人
    职位描述: 1、参与服务器的架构和模块设计 2、参与游戏团队协作,实现服务器端游戏功能 3、参与数据与业务中台的设计与建设,为产品提供灵活支持 4、研究最新技术落地实践,为产品提供竞争力 任职要求: 1、热爱技术,对优秀的技术框架和架构设计有浓厚的兴趣 2、精通各种网络通讯协议,熟悉Socket、TCP/IP编程 3、熟悉以下任意一种语言和相关框架:Java,C++,Javascript(Node.js),Go 4、熟悉任意一种 Web 前端技术, 包括但不限于 AngularJS、VueJs、React 5、熟悉 Redis,MySQL,MongoDB 等各种类型数据库 6、了解服务器监控和优化 7、五年以上游戏或互联网服务器开发经验 8、有较强的责任心,善于学习,优秀的团队精神 9、为人踏实,积极主动,具有优秀的沟通能力
  • 20k-30k·14薪 经验3-5年 / 本科
    金融 / 未融资 / 500-2000人
    工作职责: 1、负责服务器部署,优化整个大规模应用架构的设计、实施、后期疑难问题解决; 2、熟悉服务性能测试,对服务器资源进行统一规划与优化; 3、完善自动监控报警系统,对业务层面、资源等关键指标进行监控与报警通知; 4、搭建完善高可用集群环境,及实现负载均衡,保证公司业务的高性能和稳定性; 5、对服务器宕机等异常等突发事件做出及时处理。 任职要求: 1、大学本科及以上学历,3年以上运维相关工作经验; 2、精通Python,Shell,熟悉网络TCP/IP/HTTPS等网络协议; 3、精通Linux操作系统以及服务器集群的搭建、设置和维护。 4、精通Redis、MongoDB、ES、RabbitMQ、Kafka的维护、调优域故障排除; 5、熟练掌握Docker容器技术,对Kubernetes等容器编排工具使用有深入理解,有生产环境使用经验; 6、熟练掌握SaltStack/Ansible等几种配置管理工具,并且能集成到Jenkins或者ci/cd系统中,并且能调优; 7、熟练使用ELK日志收集与分析系统;熟悉Jenkins持续集成,了解DevOps; 8、了解云服务相关技术,具备阿里云等云平台运维使用经验; 9、良好的沟通,团队合作意识,主动思考,学习能力和强烈责任感。
  • 35k-65k 经验3-5年 / 本科
    智能硬件,电商平台 / 上市公司 / 2000人以上
    职位描述 1. 配合算法研究员完成算法的落地与部署工作,并在代码与指令集层面优化算法运行效率。 2. 设计基于GPU的高性能算法基础库,支持下游各个算法研发。 职位要求 1、熟悉CUDA工作原理,能独立完成代码热点分析并制定优化方案。 2、良好的编程能力,熟悉python, c++,掌握常见的算法和数据结构知识; 3、良好的工程能力,有较强的的代码结构设计能力,熟练使用git、ssh,cmake等工具。 加分项 1、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
  • 15k-20k 经验3-5年 / 本科
    IT技术服务|咨询,软件服务|咨询 / B轮 / 2000人以上
    工作经历:3年以上网络运维管理相关工作经验,网络集成商优先。 证书:CCIE、HCIE或者同等级别认证。 技术要求: 1. 网络基础知识扎实; 2. 熟练配置主流品牌数通设备、防火墙,理解其工作原理,可以通过查文档和做实验,理解网络设备特性,解决网络问题; 3. 了解F5的配置和工作原理; 4. 具备一定的文档编写能力; 5. 了解Linux常用命令。 6. 了解AAA产品使用、流量回溯分析系统产品使用者优先。 7. 掌握python者优先。 8. 有网络监控系统搭建和运维经验者优先。 项目要求:有大中型网络方案设计、实施、运维经验者优先。
  • 15k-25k 经验5-10年 / 本科
    移动互联网,消费生活 / B轮 / 150-500人
    职责描述: 1、负责公有云规划及运维工作。 2、负责公有云环境搭建及监控,包括处理服务请求异常问题定位及修复等运维操作。 3、对公有云环境进行风险识别和评估,提出改进建议并修复。 4、对公有云环境运维建立运维标准和流程。 5、负责企业应用部署、发布系统、CMDB等相关项目维护。 任职要求: 1、本科及以上学历,计算机及相关专业,有5年以上运维经验。 2、熟悉公有云,具有2年以上腾讯云/阿里云运维经验。 3、熟悉防火墙、VPN、DNS、HTTPS、TCP/IP等网络技术, 熟练使用高可用/负载均衡技术。 4、具有丰富的K8S运维经验。 5、具有mysql、redis、rabbitmq、elasticsearch、prometheus等常规业务组件丰富的运维经验。 6、有python/shell脚本编程经验,有devops自动化脚本编写开发经验优先。 7、了解基础网络知识和网络设备工作原理。 8、具备良好的团队合作、沟通表达能力。
  • 18k-35k 经验3-5年 / 本科
    科技金融 / 不需要融资 / 2000人以上
    岗位描述: 1、负责招商银行业务系统的运维保障工作; 2、负责业务系统的架构审核、业务监控、持续交付、应急响应、容量规划; 3、负责线上服务高效稳定运行,支撑业务和数据量的快速扩张; 4、深入理解业务系统的整体架构,发现并解决重大故障及性能瓶颈; 5、理解业务需求,协调研发团队与资源供给团队,推动业务系统的部署落地。 岗位要求: 1、2年以上相关运维经验,了解原生云技术原理,有实际部署维护经验优先。 2、熟悉金融行业主要业务和应用系统,对金融行业应用软件、系统软件管理有较深入理解,熟悉金融行业应用软件开发设计、测试和运维特点。 3、熟悉tomcat、MQ、nginx各类中间件等优先。 4、精通一门以上脚本语言(Shell/Python等),有自动化、智能化系统应用及研发架构的经验。 5、熟悉当前热门的容器生态核心开源项目,如Docker、Kubernetes等。 6、对自己的工作有要求,对自己成长有规划;有较好的学习能力、抗压能力和自我管理能力。有很好的技术敏感度和风险识别能力,有不断钻研和探索的精神,有解决疑难问题的毅力和决心。 7、良好的服务意识,善于团队协作,项目管理,主动思考,自我驱动力强。
  • 25k-50k·16薪 经验5-10年 / 本科
    区块链 / 上市公司 / 150-500人
    岗位职责: 1、制定公司的信息安全管理制度,包括网络安全、数据安全、软件开发环境安全等; 2、设计保障信息安全管理制度落地的技术解决方案,包括网络安全架构、数据安全架构等; 3、在出现网络攻击或安全事件时进行紧急响应、恢复系统及调查取证; 4、负责对公司网络进行安全评估及安全加固工作; 任职要求: 1、了解信息安全管理的规范、网络安全等级保护要求; 2、熟悉网络协议,熟悉网络安全攻防技术; 3、具备5年以上网络安全管理工作经验,有团队管理或者项目负责人经验优先; 4、熟悉Windows、Linux等主流操作系统管理和安全管理,具备安全事件处理和分析能力; 5、具有网络安全通信协议、系统漏洞、恶意代码检测与分析、安全攻防、信息安全技术及产品等方面的理论基础和实践经验; 6、具备较强的沟通协调能力、理解能力和文字表达能力; 7、具有网络信息安全工程师中级及以上级别证书者优先。
  • 30k-50k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责服务器系统、集群的可靠性、可用度、易用性测试设计及优化,保证服务器产品RAS竞争力的落地;帮助业务团队实现系统可靠性的提升,降低业务运营成本; 2、通过对业务系统的可靠性研究,识别业务系统可靠性瓶颈和机会,从系统可靠性视角给出软硬件优化建议,促进服务器系统在关键应用场景的可靠性能力提升; 3、针对业务应用、数据中心运维等场景,识别服务器系统、软硬件、关键芯片的RAS需求,并针对相关需求制定完备的测试方案及用例,保证可靠性方案系统性的落地。 职位要求: 1、5年以上服务器或存储产品的系统集成测试经验,有复杂产品的可靠性测试经验或系统可靠性分析设计经验; 2、有服务器可靠性、可用度相关开发测试经验,熟悉FMEA等可靠性分析方法,对GPU、x86、ARM处理器至少一种的RAS体系架构及平台相关RAS特性有深入研究; 3、深入理解服务器硬件系统架构,熟悉平台硬件系统、BIOS、设备管理软件,了解操作系统、虚拟化技术、数据库、分布式存储系统和深度学习等服务器应用场景及系统架构; 4、具有在跨职能团队中协同工作的经验,具备良好的沟通能力和领导力,能够带领团队解决复杂的技术问题,推动项目的成功实施。