• 30k-50k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责服务器系统、集群的可靠性、可用度、易用性测试设计及优化,保证服务器产品RAS竞争力的落地;帮助业务团队实现系统可靠性的提升,降低业务运营成本; 2、通过对业务系统的可靠性研究,识别业务系统可靠性瓶颈和机会,从系统可靠性视角给出软硬件优化建议,促进服务器系统在关键应用场景的可靠性能力提升; 3、针对业务应用、数据中心运维等场景,识别服务器系统、软硬件、关键芯片的RAS需求,并针对相关需求制定完备的测试方案及用例,保证可靠性方案系统性的落地。 职位要求: 1、5年以上服务器或存储产品的系统集成测试经验,有复杂产品的可靠性测试经验或系统可靠性分析设计经验; 2、有服务器可靠性、可用度相关开发测试经验,熟悉FMEA等可靠性分析方法,对GPU、x86、ARM处理器至少一种的RAS体系架构及平台相关RAS特性有深入研究; 3、深入理解服务器硬件系统架构,熟悉平台硬件系统、BIOS、设备管理软件,了解操作系统、虚拟化技术、数据库、分布式存储系统和深度学习等服务器应用场景及系统架构; 4、具有在跨职能团队中协同工作的经验,具备良好的沟通能力和领导力,能够带领团队解决复杂的技术问题,推动项目的成功实施。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责服务器系统、集群的可靠性、可用度设计及优化,实现服务器产品竞争力的领先;帮助业务团队实现系统可靠性的提升,降低业务运营成本; 2、通过对业务系统的可靠性研究,识别业务系统可靠性瓶颈和机会,探索软硬件协同设计创新方案,并引导实施; 3、针对业务应用、数据中心运维等场景,识别服务器系统、软硬件、关键芯片的RAS需求,主导关键方案设计,并协同落地实施; 4、指导服务器产品开发过程中的可靠性设计,可靠性设计指标的分解和达成; 职位要求: 1、5年以上服务器或存储产品的硬件架构、系统设计、软硬件协同设计经验,有软件测试或开发经验; 2、有服务器可靠性、可用度相关设计经验,对GPU、x86、ARM处理器至少一种的RAS体系架构及平台相关RAS特性有深入研究; 3、深入理解服务器硬件系统架构,熟悉平台硬件系统、BIOS、设备管理软件,了解操作系统、虚拟化技术、数据库、分布式存储系统和深度学习等应用软件架构; 4、对AI集群、计算、数据库、存储其中至少一种业务有深入研究; 5、具有在跨职能团队中协同工作的经验,具备良好的沟通能力和领导力,能够带领团队解决复杂的技术问题,推动项目的成功实施。
  • 20k-30k 经验在校/应届 / 本科
    企业服务 / 不需要融资 / 15-50人
    基本要求: •4年的Linux操作系统经验和容器编排(+、库伯内特等)和脚本语言(如Python、Shell)的最佳近期经验 •4年至少一家主要云提供商(AWS、阿里云、Azure)和管理库伯内特服务的经验 •有使用地形图以提供基础设施资源的经验 •有使用现代CI/CD工具和技术的经验,如Gitlab CI,Argo CD •热爱对工程师的指导和技术指导 •具有丰富的现场可靠性工程实践和原则的经验 •丰富的操作监控和仪表板经验(普罗米修斯、格拉法纳、ELK) •有源代码管理和版本控制的经验(Git/GitHub/GitLab) •以前参与过软件交付生命周期的所有阶段 •优秀的口头和书面沟通能力 •协作技能——开放配对,并与跨功能团队中的工程师密切合作 •对网络概念、技术和协议(TCP/IP、IPSec、HTTP、FTP、DHCP和DNS)有扎实的理解 技术要求: •有使用Go、Java、JavaScript或其他语言的软件工程的经验 •微服务架构、RESTfulapi和消息队列方面的知识 •有操作定制构建的企业级云-本地微服务应用程序的经验 •擅长使用MySQL或NoSQL技术(如MongoDB)
  • 25k-50k 经验5-10年 / 不限
    工具类产品,内容社区,音频|视频媒体 / 上市公司 / 2000人以上
    岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
  • 15k-30k 经验不限 / 本科
    通讯电子 / 不需要融资 / 2000人以上
    一、 业务背景介绍 为客户提供世界领先的一站式AI全栈解决方案。从硬件、OS、驱动、容器集群到AI工具链、AI大模型,构建AI全栈解决方案,帮助客户快速构建AI能力,实现商业成功。 二、 团队介绍 团队主要负责AI全栈解决方案中容器集群底座,提供大规模容器集群、NPU/GPU套件管理、AI高速网络、高速大数据存储。具体工作包括需求分析、系统及模块设计,核心框架开发,功能代码开发,功能代码自验。 团队技术氛围浓厚,可以接触到世界领先的AI大集群、AI芯片(华为昇腾、英伟达)、AI大模型等。 【岗位职责】 1、 负责特性设计、代码开发、测试验证,保证系统可靠性、可用性、高性能、安全性、可扩展性等。 2、 负责容器、AI相关技术的研究,包括技术的分析、引进和应用。 3、 参与系统需求分析、架构设计等工作。 【岗位要求】 1、 掌握Java/Go等一种或多种编程语言。 2、 熟悉mysql、PostgreSQL、oracle等主流关系型数据库其中的一种。 3、 熟悉linux相关知识,对基本数据结构和算法有一定了解。 4、 有容器、K8S、AI、大数据相关经验者优先,暂不强制要求。 5、 工作认真负责,具备良好的解决问题能力,主动性强,能快速学习和掌握新技术。 6、 善于沟通与合作,具备良好的团队协作与沟通交流意识。
  • 25k-33k 经验5-10年 / 本科
    社交平台 / 不需要融资 / 150-500人
    【工作职责】 掌握业务诉求,融合业务和技术,设计、实现、优化产品解决方案;为系统稳定可靠、高性能、可扩展、安全负责。 推进技术、团队能力发展,为业务需求匹配能力效率胜任的团队人员。 业务线上: 1. 深入发掘和分析业务需求,撰写技术方案和系统设计,保障方案和设计满足业务需求; 2. 参与技术方案和系统设计评审;把握复杂系统的设计,确保系统的架构质量; 3. 主导技术难题公关,提供核心系统在系统复杂度、业务复杂度的解耦解决方案并落地; 4. 优化重构项目,提高系统可靠性、稳定性、扩展性、安全性以及高性能等; 5. 负责项目研发过程中的技术输出与评审工作(包含撰写文档,开展代码review等),保障代码质量; 6. 负责部分代码编写,保障项目开发工作及时交付。 职业线上: 1.负责技术研究,评估新技术、工具和框架,为部门提供技术选型建议,确保选择最适合项目需求的技术栈; 2.制定和推广架构规范和最佳实践,确保团队在开发过程中遵循统一的架构标准; 3.负责为团队技术指导与培训,保障人员能力、效率提升; 4.负责技术团队能力评估判断,为业务开展提供能力匹配的团队人员。 【任职资格】 1、熟练使用SpringBoot、SpringCloud、Dubbo等主流微服务框架技术; 2、精通Java,熟悉IO、多线程、分布式、集合等基础API,对JVM原理有一定的了解; 3、熟悉mysql、redis、mongo等主流数据库及调优; 4、熟悉Git,Maven以及DevOps,对于敏捷流程有一定实践经验; 5、熟悉操作Linux,docker/k8s,虚拟化等技术部署应用; 6、了解Web 前端技术,HTML / CSS / Javascript;了解至少一门 React / Vue / Angular 框架,对前端开发结果有质量判断 7、具有高度的抽象设计能力, 思路清晰, 善于思考, 能够独立分析和解决问题, 责任心强; 具备良好的团队合作精神和风险预判能力, 对系统的压力和瓶颈针对性的优化和解决方案落地; 8、成功开发过中大型应用经验;能清晰规划出业务和技术方向, 并能够阶段性落地, 拿到结果。 9、关注前沿技术,具备较强的学习能力
  • 10k-20k·14薪 经验3-5年 / 本科
    信息安全,数据服务 / 上市公司 / 150-500人
    岗位职责: 1、负责系统可靠性设计 2、负责系统或产品电磁兼容整改 3、参与公司产品硬件开发 4、完成项目需求分解、系统设计报告编写、详细设 计报告编写。 任职资格: 1、本科及以上学历,3年及以上仪器仪表开发经验; 2、具有良好的数字电路或模拟电路设计和仿真能力; 3、掌握电磁兼容理论,具备系统emc分析处理能力或良好的运放应用电路设计能力。 4、具备工业产品标准的可靠性设计能力或了解小信号处理的设计理论和模拟信号链的设计与参数估算优先。
  • 15k-30k 经验5-10年 / 本科
    软件服务|咨询,IT技术服务|咨询,营销服务|咨询 / D轮及以上 / 150-500人
    职责 1. 系统可靠性:负责系统架构生命周期管理,以确保系统的稳定性和可用性。这包括故障排除、性能优化、容量规划和故障恢复等工作。 2. 自动化和工具开发:开发和维护基于云服务商的自动化工具、脚本和监控系统,以减少手动操作、提高效率和可靠性。这包括自动化配置管理、部署、测试和监控等方面。 3. 故障监控和响应:建立和维护业务监控系统,实时监测业务的性能和可用性,并快速响应和解决故障。这包括设置警报、故障排查和进行紧急修复等工作。 4. 性能优化:分析和优化系统的性能,以提高系统的响应时间、吞吐量和可伸缩性。这包括进行性能测试、容量规划和调优等工作。 5. 安全性和合规性:确保系统的安全性和合规性,包括漏洞管理、身份验证和访问控制、数据加密和合规性审计等方面。 6. 服务可靠性工程:与开发团队紧密合作,参与设计和构建可靠的分布式系统,以确保系统的高可用性、容错性和弹性。 7. 文档和知识共享:编写文档、运维手册和最佳实践指南,与团队分享知识和经验,以促进团队的学习和提高。 要求 具备基于架构/规则/流程的分析习惯 不受主观情绪干扰的沟通与协作 熟练掌握至少一种开发语言 精通至少一门计算机基础知识
  • 5k-8k 经验在校/应届 / 本科
    硬件 / C轮 / 500-2000人
    岗位职责: 1、进行产品质量、质量管理体系及系统可靠性设计、研究和控制; 2、进行质量的检查、检验、分析、鉴定、咨询; 3、进行产品认证、生产许可证、体系认证、审核员和评审员注册、质量检验机构和实验室考核等合格评定管理; 4、调节质量纠纷,组织对重大质量事故调查分析,进行客户满意度调查分析; 5、了解iso9001等管理体系、七大手法、五大工具,做到运用各种手法分析解决品质问题。 岗位要求: 1、***本科及以上学历; 2、电子信息工程、微电子科学与工程、质量管理工程、统计学、应用数学等相关专业; 3、学习成绩良好,英语四级以上; 4、性格沉稳,细致认真,有着良好的抗压能力、应变能力和解决问题的能力; 5、名校毕业生****。
  • 6k-8k 经验1-3年 / 大专
    硬件 / 未融资 / 150-500人
    1.组织实施质量监督检查 2.调节质量纠纷,组织对重大质量事故调查分析 3.进行产品质量、质量体系及系统可靠性设计、研究和控制 4.制定质量规范并监督实施 欢迎优秀的你加入惠丰电子大家庭,共同创造更美好的未来!
  • 20k-35k 经验5-10年 / 本科
    文娱|内容,金融 / A轮 / 500-2000人
    岗位亮点: 办公形式是在家远程办公。 工作时间:10点-12点半,14点-18点半,每周平均每天8小时,周末双休。 金融科技类型的互联网企业,高速发展中,这里有你学不完的技术和挑战,只要你愿意!全球化、扁平化、自治化! 岗位职责: 负责构建两地三中心双可用区的数据库灾备或双活环境,并保证数据库系统可靠性达到99.9%。 负责保障数据的可用性、安全性,能采用有效预防措施,可以构建同构和异构的备份与恢复(1分钟级别甚至秒级别)。 负责部署及维护数据库、核心中间件集群环境。 负责维护数据库、核心中间件故障处理。 负责维护数据库、核心中间件SQL语句优化、各种性能优化。 建立数据库、核心中间件的运维规范,同时构建CD工具与流程。 用户数据安全审计规范、标准制定,满足金融级别合规要求。 能在软件设计阶段给出合理数据库设计指导及评估。 负责推动数据库、核心中间件的监控与告警的完善以及监控告警响应处理闭环。 建立合适的巡检制度,能够做到短期人工巡检,长期自动巡检,并建设自动趋势问题感知巡检能力。 构建数据库级别的SLA/SLO/SLI,能够很好的量化DB团队工作的产出以及管理工作的指导,提高业务系统稳定性。 DB相关文档编写、定期进行技术成果全员分享。 其它相关工作。 任职要求: ***本科及以上学历,计算机、通信等IT相关专业毕业。 五年以上的实干经验,具有自主实验和钻研精神。有经历过小中大数据量增长实战经历的,有3年以上在中大型互联网/金融企业生产环境维护经验。 精通Xenon MySQL、Redis、OceanBase、ClickHouse、PgSQL、MongoDB 、Elasticsearch 集群、主从、分布式整套架构的运行原理、架构设计、数据结构设计。 熟悉MySQL和Redis主从复制,读写分离、分库分表设计,熟悉mariadb等MySQL各分支的区别和特性。 熟悉各种数据库的选型对比方法、基准压力测试、Troubleshooting、Performance Tuning。 熟悉CentOS/Debian主流Linux操作系统原理,掌握数据库运行在该环境上的性能调优分析和故障诊断。 熟悉主流的存储类型接口和RAID级别,使得不同类型的数据库的性能合理化。 用过至少一门编程语言python/golang/java/c,有过网络编程最佳。 积极主动去配合业务项目相关工作,拒绝闭门造车为技术而技术。 能够了解SQL、NoSql前沿技术并实践应用于业务系统。 加分项: 优先考虑日常维护过高并发、海量数据TBPB级别; 优先考虑有大型互联网从业经验; 优先考虑了解MySQL源码; 岗位亮点: 各类金融业务系统设计开发与优化; 设计高扩展性的系统,用技术实现业务需求的复杂性与多样性; 经历大型金融科技公司的完善中间件,提高技术视野。 我们的技术栈: 数据库 mysql pgsql elasticsearch redis mongodb etcd OceanBase CickHouse 中间件 nacos kafka zookeeper rabbitmq rocketmq apisix nginx 容器化 k8s rancher 存储 nas ceph 网络/负载均衡 CDN haproxy frp openvpn-as apisix CI/CD confluence/JIRA/gitlab/harbor 语言 go java python
  • 15k-28k·14薪 经验3-5年 / 本科
    智能硬件,网络通信 / 不需要融资 / 150-500人
    岗位职责: 1、参与产品开发硬件任务、进度计划、设计方案的拟制、讨论和评审; 2、负责4G/5G无线路由器相关产品硬件研发设计工作; 3、根据上级规划的产品硬件方案,完成原理图和PCB设计、硬件调试 及测试等; 4、 制定硬件调试方案,对系统的信号完整性、电磁兼容性等方面进行全面的调试和测试; 5、 与软件工程师合作进行系统调试,与结构工程师配合设计,进行样机整机电装验证; 6、 综合考虑性能和成本,对相关器件进行选型和评估;跟进硬件产品打样、试制,完成板级调试、测试工作,跟进和解决试产、量产过程中反馈的问题。 岗位要求: 1.本科以上学历,电子工程、通信工程或相关专业; 2. 三年以上相关工作经验; 3. 熟悉系统可靠性及信号完整性设计; 4.有无线路由器、网卡、AP、CPE等开发经验者优先; 5. 有良好的团队协作精神。
  • 6k-9k·13薪 经验在校/应届 / 本科
    电商 / 不需要融资 / 2000人以上
    岗位职责: 1、根据业务模块的数字化需求,主导收集、整理、排序和规划负责业务领域的数字化需求,制定业务领域的数字化建设规划及业务整体方案,以实现业务领域核心业务的数字化全覆盖。 2、根据业务模块项目规划,主导所负责业务领域内数字化项目的实施,针对项目重大问题,主导项目风险及时识别和处理,分析和判断项目风险类型和紧急程度,把控项目风险及质量。 3、依据数字化中心系统运维的规范与要求,参与业务部门的需求,制定并落实系统运维管理机制,持续推动业务系统可靠性、高效使用性及业务连贯性。 任职要求: 1、本科学历及以上学历,计算机科学与技术、电子与计算机工程、信息安全、软件工程、智能科学与技术、网络工程、数字媒体技术、物联网工程、空间信息与数字技术等相关专业; 2、具备计算机专业知识、项目管理知识、流程管理知识; 3、了解IT项目管理流程,了解IT运维管理体系; 4、具备较强的目标管理和沟通协调能力。
  • 14k-20k 经验在校/应届 / 硕士
    智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 岗位职责: 1. 负责模拟IP设计,实现关键性的模拟电路设计,如charge pump, bandgap, reference voltage/current, amplifier,D/DA等; 2.撰写详细设计文档,定义产品规格; 3.对电路进行设计分析和仿真; 4.撰写版图设计指导书,指导,监督版图工作; 5.协助设计测试板,调试测试芯片。 职责要求: 1.微电子或相关专业,硕士以上学历, 3~5年工作经验; 2.具有扎实的模拟集成电路相关基础知识,精通基本模拟电路的原理、设计技巧及关键参数,包括但不限于:Mixed Signal(ADC、DAC、Comparator、AMP、PLL),Power (Bandgap、 LDO、Charge-Pump),RC-OSC、Crystal-OSC,I/O ESD,其他特殊单元库。深刻了解各种半导体器件的物理知识,并能指导版图绘制和优化; 3.对于高性能模拟IC相关特性(低噪声、低压低功耗、高低温、ESD、Latch-Up、EMI、系统可靠性、量产一致性和良率等)有充分的理解和成功的实践经验; 4.熟悉数模混合信号电路仿真原则,并能进行模块和芯片级系统仿真,熟悉多种常用的电路仿真工具和版图设计工具。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责服务器系统、集群的可靠性、可用度设计及优化,实现服务器产品竞争力的领先;帮助业务团队实现系统可靠性的提升,降低业务运营成本; 2、通过对业务系统的可靠性研究,识别业务系统可靠性瓶颈和机会,探索软硬件协同设计创新方案,并引导实施; 3、针对业务应用、数据中心运维等场景,识别服务器系统、软硬件、关键芯片的RAS需求,主导关键方案设计,并协同落地实施; 4、指导服务器产品开发过程中的可靠性设计,可靠性设计指标的分解和达成。 职位要求: 1、5年以上服务器或存储产品的硬件架构、系统设计、软硬件协同设计经验,有软件测试或开发经验; 2、有服务器可靠性、可用度相关设计经验,对GPU、x86、ARM处理器至少一种的RAS体系架构及平台相关RAS特性有深入研究; 3、深入理解服务器硬件系统架构,熟悉平台硬件系统、BIOS、设备管理软件,了解操作系统、虚拟化技术、数据库、分布式存储系统和深度学习等应用软件架构; 4、对AI集群、计算、数据库、存储其中至少一种业务有深入研究; 5、具有在跨职能团队中协同工作的经验,具备良好的沟通能力和领导力,能够带领团队解决复杂的技术问题,推动项目的成功实施。