• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、理解上层业务应用,结合异构芯片应用特点,负责异构硬件系统需求分析,输出异构芯片需求规格,输出异构硬件系统方案; 2、和业务团队、软硬件研发团队紧密配合,分析工作负载模型,帮助业务团队实现硬件方案创新,提升性能、降低成本; 3、与芯片、网络、IDC、软件等团队紧密协作,负责异构芯片需求规格和异构硬件系统方案分析,确保异构硬件系统在TCO、性能、可靠性、DFX等方向竞争力领先; 4、跟进行业组织、开放标准组织,研究分析最新的技术、标准;结合产业链的最新技术能力和硬件产品特点提供综合竞争力领先的异构硬件系统方案。 职位要求: 1、至少5年以上异构硬件系统方案分析经验,有大规模异构计算系统的方案设计和实现经验; 2、熟悉计算机体系结构、硬件设计和实现,熟悉CPU、GPU、FPGA等异构计算硬件; 3、熟悉PCIe、DDR、网络和存储等系统总线和协议; 4、熟悉各类常见异构类平台,如GPU训练,推理场景加速硬件平台等; 5、在大团队、跨团队的项目推动和组织方面有成功经验; 6、具备良好的分析和解决问题的能力。
  • 30k-60k·16薪 经验5-10年 / 本科
    居住服务 / 上市公司 / 2000人以上
    工作职责: 1.打造贝壳自己的异构计算平台, 应对大模型训练、推理对基础设施的挑战,帮助贝壳实现智能化的目标. 工作内容: 1.深入理解业务需求, 帮助业务快速有效的使用深度学习; 2.负责深度优化核心计算库,包括服务器的异构计算框架以及常用计算库优化; 3.负责模型结构在不同硬件上压缩,量化,稀疏化,裁剪方面的加速落地实现; 4.负责算法性能评估和分析,制定技术规划和性能标准,关键竞争力补齐 5.异构计算平台的产品化和服务化. 任职资格: 1.熟悉主流的并行编程以及性能优化技术,如Nvidia GPU,华为昇腾NPU等; 2.对XLA,TVM,自动化编译方面熟悉的优先; 3.熟悉大模型训练和推理加速等经验优先; 4.有很强的分析问题和解决问题的能力,有强烈的责任心;
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、理解上层业务应用,结合异构芯片应用特点,负责异构硬件系统需求分析,输出异构芯片需求规格,输出异构硬件系统方案; 2、和业务团队、软硬件研发团队紧密配合,分析工作负载模型,帮助业务团队实现硬件方案创新,提升性能、降低成本; 3、与芯片、网络、IDC、软件等团队紧密协作,负责异构芯片需求规格和异构硬件系统方案分析,确保异构硬件系统在TCO、性能、可靠性、DFX等方向竞争力领先; 4、跟进行业组织、开放标准组织,研究分析最新的技术、标准;结合产业链的最新技术能力和硬件产品特点提供综合竞争力领先的异构硬件系统方案。 职位要求: 1、至少5年以上异构硬件系统方案分析经验,有大规模异构计算系统的方案设计和实现经验; 2、熟悉计算机体系结构、硬件设计和实现,熟悉CPU、GPU、FPGA等异构计算硬件; 3、熟悉PCIe、DDR、网络和存储等系统总线和协议; 4、熟悉各类常见异构类平台,如GPU训练,推理场景加速硬件平台等; 5、在大团队、跨团队的项目推动和组织方面有成功经验; 6、具备良好的分析和解决问题的能力。
  • 20k-40k·14薪 经验3-5年 / 本科
    人工智能服务 / 上市公司 / 150-500人
    岗位职责: 1. 负责将基于深度学习的视觉算法部署在从端到边到云的各种硬件上,并从多角度优化以发挥具体平台的性能; 2. 设计并实现跨平台的调度框架,在多种平台上的高性能基础组件,兼顾各层次的并行和异构调度,及具体算子的汇编级优化,为公司各产品线提供支撑; 3. AutoML 及 模型的自动发布系统研发。 任职要求: 1. 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; 2. 熟悉计算机体系结构以及并行计算基本技术; 3. 熟悉任意一种深度学习框架者优先; 4. 对以下一种或多种技术有深入研究和实践经验的优先:有CPU或GPU体系结构调优经验;熟悉相关平台汇编指令,熟悉多核并行编程;有嵌入式多协处理器结构性能调优经验; 5. 有矩阵运算,计算机视觉和图像处理算法在各种硬件设备移植经验的优先; 6. 对高性能计算,异构计算和性能优化工作有强烈的兴趣。
  • 18k-25k 经验1-3年 / 本科
    人工智能服务 / 上市公司 / 150-500人
    岗位职责: 1. 负责将基于深度学习的视觉算法部署在从端到边到云的各种硬件上,并从多角度优化以发挥具体平台的性能; 2. 设计并实现跨平台的调度框架,在多种平台上的高性能基础组件,兼顾各层次的并行和异构调度,及具体算子的汇编级优化,为公司各产品线提供支撑; 3. AutoML 及 模型的自动发布系统研发。 任职要求: 1. 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; 2. 熟悉计算机体系结构以及并行计算基本技术; 3. 熟悉任意一种深度学习框架者优先; 4. 对以下一种或多种技术有深入研究和实践经验的优先:有CPU或GPU体系结构调优经验;熟悉相关平台汇编指令,熟悉多核并行编程;有嵌入式多协处理器结构性能调优经验; 5. 有矩阵运算,计算机视觉和图像处理算法在各种硬件设备移植经验的优先; 6. 对高性能计算,异构计算和性能优化工作有强烈的兴趣。
  • 20k-35k 经验3-5年 / 本科
    硬件 / 上市公司 / 500-2000人
    工作职责: 2. 熟练掌握C/C++/Fortran/Python及常用数据结构算法,动手能力强,有较强的算法分析及编程能力 3. 具备扎实的算法和数据结构基础,熟悉程序的编译、调试和优化流程 4. 具备算法优化能力,具有数学库优化开发经验优先 5. 具有CUDA/HIP/OpenCL/MPI等并行计算程序开发与优化经验优先 6. 熟悉Caffe/Tensorflow/MXNet等任意一种深度学习开源框架,有深度学习框架开发和优化经验优先 7. 练阅读相关领域英文论文并能实现 8. 具备良好的逻辑沟通能力和解决实际问题的能力 任职资格: 岗位职责: 1. 基于异构计算平台的算法优化和移植工作 2. 人工智能领域框架移植和性能优化任职资格 3. 参与处理器编译器开发; 4 .参与处理器编译工具链开发与维护; 5. 分析处理器性能,进行性能测试、分析与优化;
  • 20k-35k 经验3-5年 / 硕士
    硬件 / 上市公司 / 500-2000人
    工作职责: 2. 熟练掌握C/C++/Fortran/Python及常用数据结构算法,动手能力强,有较强的算法分析及编程能力 3. 具备扎实的算法和数据结构基础,熟悉程序的编译、调试和优化流程 4. 具备算法优化能力,具有数学库优化开发经验优先 5. 具有CUDA/HIP/OpenCL/MPI等并行计算程序开发与优化经验优先 6. 熟悉Caffe/Tensorflow/MXNet等任意一种深度学习开源框架,有深度学习框架开发和优化经验优先 7. 练阅读相关领域英文论文并能实现 8. 具备良好的逻辑沟通能力和解决实际问题的能力 任职资格: 岗位职责: 1. 基于异构计算平台的算法优化和移植工作 2. 人工智能领域框架移植和性能优化任职资格 3. 参与处理器编译器开发; 4 .参与处理器编译工具链开发与维护; 5. 分析处理器性能,进行性能测试、分析与优化;
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 岗位职责: 1.跟踪研究高性能异构计算前沿技术; 2.研究FPGA算法实现与性能优化方法; 3.研究FPGA、MCU、自毁等硬件保护方案; 4.研究高性能矩阵计算在FPGA、GPU上的硬件实现。 职责要求: 1.电子、通信、自动化等相关专业,硕士及以上学历; 2.精通Verilog/VHDL编程语言,精通时序约束、时序分析方法; 3.熟练使用仿真调试工具和掌握FPGA集成套件开发流程,如Vivado、ISE、QuestaSim; 4.参与过大型FPGA项目开发,具有PCIe,DDR3,SRIO,JESD204等高速接口逻辑设计经验; 5.具备MCU安全芯片相关开发经验者优先; 6. 极强的工作责任心,良好的团队协作精神,优秀的表达和沟通能力,乐于挑战,抗压力强。
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 岗位职责: 1.高性能计算、大数据、人工智能方向融合研究 2. 针对特定的计算平台(CPU/GPU/intel PMEM/RDMA)进行高性能计算加速,编译优化 3. 对机器学习(深度学习)中的计算问题进行研究,实现模型训练&推理的性能最大化。 4. 研究高性能计算中并行编程的使用和实现的挑战,完成关键应用&算法在分布式异构计算平台的高性能交付; 任职要求: [1] 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; [2] 熟悉计算机体系结构以及并行计算基本技术。 [3] 对下面至少一种技术有研发经验: a. 具有arm,x86,risc-v或者mips等至少一种CPU性能调优经验,熟悉相关平台体系结构和汇编指令,熟悉多核并行编程。 b. 对Ti6678,Hexagon HVX,Cadence Tensilica或者CEVA等至少一种DSP有算法开发移植和调优经验。 c. 对Graphcore,Habana,华为昇腾,寒武纪,燧原,比特大陆等任一款深度学习加速器有模型适配,调优,训练平台或推理引擎开发经验。 [4] 有代数矩阵运算、信号处理、计算机视觉和图像处理算法在不同处理器上移植和调优经验的优先。 [5] 对云和服务器集群有调优经验的优先;有开发运营过开源软件或者为知名开源软件贡献过代码的优先。 [6] 对高性能计算,异构计算,体系结构和性能优化工作有强烈的兴趣的优先。
  • 25k-50k·16薪 经验3-5年 / 本科
    新能源汽车制造 / 未融资 / 2000人以上
    一、岗位职责: 1. 协同软件架构师针对特定计算平台设计智能驾驶软件架构 ; 2. 根据智能驾驶业务需求负责系统异构计算平台功能数据流业务实现 ; 3. 基于目标计算平台及软件业务需求实现高效数据吞吐,优化系统时延及计算资源开销; 4. 实现传感器抽象,硬件抽象,系统及软件模块业务和调度 ; 5. 实现基于SOA的智驾相关服务应用开发; 6. 针对智驾异构传感器,实现相关的高效数据流模块,支持上层应用业务。 二、岗位需求: 1. 本科或以上学历,计算机或相关专业本科及以上学位; 2. 精通至少一门编程语言(C++优先),注重编码规范; 3. 有异构计算平台研发经验优先,有智能驾驶功能研发方面经验优先; 4. 熟悉Linux操作系统;具有DDS,ROS,IPC, SHM等开发经验 ; 5. 良好的沟通表达能力,团队合作能力 。
  • 15k-30k·13薪 经验不限 / 本科
    移动互联网,企业服务 / B轮 / 15-50人
    团队介绍: 构建基于 Kubernetes 的机器学习平台 OpenBayes 提供从数据标注到模型部署的全流程服务。致力于不断降低机器学习体系的使用门槛,加速从原始数据到最终应用的转化。 职位介绍: 针对机器学习场景,围绕 Kubernetes 生态构建支撑组件,应用场景包括线上 JupyterLab 的编排 CRD、线上服务 CRD、跨节点机器学习任务 CRD 等。 职位职责: 1.平台已有的 CRD / Controller / Operator 的维护; 2.对 Kubernetes 的组件做扩展,实现特定的调度策略,支持不同硬件的调度流程; 3.按照业务需求构建 extended resource 实现异构计算资源的调度; 4.其他组件构建与维护。 职位要求: 1.本科及以上学历; 2.熟练应用 Go/Python/Java 等编程语言之一或多个,Go 语言最佳; 3.有一定的 Kubernetes 开发经验,了解其底层原理; 4.计算机基础扎实,有基本的算法和数据结构基础知识; 5.自主学习能力强,有意愿接受新技术并进入新领域,有良好的沟通能力和团队协作能力。 加分项: 1.了解并使用过基于 k8s 的机器学习训练框架 kubeflow 或其他; 2.对分布式系统管理有实践经验,对该领域有很大的热情; 3.了解云原生体系,对其生态有所了解。
  • 30k-60k·16薪 经验不限 / 本科
    电商 / D轮及以上 / 2000人以上
    岗位职责: 1. 负责广告物料流水系统的架构设计与性能优化,支持上亿级别物料的实时处理与下发,确保数据的实时性和可靠性 2. 负责大型分布式广告检索引擎的架构设计和优化,支持毫秒级别实时索引系统的研发,研究和设计针对不同场景的最优索引架构 3. 负责广告在线系统的性能调优、架构设计与优化,支撑数百亿请求压力的高可靠系统的研发,通过合理运用算力和系统容量以提高系统性能和进行广告收益最大化探索 4. 负责广告在线系统的业务能力建设,包括广告产品的业务需求落地、广告效果优化、在线系统的迭代效率提升等 5. 持续关注广告科技领域的最新进展和技术趋势,参与技术研究和创新,不断优化系统架构,提升广告在线系统的效果和性能 岗位要求:  1. ***大学硕士及以上学历,计算机相关专业 2.  熟练Java/scala高级语言,掌握SQL/Shell/Python脚本语言,熟悉常用的数据结构和算法,熟悉网络编程、多线程编程,有良好的编程习惯 3. 有分布式系统开发、大数据处理开发经验者优先;有Spark/Flink/Kafka分布式框架的实践并掌握原理,对源代码有一定研究者优先; 熟悉ElasticSearch、Lucene等开源项目,熟悉搜索引擎原理和代码实现者优先 4. 具备优秀的逻辑思维能力,对解决挑战性问题充满热情,善于解决问题和分析问题 5. 有强烈的上进心和求知欲,善于学习新事物 6. 良好的团队合作精神,较强的沟通能力和学习能力 7. 有广告在线系统经验者优先 地址:北京市亦庄京东总部 部门简介:               广告系统技术部作为京东平台运营与营销中心的核心团队,承接京东站内外流量商业化的系统建设工作,负责广告系统的整体架构设计和技术选型、高性能异构计算的设计和优化以及离线海量数据的存储与高时效计算。涵盖广告数据/物料流、 广告在线模型服务、广告在线播放、广告实时检索、广告数据系统等核心模块,涉及百亿吞吐高并发处理、海量数据的分布式存储、高效索引检索、在线高性能计算、离线大规模机器学习训练等技术,是京东技术栈最全面的团队之一。       我们拥有互联网广告业内一流的技术团队,有着丰富的行业经验和技术培养体系,作为我们技术团队的一员,你将有机会参与到各种创新性和有挑战性的项目中。你可以与各个领域的专业人员和同事合作,共同探索前沿的技术,有机会利用你的技术能力和个人兴趣来解决业务问题,创建出更丰富和更个性化的技术解决方案。       如果你具备创新意识和技术能力,渴望实现自己的人生价值和职业目标,我们诚挚地邀请你加入我们的技术团队,共同致力于技术创新和社会进步的使命!
  • 25k-50k·16薪 经验3-5年 / 本科
    工具 / 上市公司 / 2000人以上
    业务方向介绍:百舸异构计算平台是面向大规模深度学习的高性能云原生AI计算平台,为模型算法专家和运维专家提供全面的集群运维支持和任务全生命周期管理,同时具备训练/推理加速、故障容错、智能故障诊断等高级功能,有效训练时长可达98%以上,大幅提升算力使用效率,助力企业在大模型时代的业务转型 工作职责: -负责百度AI计算集群网络性能相关的诊断与优化 -负责百度AI计算集群通信库研发与运维部署 -负责百度AI计算中训练、推理依赖的通信加速 -负责百度AI计算集群与通信关联的其他软件研发工作 任职资格: -熟悉AI计算基本模式与集群设计构建 -了解流行的AI训推框架(如Megatron、vLLM等) -熟悉RDMA等高性能网络技术和NCCL等集合通信库 -有集群管理、运维等相关的研发经验
  • 25k-40k 经验10年以上 / 本科
    物联网,通讯电子 / 不需要融资 / 少于15人
    **主要职责**: 1. 开发网络通信协议的硬件加速器。 2. 负责软硬件系统的架构设计。 3. 利用仿真、FPGA等手段验证功能。 4. 实现加速器的集成与调试。 5. 撰写相关技术文档与手册。 **职位要求**: 1. 8年以上数字电路设计研发经验。 2. 有Verilog或VHDL的RTL设计经验;熟练使用System C或C++进行硬件建模;掌握HLS工具。 3. 了解硬件处理器设计,如CPU、DSP、GPU;对异构计算SoC架构有深刻理解;了解RISC-V和Arm架构及其集成方式。 4. 理解系统级设计,包括软硬件分区与性能优化。 5. 熟悉ASIC设计的EDA工具。
  • 工具 / 上市公司 / 2000人以上
    职责 -负责深度学习推理引擎的优化工作,主要针对GPU、CPU以及自研语音芯片 -负责深度学习算法在多终端工程优化和落地 -负责深度学习模型训练框架的高性能计算优化工作 要求 -精通C/C++编程,编程习惯和功底扎实优秀 -对深度学习算法有一定了解,具备将复杂问题进行数学建模的意识和能力 -对高性能计算\分布式计算\异构计算\编译系统等有了解,有过mpi、gcc、gpu等开发经验加分 -了解多线程加速,DSP相关移植,单指令多数据加速,进程间通信,有过DSP的指令集以及加速方法开发经验的加分; -沟通能力和团队合作意识强,热爱挑战,踏实勤奋