• 20k-40k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、核心研发工作: 1)负责集合通信库(CCL)设计、开发与优化,支持多卡/多机场景下的高性能通信; 2)基于RDMA和Scale-up等互联技术,研发高速通信库及相关工具; 3)探索通信与计算的协同优化,设计通信算子与计算算子的融合方案; 2、性能优化与问题解决: 1)分析并优化AI集群中单机内/多机间的集合通信性能(如AllReduce、All2All等),突破软硬件性能瓶颈; 2)解决分布式训练/推理场景中的通信问题,适配复杂应用场景需求; 3)利用Triton等工具开发高性能通信计算融合算子,优化端到端通信延迟; 3、技术协作与生态建设: 1)与训练、推理、自研软硬件等团队协作,优化AI模型通信效率,支撑整体系统性能提升; 2)洞察集合通信技术趋势,推动自研通信库的架构演进与生态适配。 职位要求: 1、本科及以上,计算机、电子工程相关专业; 2、扎实的分布式系统知识,熟悉大规模AI集群架构、网络通信原理及RDMA技术; 3、熟悉常见集合通信算法(如Ring、Tree、Halving-Doubling),了解集合通信库(NCCL等)实现原理; 4、具备复杂问题分析能力,能独立完成性能调优与故障排查。
  • 20k-40k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、核心研发工作: 1)负责集合通信库(CCL)设计、开发与优化,支持多卡/多机场景下的高性能通信; 2)基于RDMA和Scale-up等互联技术,研发高速通信库及相关工具; 3)探索通信与计算的协同优化,设计通信算子与计算算子的融合方案; 2、性能优化与问题解决: 1)分析并优化AI集群中单机内/多机间的集合通信性能(如AllReduce、All2All等),突破软硬件性能瓶颈; 2)解决分布式训练/推理场景中的通信问题,适配复杂应用场景需求; 3)利用Triton等工具开发高性能通信计算融合算子,优化端到端通信延迟; 3、技术协作与生态建设: 1)与训练、推理、自研软硬件等团队协作,优化AI模型通信效率,支撑整体系统性能提升; 2)洞察集合通信技术趋势,推动自研通信库的架构演进与生态适配。 职位要求: 1、本科及以上,计算机、电子工程相关专业; 2、扎实的分布式系统知识,熟悉大规模AI集群架构、网络通信原理及RDMA技术; 3、熟悉常见集合通信算法(如Ring、Tree、Halving-Doubling),了解集合通信库(NCCL等)实现原理; 4、具备复杂问题分析能力,能独立完成性能调优与故障排查。
  • 40k-60k·16薪 经验3-5年 / 硕士
    金融业 / 不需要融资 / 50-150人
    工作职责: 1. 参与公司高性能计算平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 开发公司高频策略所需的高性能回测系统。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
  • 30k-50k·14薪 经验3-5年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3、负责LLM/多模态模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 4、负责扩散模型的端到端部署和AI绘图的高并发服务流程设计,包括但不限于核心算子/采样器优化、模型优化和压缩、服务流程优化。 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率。 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身。 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验。 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。 6、熟悉LLM/多模态相关的算法技术以及推理加速方法。 7、有团队管理经验者优先。 8、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 20k-30k·14薪 经验5-10年 / 本科
    软件服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1、负责星辰低代码平台的发展规划、方案设计、需求分析、业务流程设计、评审等; 2、负责与产品部协作,持续完善星辰业务中台能力,推动星辰中台能力建设落地; 3、负责星辰生态伙伴的需求和整理,并推动规划设计落地; 4、关注行业动态,负责竞争分析,进行竞品产品动态与行业资讯收集研究,深入了解竞品,提出合理的产品发展建议; 5、参与生态产品的客户反馈处理、对生态伙伴赋能培训和业务应用支持等; 6、分配的其他工作。 任职要求: 1、本科及以上学历,计算机及相关专业; 2、3年以产品设计工作经验, 具有产品规划与设计经验,输出产品方案,较强的文档撰写能力; 3、有较强的业务应用规划方案或技术方案规划能力; 4、关注行业趋势、用户体验等,有良好的用户感知和缜密的逻辑思维,对产品生命周期有清晰认识; 5、较强的沟通协调能力,能与不同角色人员快速高效的开展工作; 6、较强的自我学习能力和快速适应能力,能承受工作压力; 7、具备SAAS模式下的低代码平台应用设计、实施经验等优先考虑;具有苍穹平台,ERP领域相关工作经验者优先考虑。
  • 30k-60k·14薪 经验不限 / 硕士
    IT技术服务|咨询,人工智能服务 / 天使轮 / 50-150人
    工作职责: 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发,大规模矩阵求解,优化问题等。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。 具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
  • 25k-50k 经验3-5年 / 本科
    IT技术服务|咨询,人工智能服务 / 天使轮 / 50-150人
    工作职责: 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发,大规模矩阵求解,优化问题等。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。 具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 工作职责: 1. 参与高性能计算平台的搭建、开发和优化。 2. 参与HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
  • 30k-60k·18薪 经验在校/应届 / 本科
    企业服务 / 上市公司 / 150-500人
    【岗位职责】 1.聚焦量化策略研究所使用的分布式存储技术,设计、研发、优化、维护大规模、高性能、可扩展的分布式文件存储、对象存储和缓存系统 2.参与业界一流的HPC系统设计,追踪前沿硬件和相关技术,如NVMe、IB、RoCE等设计、搭建行业领先的低延迟、高性能分布式文件和缓存系统 3.开发方便易用的工具、文件格式和读写API,提升性能,不断提高用户体验和效率 4.与量化算法研究员合作,诊断量化研究全流程中的存储问题,进行系统性能调优 5.与其他团队一起配合,清晰定义HPC的技术概念、使用规范并进行有效沟通 6.帮助团队成员成长,促进组织内的知识共享 【岗位要求】 1.海内外知名高校本科及以上学历,计算机相关专业,5年以上存储相关经验 2.技术要求 a.精通C/C++,熟悉Python,掌握常见的算法和数据结构 b.具备大规模分布式系统的设计、开发、测试、部署、监控、运维经验c.熟悉存储方案、开源系统、协议和技术,比如对象存储、文件系统、高性能缓存.S3、NFS、数据库等。熟悉其架构、原理、调优、运维等多方面知识d.熟悉HPC通信协议和技术,如TCP/RDMA/ROCE/GPUDirect 3.优秀的代码阅读、调试和调优能力,享受解决问题的过程 4.具有优秀的书面表达与沟通协调能力,善于理解和帮助用户
  • 40k-70k·16薪 经验3-5年 / 本科
    企业服务 / 未融资 / 15-50人
    工作职责: 负责高性能计算平台开发,不断优化和研究计算性能、集群性能等,于探索已知技术的物理极限。 职位要求: 熟悉计算机系统结构,了解 x86_64 处理器核心结构,Cache Coherence Protocol,AVX2/FMA扩展指令 熟练掌握Linux C/C++高性能编程(多进程,多线程),丰富的 Linux 平台 debug/profile/tuning 经验 熟练掌握 GNU 编译调试工具链,具备面向 OS/CPU 架构的高性能,低延迟,低抖动程序开发能力; 有以下经验之一是加分项: 具有cython/boostpython混合语言开发经验; 具有Linux内核开发调优经验; 具有CUDA高并发计算程序开发经验; 具有TCP/IP Socket 开发调试经验; 具有solarflare Efvi/OpenOnload编程经验或者 Intel DPDK开发经验 具有python/C++ TB ~ PB 级大规模数据处理经验; 具有MPI/infiniband/RDMA/RoCE高性能分布式计算系统开发经验; 具有深度学习框架 Tensorflow/pytorch 开发调优经验;
  • 15k-25k·13薪 经验3-5年 / 大专
    金融 / 不需要融资 / 2000人以上
    职责描述: 1.负责证券行情分布式后端、股票高频交易系统等开发 2.参与系统架构优化、线程布局优化、内存优化等综合性工作 3.参与系统可用性、自动化、可维护性持续提升等工作 4.参与公司业务多元化,共享公司发展结果,表现优异者可晋升合伙人 任职要求: 1、能够跨组,跨部门紧密协作 2、至少有两种开发语言的开发经验 3、有分布式系统架构编写经验,在整个系统开发中有完整认知 4、熟练掌握linux和系统调优,不断优化性能,开发行业一流的低延迟、高并发系统 岗位主要负责行情数据的处理,加工衍生其他指标等等数据,或者加工数据库数据,给用户提供决策平台 目前用到的技术栈有 zookeeper,libevent,zeromq,leveldb等等
  • 15k-30k 经验1-3年 / 本科
    企业服务,人工智能,通讯电子 / 天使轮 / 50-150人
    职位描述 1. 负责大模型分布式系统和多GPU优化系统研发,探索面向大模型的分布式优化新技术; 2. 负责分布式系统软件的设计和开发,提升多GPU(同一节点和跨网络多节点)高性能网络通信性能; 职位要求 1、本科及以上学历,计算机/电子相关专业优先,至少2年分布式、通信系统优化经验; 2、熟练掌握C、C++、Go等一种或多种编程语言,熟悉计算机体系架构、分布式并行计算和异构计算框架; 3、熟悉OpenMPI, OpenSHEM, MPICH,NCCL,UCX等一种或多种分布式通信软件者优先; 4、了解RDMA,PCIE Peer2Peer, GPU Direct等芯片互联和网络传输编程相关知识者优先; 5、了解常见的深度学习分布式优化方法者优先;
  • 企业服务,人工智能,通讯电子 / 天使轮 / 50-150人
    【岗位职责】 ·参与GPU-RDMA端网协议与算法的设计、开发与调优工作。 ·参与GPU高速网络通信库的设计、开发与卸载加速工作。 ·实现高性能网络的状态监控、配置校验和故障定位。 ·与团队成员协作,进行技术攻关,提升系统可扩展性和稳定性。 ·与芯片厂商合作,开展网络新硬件、新协议和新架构设计。 ·跟踪和研究面向GPU集群的分布式系统优化技术和BDMA网络通信技术 【岗位要求】 ·计算机科学、通信工程或相关领域的学士、硕士或博士学位。 ·扎实的编程能力,熟练掌握至少一种编程语言,如C、C++、Golang等。 ·深刻理解高性能网络协议栈、网络处理器体系结构、数据中心网络、分布式系统。 ·精通集合通信、拥塞控制、流量调度、路由查找、网络校验、拓扑设计等。 ·熟悉Linux内核协议栈、DPDK、RoCEv2、NCCL、MPI、UCX等底层驱动和通信接口。
  • 35k-45k·13薪 经验不限 / 博士
    移动互联网,教育 / 上市公司 / 500-2000人
    高性能计算博士后 研究方向: 1、开展高性能计算和AI交差课题相关研究; 2、大规模分布式训练性能优化,如高质量高性能的优化器; 3、AI神经网络研究,设计低计算量高质量的神经网络; 4、鼓励发表高水平研究成果。 职位要求: 1、年龄在35周岁以下,获得博士学位不超过三年(含应届),计算机及其他相关理工类专业;; 2、熟悉ARM64、X86、GPU、NPU体系结构; 3、熟悉并行编程框架(MPI/OpenMP/CUDA/OpenCL等),有高性能计算开发、调优、算法设计开发经验者优先; 4、熟悉PyTorch、TensorFlow等框架,对训练框架做过深度优化者优先; 5、有较强的独立科研能力与团队合作能力,以**作者在相关领域发表过高水平论文。
  • 电商 / 上市公司 / 2000人以上
    【职位描述】 1、负责高性能计算、大数据、低代码相关行业分析、产品调研 2、负责Paas、低代码平台产品原型设计 3、负责与AI、机器人等相关业务对接,分析需求、设计相关产品支持 4、负责规划沟通PaaS、低代码平台产品开发落地 【职位要求】 1、本科及以上学历,熟悉ToB/C平台型产品 2、有技术背景,做过技术相关工作,对开发和流程有自己的理解 3、熟练掌握 AxureRP 等原型工具的使用,有平台型产品的设计经验 4、具备良好的沟通和协调能力,跨部门协作能力,推动能力,很强的团队合作精神 5、具备良好的产品规划、设计与项目落地能力 6、熟悉 云原生、CICD、数据治理、数据仓库等技术原理,具有实践经验者优先 7、对事业充满激情,自我驱动力强,能够承受较大的工作压力 8、有Paas平台,低代码,可视化编程产品经验者优先