【高性能计算工程师】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

高性能计算工程师
[北京·西城区] 09:04发布

40k-60k·16薪经验3-5年 / 硕士

因诺

金融业 / 不需要融资 / 50-150人

工作职责： 1. 参与公司高性能计算平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现，例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术，致力于GPU或其他异构硬件的高性能系统开发。 4. 开发公司高频策略所需的高性能回测系统。职位要求： 1. 计算机、电子、通信专业，硕士及以上学历。 2. 精通C++语言，具有3年及以上的linux环境下C/C++多线程和多进程开发经验，熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构，了解常见处理器（X86、ARM等）、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验，通过对Linux内核的优化，开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验，能够基于相关GPU框架（Tensorflow、Pytorch）进行性能或通信上的优化，以提升相关系统在海量金融数据（TB级）下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强，善于学习，有较强的自我驱动，具有独立分析并解决问题的能力。
高性能计算研发工程师
[北京·海淀区] 07:44发布

30k-50k·14薪经验3-5年 / 硕士

搜狐集团

移动互联网,广告营销 / 上市公司 / 2000人以上

岗位职责： 1、负责推理加速算法的研发和实现，包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2、负责深度学习模型的量化和蒸馏，实现高效的模型压缩和部署，提高模型的运行效率和推理速度。 3、负责LLM/多模态模型的端到端部署，包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 4、负责扩散模型的端到端部署和AI绘图的高并发服务流程设计，包括但不限于核心算子/采样器优化、模型优化和压缩、服务流程优化。 5、负责设计和研发AI端到端任务编排体系，提升AI大模型在业务中的应用效率。 6、负责优化计算集群的资源调度和弹性计算策略，提升集群的资源利用率。岗位要求： 1、硕士及以上学历，计算机专业出身。 2、熟悉CPU/GPU架构与工作原理，有深度学习系统研发经验，熟悉CUDA编程并有相关开发经验。 3、具有深度学习推理加速和优化的经验，熟悉常见的加速技术，如剪枝、量化、分布式推理等，并能够根据不同场景和硬件平台进行针对性的优化。 4、熟悉常见的模型量化技术，如低精度量化、动态量化等，并能够进行模型的量化优化。 5、熟悉常见的深度学习框架，如PyTorch、TensorFlow等，并能够根据业务需求进行算法实现和调试。 6、熟悉LLM/多模态相关的算法技术以及推理加速方法。 7、有团队管理经验者优先。 8、具备较强的团队合作和沟通能力，优秀的分析和解决问题能力，对挑战性问题充满激情，自驱有追求，具备较强的攻坚能力。
高性能计算工程师（大模型数据方向）
[北京·海淀区] 07:22发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责：团队介绍：我们是「豆包视频生成模型-PixelDance」团队，我们专注于开发视频生成模型，解决视频生成的关键问题，包括但不限于高动态性视频生成、内容一致性保障。构建行业领先的视频基础模型，引领技术的未来潮流。视频生成工程团队的工作涉及到模型生产的全周期流程，在这里，你有机会参与到模型的数据生产、训练加速、推理加速、服务部署的每个环节。同时你将接触到最先进的视频生成技术、海量的数据、大规模的集群，我们期待你能够和我们的模型一同Scale UP。 1、视频处理端到端性能优化：负责视频数据处理的性能提升，包括但不限于视频编解码优化、蒸馏、量化、Kernel优化；对异构资源进行合理分配和优化，充分利用各类硬件资源提升视频数据处理能力，提高资源利用率以应对海量视频数据的挑战； 2、数据层处理平台化建设：参与视频数据处理平台的设计与建设，制定平台的技术架构和发展规划；持续优化平台功能，确保平台的稳定性、可靠性和可扩展性，满足不断增长的业务需求； 3、视频数据生产管理：统筹视频数据的采集、整理、存储等生产环节，建立高效的数据生产流程；确保视频数据的质量和准确性，对数据进行严格的审核和校验； 4、算法优化与创新：不断探索和研究新的视频数据处理算法和技术，对现有算法进行优化和改进；结合人工智能、机器学习等先进技术，提升视频数据的分析和处理能力，为业务提供更有价值的洞察。职位要求： 1、计算机及相关专业，本科及以上学历，良好的沟通和团队协作能力； 2、精通Python或Golang等至少一种编程语言； 3、熟练使用GPU或NPU高性能编程技术为模型训练或推理加速，例如：CUDA、CUDNN、CUTLASS、Triton等； 4、熟练使用开源推理加速工具为模型加速，例如：TensorRT-LLM、vLLM、TVM、torch.compile等，并深入理解背后原理； 5、具备以下一个或多个能力者优先： 1）具有数据处理相关经验，熟悉图像或视频数据处理方法，了解CV、VLM和Diffusion Model相关算法； 2）熟悉大数据分布式处理框架Spark、Flink、Hadoop、Ray者优先； 3）熟练使用DALI、OpenCV、FFmpeg等图像处理工具。
高性能集合通信库工程师-网络
[上海·杨浦区] 07:53发布

20k-40k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、核心研发工作： 1）负责集合通信库（CCL）设计、开发与优化，支持多卡/多机场景下的高性能通信； 2）基于RDMA和Scale-up等互联技术，研发高速通信库及相关工具； 3）探索通信与计算的协同优化，设计通信算子与计算算子的融合方案； 2、性能优化与问题解决： 1）分析并优化AI集群中单机内/多机间的集合通信性能（如AllReduce、All2All等），突破软硬件性能瓶颈； 2）解决分布式训练/推理场景中的通信问题，适配复杂应用场景需求； 3）利用Triton等工具开发高性能通信计算融合算子，优化端到端通信延迟； 3、技术协作与生态建设： 1）与训练、推理、自研软硬件等团队协作，优化AI模型通信效率，支撑整体系统性能提升； 2）洞察集合通信技术趋势，推动自研通信库的架构演进与生态适配。职位要求： 1、本科及以上，计算机、电子工程相关专业； 2、扎实的分布式系统知识，熟悉大规模AI集群架构、网络通信原理及RDMA技术； 3、熟悉常见集合通信算法（如Ring、Tree、Halving-Doubling），了解集合通信库（NCCL等）实现原理； 4、具备复杂问题分析能力，能独立完成性能调优与故障排查。
密码研发专家（隐私计算）
[北京·西二旗] 09:13发布

25k-50k·16薪经验5-10年 / 硕士

贝壳

居住服务 / 上市公司 / 2000人以上

岗位职责： 1.研究并跟踪隐私计算技术发展前沿，研发隐私计算平台并在集团应用场景落地； 2.分析业务需求，理解业务场景，设计满足业务需求的隐私计算解决方案； 3.负责隐私计算方案的关键技术研发、隐私计算平台开发以及工程化实现； 4.基于业务应用场景的隐私计算能力研发和落地，包括但不限于PIR、PSI、机器学习和深度学习等场景； 5.加密方案/加密算法的设计、安全性证明； 6.已有加密方案/加密算法的安全性评估。任职要求： 1.密码学/数学或相关领域硕士或以上学历，5年以上工作经验，有2年以上隐私计算工作经验，博士学历优先。 2.熟悉可搜索加密（SE）、TEE、MPC等隐私计算能力的实现，掌握同态加密、不经意传输、零知识证明等隐私计算基础知识。 3.有实际从事或完整参与过隐私保护计算领域项目经验，具备产业化实践经验者优先。 4.熟悉深度学习框架，例如Tensorflow、Pytorch等。 5.具有良好的沟通、文档撰写以及团队协作能力，能够快速学习新的技术，对新技术有很强的敏锐度和洞察力。
实时计算平台开发工程师
[北京·西二旗] 07:22发布

25k-40k·16薪经验3-5年 / 本科

贝壳

居住服务 / 上市公司 / 2000人以上

工作职责： 1、负责贝壳Hermes实时计算平台的开发和维护 2、参与Flink等实时技术调研及框架源码改造开发岗位要求： 1、熟悉JAVA体系架构，熟悉常见数据结构、多线程并发、JVM等，精通spring、spring boot、MyBatis等主流的开源框架 2、熟悉MySQL、Redis等数据库技术，Http等常见网络协议； 3、熟悉Hadoop生态圈技术，包括HDFS、MapReduce、HBase、Hive、Zookeeper等，熟悉主流实时处理技术，如Spark、Flink、kafka、pulsar，提交社区patch者优先 4、良好的思维习惯及沟通能力，具有较强的主动意识，乐于接受挑战 5、具有较强的学习能力和问题解决能力
118113-云计算技术架构专家
[深圳·南山区] 07:44发布

35k-50k 经验10年以上 / 本科

平安科技

金融 / 上市公司 / 2000人以上

工作职责 1、负责平安云计算产品的架构设计和落地工作，协助技术架构团队管理； 2、负责裸金属、虚拟化、容器云原生领域的前沿技术跟踪与应用，架构演进，支撑业务中长期发展； 3、能主导计算领域重大创新项目的统筹，推进客户解决方案落地； 4、解决计算领域疑难技术运维问题，提升系统性能及稳定性。任职要求【必须条件】 1、本科及以上学历，计算机相关专业；8年以上云计算相关经验； 2、精通云原生核心技术原理，如容器运行时，Kubernetes，operator，容器网络，容器存储等核心机制； 3、具备云计算虚拟化（必须），网络（熟练），中间件（加分项），安全（加分项），大数据（加分项）等领域的5年以上研发或架构经历； 4、有Golang代码检视能力，精通优先； 5、精通GPU智算平台相关技术，如：Gang 调度、PipeLine调度、RDMA, CUDA, RoCE，NCCL等，具有昇腾等信创平台研发经验者优先； 6、有云计算研发或架构领域重大项目实施经验；【加分条件】 1、精通容器CNI、原理；精通网络相关数据面技术原理，具有独立研发CNI组件经验者优先； 2、精通容器CRI、NRI技术原理；熟悉主流容器运行时Docker，containerd，runc，kata等，具有独立研发CRI运行时能力； 3、精通容器CSI技术原理，精通主流分布式存储、本地存储等原理与机制，有存储研发经验者优先； 4、熟悉混部相关技术优先，如：koordinator, Caelus，及相关资源。
云计算工程师(006593)
[广州·天河区] 07:44发布

9k-15k 经验3-5年 / 大专

广州南天

数据服务 / 上市公司 / 500-2000人

岗位职责： 1、根据客户的需求和业务场景，提出合适的云计算架构方案。有云计算项目的实践经验，包括云架构设计、云平台选择、部署和配置、性能优化等方面。熟悉腾讯云、阿里云和红帽的OpenShift等各种云服务和解决方案，能够根据客户需求提供技术咨询和支持； 2、需要向用户提供容器技术支持，包括帮助用户安装、配置和使用容器服务，以及回答用户的技术咨询和问题； 3、在云平台上部署、配置和管理应用程序和服务，确保云平台能够正常运行。同时需要对云环境进行监测和维护，确保其高可用性和可靠性，并及时处理云服务的故障。任职要求： 1、对云计算架构设计原则有深入的理解，包括弹性伸缩、高可用性、容灾备份、安全性等方面； 2、具备容器化应用程序的开发和部署经验，熟悉容器编排工具Kubernetes，并能够设计和管理容器化环境，熟练掌握kubernetes、docker的常用操作，对容器的网络、安全、存储、中间件、数据库等方向有深入的理解； 3、具备VMware虚拟化技术的实践经验，包括虚拟机的创建、配置和管理，以及虚拟网络和存储的设置。熟悉VCENTER 6.0 7.0 8.0 各个版本使用，ESXI主机的安装，以及虚拟网络规划，有独自实施和解决用户故障的能力； 4、熟悉华为、联想、浪潮等厂商的服务器和存储产品，了解其硬件架构和性能特性。熟悉各种系统设备的安装和配置，对问题处理有一定的经验； 5、熟悉至少一门脚本语言（shell/python均可），具备底层脚本开发能力，具备编写和维护相关脚本和工具的能力； 6、具备良好的团队合作精神，能够与销售团队和技术团队紧密合作，共同完成项目。愿意分享知识和经验，帮助团队成员提升技术水平。
云计算运维工程师
[北京·牡丹园] 09:13发布

15k-20k 经验5-10年 / 大专

速强信息

移动互联网 / 未融资 / 150-500人

工作职责 1.负责云平台计算和虚拟化集群的稳定性维护； 2.负责解决客户云主机，云备份等计算产品的售后问题，对故障定位持续进行改进和优化； 3.负责支撑云计算底座产品的迭代和演进，提高迭代和演进的效率和稳定性； 4.负责和指导开发自动化运维工具，不断研发与探索运维自动化及各类创新途径，缩短运维响应时间，降低运维成本； 5.负责客户侧上云用云方案支持工作。技能要求 1.熟悉TCP/IP的基本原理和实际应用，精通linux操作系统，网络相关协议栈； 2.精通虚拟化相关技术，如vmware，kvm，docker，containerd等； 3.熟悉常见监控工具，如Prometheus、Grafana、ELK等； 4.至少掌握一门语言，python，go，shell优先； 5.熟悉常用linux服务，包括但不限于iptables，nginx，keepalived，lvs，等。 6.具备openstack、kubernetes等集群管理经验，具备中大规模（500+服务器)公有云或者私有云集群维护经验者优先。任职要求 1.计算机相关专业优先； 2.具备5年以上云计算相关工作经历，有大型互联网企业云计算架构设计及维护经验者优先； 3.具备良好的学习能力及抗压能力； 4.有较强的团队意识及沟通能力。
云计算开发工程师
[西安·雁塔区] 07:53发布

18k-30k 经验5-10年 / 本科

电科金仓

数据服务｜咨询 / 不需要融资 / 500-2000人

职责描述 1.负责Openstack、K8S云平台的规划设计、离线部署、系统优化和疑难问题解决； 2.负责Openstack、K8S平台基于国产硬件、软件环境的测试验证工作 3.负责云平台上承载业务系统的迁移部署实施工作； 4.负责工作中的方案、测试报告、汇报材料编写。职位要求： 1.精通Linux系统，至少擅长一门编程语言，Python最佳 2.精通Openstack技术，需要有从0到1的设计规划与搭建经验，生产运维经验； 3.精通虚拟化，包括VMware/KVM等，熟悉Qemu/Libvirt架构 4.精通K8S与Docker容器技术，有实际环境搭建与运维经验； 5.熟悉分布式存储技术，需要有从0到1的设计规划与搭建经验，生产运维经验； 6.有OpenStack二次开发经验者优先；具备较强的学习能力、逻辑思维能力，工作态度严谨负责，具备良好的文字功底
云计算运维工程师
[成都·猛追湾] 07:44发布

10k-20k 经验3-5年 / 本科

速强信息

移动互联网 / 未融资 / 150-500人

1、有效处理客户以及平台故障，保证系统7*24稳定运行； 2、负责运维知识库建立，并及时进行知识库更新； 3、负责云资源池验收及产品验收，可协助客户解决相关云产品使用问题； 4、负责资源池业务监控及服务巡检，及时跟进及解决相关问题。 5、参与运维工具体系的规划建设，包括需求调研、方案设计、产品实施 6、参与运维工具体系相关标准、规范制定 1、深入理解Linux、windows操作系统、体系结构，可熟练使用Shell/Perl/Python等语言中的一种或多种； 2、熟悉OpenStack核心组件，如nova, cinder , glance, neutron, keystone等； 3、熟悉基本网络知识，具备hcnp或ccnp或等同经验者优先，具备云平台维护经验者优先； 4、熟练掌握主流虚拟化技术，熟悉虚拟化各项功能原理，能够进行规划实施者优先； 5、有相关云商维护工作经验者优先； 6、对于K8s等容器类规模化集群有5年以上工作经验者优先 7、有相关客户服务或客户支撑经验者优先； 8、具有强烈的团队协作意识，高度的责任感，对工作积极严谨，勇于承担责任，逻辑思维能力强，有较强学习和创新能力； 9、具有较强的抗压能力和执行力。
116183-云计算工程师
[深圳·南山区] 07:44发布

15k-25k 经验1-3年 / 本科

平安科技

金融 / 上市公司 / 2000人以上

工作职责 1、基础设施运维，包括KVM、Vmware、Kubernetes等技术方向； 2、运维体系建设，包括标准化、可观测性、故障诊断等运维能力； 3、运维平台建设，规划并设计自动化方案，持续提升运维效率，控制运维风险。任职要求 1、计算机相关专业，大学本科及以上学历，5年以上运维经验； 2、熟悉Linux内核原理，熟悉CPU、Memory、I/O、Network性能问题的诊断； 3、熟悉TCP/IP原理，熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理； 4、熟悉Kubernetes原理，具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先，熟悉云平台IaaS架构优先，有大规模主机/集群运维经验优先； 6、责任心强、良好的沟通能力、团队协作能力。
高性能计算工程师
[深圳·大冲] 2023-09-23

30k-60k·14薪经验不限 / 硕士

其域创新

IT技术服务｜咨询,人工智能服务 / 天使轮 / 50-150人

工作职责： 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现，例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术，致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发，大规模矩阵求解，优化问题等。职位要求： 1. 计算机、电子、通信专业，硕士及以上学历。 2. 精通C++语言，具有3年及以上的linux环境下C/C++多线程和多进程开发经验，熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构，了解常见处理器（X86、ARM等）、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验，通过对Linux内核的优化，开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强，善于学习，有较强的自我驱动，具有独立分析并解决问题的能力。
高性能计算工程师
[深圳·科技园] 2023-05-11

25k-50k 经验3-5年 / 本科

其域创新

IT技术服务｜咨询,人工智能服务 / 天使轮 / 50-150人

工作职责： 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现，例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术，致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发，大规模矩阵求解，优化问题等。职位要求： 1. 计算机、电子、通信专业，硕士及以上学历。 2. 精通C++语言，具有3年及以上的linux环境下C/C++多线程和多进程开发经验，熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构，了解常见处理器（X86、ARM等）、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验，通过对Linux内核的优化，开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强，善于学习，有较强的自我驱动，具有独立分析并解决问题的能力。
高性能计算工程师
[广州·番禺区] 2023-03-27

30k-60k·16薪经验5-10年 / 本科

虎牙科技

社交,游戏 / 上市公司 / 2000人以上

岗位职责 1.参与深度学习推理引擎持续迭代优化，编译优化和工程化 2.负责各种图像处理算法、数学运算在不同计算设备上的高性能实现 3.分析算法落地的性能瓶颈，设计合理且高效的优化方案，推动算法落地任职需求 1.精通c/c++，精通算法与数据结构 2.熟悉计算机体系结构，具备良好的并行计算基础 3.熟悉至少一种深度学习推理框架或高性能计算库：NCNN、MNN、TNN、TensorRT、TFLite、BLAS、Eigen等 4.熟悉模型定点量化、稀疏化、裁剪、知识蒸馏、NAS等模型优化的优先加分项 1.有NEON、SSE、AVX、GPU、NPU并行加速经验者优先 2.有高性能计算性能指标超越同类竞标对象优化经验优先 3.有深度学习编译器开发经验优先：TVM、XLA等