-
工作职责: 1. 参与公司高性能计算平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 开发公司高频策略所需的高性能回测系统。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
-
岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3、负责LLM/多模态模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 4、负责扩散模型的端到端部署和AI绘图的高并发服务流程设计,包括但不限于核心算子/采样器优化、模型优化和压缩、服务流程优化。 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率。 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身。 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验。 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。 6、熟悉LLM/多模态相关的算法技术以及推理加速方法。 7、有团队管理经验者优先。 8、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
职位职责: 团队介绍:我们是「豆包视频生成模型-PixelDance」团队,我们专注于开发视频生成模型,解决视频生成的关键问题,包括但不限于高动态性视频生成、内容一致性保障。构建行业领先的视频基础模型,引领技术的未来潮流。视频生成工程团队的工作涉及到模型生产的全周期流程,在这里,你有机会参与到模型的数据生产、训练加速、推理加速、服务部署的每个环节。同时你将接触到最先进的视频生成技术、海量的数据、大规模的集群,我们期待你能够和我们的模型一同Scale UP。 1、视频处理端到端性能优化:负责视频数据处理的性能提升,包括但不限于视频编解码优化、蒸馏、量化、Kernel优化;对异构资源进行合理分配和优化,充分利用各类硬件资源提升视频数据处理能力,提高资源利用率以应对海量视频数据的挑战; 2、数据层处理平台化建设:参与视频数据处理平台的设计与建设,制定平台的技术架构和发展规划;持续优化平台功能,确保平台的稳定性、可靠性和可扩展性,满足不断增长的业务需求; 3、视频数据生产管理:统筹视频数据的采集、整理、存储等生产环节,建立高效的数据生产流程;确保视频数据的质量和准确性,对数据进行严格的审核和校验; 4、算法优化与创新:不断探索和研究新的视频数据处理算法和技术,对现有算法进行优化和改进;结合人工智能、机器学习等先进技术,提升视频数据的分析和处理能力,为业务提供更有价值的洞察。 职位要求: 1、计算机及相关专业,本科及以上学历,良好的沟通和团队协作能力; 2、精通Python或Golang等至少一种编程语言; 3、熟练使用GPU或NPU高性能编程技术为模型训练或推理加速,例如:CUDA、CUDNN、CUTLASS、Triton等; 4、熟练使用开源推理加速工具为模型加速,例如:TensorRT-LLM、vLLM、TVM、torch.compile等,并深入理解背后原理; 5、具备以下一个或多个能力者优先: 1)具有数据处理相关经验,熟悉图像或视频数据处理方法,了解CV、VLM和Diffusion Model相关算法; 2) 熟悉大数据分布式处理框架Spark、Flink、Hadoop、Ray者优先; 3)熟练使用DALI、OpenCV、FFmpeg等图像处理工具。
-
职位职责: 1、核心研发工作: 1)负责集合通信库(CCL)设计、开发与优化,支持多卡/多机场景下的高性能通信; 2)基于RDMA和Scale-up等互联技术,研发高速通信库及相关工具; 3)探索通信与计算的协同优化,设计通信算子与计算算子的融合方案; 2、性能优化与问题解决: 1)分析并优化AI集群中单机内/多机间的集合通信性能(如AllReduce、All2All等),突破软硬件性能瓶颈; 2)解决分布式训练/推理场景中的通信问题,适配复杂应用场景需求; 3)利用Triton等工具开发高性能通信计算融合算子,优化端到端通信延迟; 3、技术协作与生态建设: 1)与训练、推理、自研软硬件等团队协作,优化AI模型通信效率,支撑整体系统性能提升; 2)洞察集合通信技术趋势,推动自研通信库的架构演进与生态适配。 职位要求: 1、本科及以上,计算机、电子工程相关专业; 2、扎实的分布式系统知识,熟悉大规模AI集群架构、网络通信原理及RDMA技术; 3、熟悉常见集合通信算法(如Ring、Tree、Halving-Doubling),了解集合通信库(NCCL等)实现原理; 4、具备复杂问题分析能力,能独立完成性能调优与故障排查。
-
岗位职责: 1.研究并跟踪隐私计算技术发展前沿,研发隐私计算平台并在集团应用场景落地; 2.分析业务需求,理解业务场景,设计满足业务需求的隐私计算解决方案; 3.负责隐私计算方案的关键技术研发、隐私计算平台开发以及工程化实现; 4.基于业务应用场景的隐私计算能力研发和落地,包括但不限于PIR、PSI、机器学习和深度学习等场景; 5.加密方案/加密算法的设计、安全性证明; 6.已有加密方案/加密算法的安全性评估。 任职要求: 1.密码学/数学或相关领域硕士或以上学历,5年以上工作经验,有2年以上隐私计算工作经验,博士学历优先。 2.熟悉可搜索加密(SE)、TEE、MPC等隐私计算能力的实现,掌握同态加密、不经意传输、零知识证明等隐私计算基础知识。 3.有实际从事或完整参与过隐私保护计算领域项目经验,具备产业化实践经验者优先。 4.熟悉深度学习框架,例如Tensorflow、Pytorch等。 5.具有良好的沟通、文档撰写以及团队协作能力,能够快速学习新的技术,对新技术有很强的敏锐度和洞察力。
-
工作职责: 1、负责贝壳Hermes实时计算平台的开发和维护 2、参与Flink等实时技术调研及框架源码改造开发 岗位要求: 1、熟悉JAVA体系架构,熟悉常见数据结构、多线程并发、JVM等,精通spring、spring boot、MyBatis等主流的开源框架 2、熟悉MySQL、Redis等数据库技术 ,Http等常见网络协议 ; 3、熟悉Hadoop生态圈技术,包括HDFS、MapReduce、HBase、Hive、Zookeeper等,熟悉主流实时处理技术,如Spark、Flink、kafka、pulsar,提交社区patch者优先 4、良好的思维习惯及沟通能力,具有较强的主动意识,乐于接受挑战 5、具有较强的学习能力和问题解决能力
-
工作职责 1、负责平安云计算产品的架构设计和落地工作,协助技术架构团队管理; 2、负责裸金属、虚拟化、容器云原生领域的前沿技术跟踪与应用,架构演进,支撑业务中长期发展; 3、能主导计算领域重大创新项目的统筹,推进客户解决方案落地; 4、解决计算领域疑难技术运维问题,提升系统性能及稳定性。 任职要求 【必须条件】 1、本科及以上学历,计算机相关专业;8年以上云计算相关经验; 2、精通云原生核心技术原理,如容器运行时,Kubernetes,operator,容器网络,容器存储等核心机制; 3、具备云计算虚拟化(必须),网络(熟练),中间件(加分项),安全(加分项),大数据(加分项)等领域的5年以上研发或架构经历; 4、有Golang代码检视能力,精通优先; 5、精通GPU智算平台相关技术,如:Gang 调度、PipeLine调度、RDMA, CUDA, RoCE,NCCL等,具有昇腾等信创平台研发经验者优先; 6、有云计算研发或架构领域重大项目实施经验; 【加分条件】 1、精通容器CNI、原理;精通网络相关数据面技术原理,具有独立研发CNI组件经验者优先; 2、精通容器CRI、NRI技术原理;熟悉主流容器运行时Docker,containerd,runc,kata等,具有独立研发CRI运行时能力; 3、精通容器CSI技术原理,精通主流分布式存储、本地存储等原理与机制,有存储研发经验者优先; 4、熟悉混部相关技术优先,如:koordinator, Caelus,及相关资源。
-
岗位职责: 1、根据客户的需求和业务场景,提出合适的云计算架构方案。有云计算项目的实践经验,包括云架构设计、云平台选择、部署和配置、性能优化等方面。熟悉腾讯云、阿里云和红帽的OpenShift等各种云服务和解决方案,能够根据客户需求提供技术咨询和支持; 2、需要向用户提供容器技术支持,包括帮助用户安装、配置和使用容器服务,以及回答用户的技术咨询和问题; 3、在云平台上部署、配置和管理应用程序和服务,确保云平台能够正常运行。同时需要对云环境进行监测和维护,确保其高可用性和可靠性,并及时处理云服务的故障。 任职要求: 1、对云计算架构设计原则有深入的理解,包括弹性伸缩、高可用性、容灾备份、安全性等方面; 2、具备容器化应用程序的开发和部署经验,熟悉容器编排工具Kubernetes,并能够设计和管理容器化环境,熟练掌握kubernetes、docker的常用操作,对容器的网络、安全、存储、中间件、数据库等方向有深入的理解; 3、具备VMware虚拟化技术的实践经验,包括虚拟机的创建、配置和管理,以及虚拟网络和存储的设置。熟悉VCENTER 6.0 7.0 8.0 各个版本使用,ESXI主机的安装,以及虚拟网络规划,有独自实施和解决用户故障的能力; 4、熟悉华为、联想、浪潮等厂商的服务器和存储产品,了解其硬件架构和性能特性。熟悉各种系统设备的安装和配置,对问题处理有一定的经验; 5、熟悉至少一门脚本语言(shell/python均可),具备底层脚本开发能力,具备编写和维护相关脚本和工具的能力; 6、具备良好的团队合作精神,能够与销售团队和技术团队紧密合作,共同完成项目。愿意分享知识和经验,帮助团队成员提升技术水平。
-
工作职责 1.负责云平台计算和虚拟化集群的稳定性维护; 2.负责解决客户云主机,云备份等计算产品的售后问题,对故障定位持续进行改进和优化; 3.负责支撑云计算底座产品的迭代和演进,提高迭代和演进的效率和稳定性; 4.负责和指导开发自动化运维工具,不断研发与探索运维自动化及各类创新途径,缩短运维响应时间,降低运维成本; 5.负责客户侧上云用云方案支持工作。 技能要求 1.熟悉TCP/IP的基本原理和实际应用,精通linux操作系统,网络相关协议栈; 2.精通虚拟化相关技术,如vmware,kvm,docker,containerd等; 3.熟悉常见监控工具,如Prometheus、Grafana、ELK等; 4.至少掌握一门语言,python,go,shell优先; 5.熟悉常用linux服务,包括但不限于iptables,nginx,keepalived,lvs,等。 6.具备openstack、kubernetes等集群管理经验,具备中大规模(500+服务器)公有云或者私有云集群维护经验者优先。 任职要求 1.计算机相关专业优先; 2.具备5年以上云计算相关工作经历,有大型互联网企业云计算架构设计及维护经验者优先; 3.具备良好的学习能力及抗压能力; 4.有较强的团队意识及沟通能力。
-
职责描述 1.负责Openstack、K8S云平台的规划设计、离线部署、系统优化和疑难问题解决; 2.负责Openstack、K8S平台基于国产硬件、软件环境的测试验证工作 3.负责云平台上承载业务系统的迁移部署实施工作; 4.负责工作中的方案、测试报告、汇报材料编写。 职位要求: 1.精通Linux系统,至少擅长一门编程语言,Python最佳 2.精通Openstack技术,需要有从0到1的设计规划与搭建经验,生产运维经验; 3.精通虚拟化,包括VMware/KVM等,熟悉Qemu/Libvirt架构 4.精通K8S与Docker容器技术,有实际环境搭建与运维经验; 5.熟悉分布式存储技术,需要有从0到1的设计规划与搭建经验,生产运维经验; 6.有OpenStack二次开发经验者优先; 具备较强的学习能力、逻辑思维能力,工作态度严谨负责,具备良好的文字功底
-
1、 有效处理客户以及平台故障,保证系统7*24稳定运行; 2、 负责运维知识库建立,并及时进行知识库更新; 3、 负责云资源池验收及产品验收,可协助客户解决相关云产品使用问题; 4、 负责资源池业务监控及服务巡检,及时跟进及解决相关问题。 5、参与运维工具体系的规划建设,包括需求调研、方案设计、产品实施 6、参与运维工具体系相关标准、规范制定 1、 深入理解Linux、windows操作系统、体系结构,可熟练使用Shell/Perl/Python等语言中的一种或多种; 2、 熟悉OpenStack核心组件,如nova, cinder , glance, neutron, keystone等; 3、 熟悉基本网络知识,具备hcnp或ccnp或等同经验者优先,具备云平台维护经验者优先; 4、 熟练掌握主流虚拟化技术,熟悉虚拟化各项功能原理,能够进行规划实施者优先; 5、 有相关云商维护工作经验者优先; 6、 对于K8s等容器类规模化集群有5年以上工作经验者优先 7、 有相关客户服务或客户支撑经验者优先; 8、 具有强烈的团队协作意识,高度的责任感,对工作积极严谨,勇于承担责任,逻辑思维能力强,有较强学习和创新能力; 9、 具有较强的抗压能力和执行力。
-
工作职责 1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向; 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力; 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险。 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验; 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断; 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理; 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先; 6、责任心强、良好的沟通能力、团队协作能力。
-
工作职责: 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发,大规模矩阵求解,优化问题等。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。 具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
-
工作职责: 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发,大规模矩阵求解,优化问题等。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。 具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
-
岗位职责 1.参与深度学习推理引擎持续迭代优化,编译优化和工程化 2.负责各种图像处理算法、数学运算在不同计算设备上的高性能实现 3.分析算法落地的性能瓶颈,设计合理且高效的优化方案,推动算法落地 任职需求 1.精通c/c++,精通算法与数据结构 2.熟悉计算机体系结构,具备良好的并行计算基础 3.熟悉至少一种深度学习推理框架或高性能计算库:NCNN、MNN、TNN、TensorRT、TFLite、BLAS、Eigen等 4.熟悉模型定点量化、稀疏化、裁剪、知识蒸馏、NAS等模型优化的优先 加分项 1.有NEON、SSE、AVX、GPU、NPU并行加速经验者优先 2.有高性能计算性能指标超越同类竞标对象优化经验优先 3.有深度学习编译器开发经验优先:TVM、XLA等