-
职位描述 1. 配合算法研究员完成算法的落地与部署工作,并在代码与指令集层面优化算法运行效率。 2. 设计基于GPU的高性能算法基础库,支持下游各个算法研发。 职位要求 1、熟悉CUDA工作原理,能独立完成代码热点分析并制定优化方案。 2、良好的编程能力,熟悉python, c++,掌握常见的算法和数据结构知识; 3、良好的工程能力,有较强的的代码结构设计能力,熟练使用git、ssh,cmake等工具。 加分项 1、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
-
工作职责: 1. 参与公司高性能计算平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 开发公司高频策略所需的高性能回测系统。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
-
云计算高级专家岗位要求 1.本科及以上学历,计算机相关专业,年龄40周岁及以下,有自驱力,敢于突破。 2.具有云计算相关的高级认证资格(如AWS、阿里云、华为云、天翼云专业级认证等),熟练掌握多种云计算平台的架构和操作,熟悉云计算技术的最新发展趋势,具有丰富的架构设计和方案实施经验。 3.具有10年以上相关工作经验,熟悉云计算架构、服务器、存储、网络、安全、虚拟化、分布式等技术,熟练掌握多种编程语言,具有大规模虚拟化、容器化部署和大型项目实战经验。 4.具有较强的团队管理、业务理解和沟通能力,能够快速识别并解决系统故障和性能问题,提出创新的解决方案,能够与业务部门紧密合作,理解业务需求并提供解决方案,带领团队完成云计算相关项目和任务。
-
职位职责: 1、提供云产品用户技术支持服务; 2、制作云产品的例行培训课程及用户手册; 3、提升云产品口碑及例行NPS调研及产品优化; 4、负责建设技术运营体系流程和提升运作运作指标,提升技术运营处理效率; 5、帮助产品和研发团队过滤产品相关的技术问题,追踪产品体验缺陷的问题解决; 6、参与云产品规划讨论,与产品、研发、解决方案一同,将优秀的产品推向业务和市场。 职位要求: 1、本科及以上学历,有云产品相关经验优先,有技术支撑工作经验优先; 2、具备出色的快速学习和沟通协调能力,耐心、谦逊、有优秀的服务意识,拥有强烈的责任心和团队合作精神; 3、有消息队列相关产品技术支持经验优先,包括RMQ、Kafka等; 4、有Android/iOS/Web/Server端测试经验,或对应测试平台技术支持经验优先; 5、有代码阅读和编写能力的优先,包括Golang、Python、Java等; 6、英语优秀者优先。
-
岗位职责: 1.服务定价管理:辅助技术团队完成基础设施(计算应用、大数据、存储、数据库等方向)成本定价工作,包括制定成本定价模型、成本参数更新、产品成本价输出并提供成本优化方案; 2.账单系统设计与运营:负责内部业务基础资源使用和结算相关工作,包括内部业务结算的账单与计费系统设计与迭代,数据的录入与更新,计费逻辑公示与澄清等; 3.成本精细化运营:构建基础设施资源从“预算-采购-申领-交付-账单-成本优化”的完整管理链路,实践FinOps,内容包括成本优化虚拟团队的组织与运营,成本使用健康度评估模型的搭建与推广,成本优化辅助工具的设计与使用,成本优化方向和举措的洞察与规划等,以推动成本优化目标的达成; 4.成本分析:定期产出多维度数据分析报告,以协助财务与经营管理者能看清数据并辅助决策。 岗位要求: 1.本科及以上学历(优先),5年以上工作经验,有云计算、FinOps经验更佳; 2.优秀的数据洞察力与数据处理能力,实现多维度数据分析和逻辑设计; 3.优秀的逻辑性和结构性思维,可从全局视角和用户视角把控账单系统设计与迭代方向; 4.熟悉产品常用工具,掌握SQL等数据处理语言; 5.有较强的沟通协调能力、学习能力、抗压能力及多任务处理能力,工作有责任心、性格开朗、积极主动、有自驱力,具有良好的服务精神和团队合作能力。
-
岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3、负责LLM/多模态模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 4、负责扩散模型的端到端部署和AI绘图的高并发服务流程设计,包括但不限于核心算子/采样器优化、模型优化和压缩、服务流程优化。 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率。 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身。 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验。 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。 6、熟悉LLM/多模态相关的算法技术以及推理加速方法。 7、有团队管理经验者优先。 8、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
工作职责: 1、负责贝壳Hermes实时计算平台的开发和维护 2、参与Flink等实时技术调研及框架源码改造开发 岗位要求: 1、熟悉JAVA体系架构,熟悉常见数据结构、多线程并发、JVM等,精通spring、spring boot、MyBatis等主流的开源框架 2、熟悉MySQL、Redis等数据库技术 ,Http等常见网络协议 ; 3、熟悉Hadoop生态圈技术,包括HDFS、MapReduce、HBase、Hive、Zookeeper等,熟悉主流实时处理技术,如Spark、Flink、kafka、pulsar,提交社区patch者优先 4、良好的思维习惯及沟通能力,具有较强的主动意识,乐于接受挑战 5、具有较强的学习能力和问题解决能力
-
职位职责: 团队介绍:我们是「豆包视频生成模型-PixelDance」团队,我们专注于开发视频生成模型,解决视频生成的关键问题,包括但不限于高动态性视频生成、内容一致性保障。构建行业领先的视频基础模型,引领技术的未来潮流。视频生成工程团队的工作涉及到模型生产的全周期流程,在这里,你有机会参与到模型的数据生产、训练加速、推理加速、服务部署的每个环节。同时你将接触到最先进的视频生成技术、海量的数据、大规模的集群,我们期待你能够和我们的模型一同Scale UP。 1、视频处理端到端性能优化:负责视频数据处理的性能提升,包括但不限于视频编解码优化、蒸馏、量化、Kernel优化;对异构资源进行合理分配和优化,充分利用各类硬件资源提升视频数据处理能力,提高资源利用率以应对海量视频数据的挑战; 2、数据层处理平台化建设:参与视频数据处理平台的设计与建设,制定平台的技术架构和发展规划;持续优化平台功能,确保平台的稳定性、可靠性和可扩展性,满足不断增长的业务需求; 3、视频数据生产管理:统筹视频数据的采集、整理、存储等生产环节,建立高效的数据生产流程;确保视频数据的质量和准确性,对数据进行严格的审核和校验; 4、算法优化与创新:不断探索和研究新的视频数据处理算法和技术,对现有算法进行优化和改进;结合人工智能、机器学习等先进技术,提升视频数据的分析和处理能力,为业务提供更有价值的洞察。 职位要求: 1、计算机及相关专业,本科及以上学历,良好的沟通和团队协作能力; 2、精通Python或Golang等至少一种编程语言; 3、熟练使用GPU或NPU高性能编程技术为模型训练或推理加速,例如:CUDA、CUDNN、CUTLASS、Triton等; 4、熟练使用开源推理加速工具为模型加速,例如:TensorRT-LLM、vLLM、TVM、torch.compile等,并深入理解背后原理; 5、具备以下一个或多个能力者优先: 1)具有数据处理相关经验,熟悉图像或视频数据处理方法,了解CV、VLM和Diffusion Model相关算法; 2) 熟悉大数据分布式处理框架Spark、Flink、Hadoop、Ray者优先; 3)熟练使用DALI、OpenCV、FFmpeg等图像处理工具。
-
岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等; 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度; 3、负责LLM/多模态模型的端到端部署和流程优化,探索包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等; 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率; 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身; 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验,熟悉CUDA、Triton等算子编写的相关技术; 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化; 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化,熟悉计算机体系结构基础知识,有扎实高性能计算(GPU/x86/ARM等)、或推理框架及AI编译(TRT/TVM等)、或模型算法优化(量化/稀疏等)方面的经验; 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。熟悉常见GPU服务部署框架和服务部署流程,如Triton等,能够实现动态批处理和GPU服务调度,熟悉K8S上GPU的调度和隔离方案,熟悉Docker; 6、熟悉LLM/多模态相关的算法技术以及推理加速方法,具有LLM训练及开发经验,如大模型数据处理、模型微调、预训练、强化学习等,了解TRT-LLM,deepspeed,VLLM等训练或推理加速框架; 7、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
工作职责 1.负责云平台计算和虚拟化集群的稳定性维护; 2.负责解决客户云主机,云备份等计算产品的售后问题,对故障定位持续进行改进和优化; 3.负责支撑云计算底座产品的迭代和演进,提高迭代和演进的效率和稳定性; 4.负责和指导开发自动化运维工具,不断研发与探索运维自动化及各类创新途径,缩短运维响应时间,降低运维成本; 5.负责客户侧上云用云方案支持工作。 技能要求 1.熟悉TCP/IP的基本原理和实际应用,精通linux操作系统,网络相关协议栈; 2.精通虚拟化相关技术,如vmware,kvm,docker,containerd等; 3.熟悉常见监控工具,如Prometheus、Grafana、ELK等; 4.至少掌握一门语言,python,go,shell优先; 5.熟悉常用linux服务,包括但不限于iptables,nginx,keepalived,lvs,等。 6.具备openstack、kubernetes等集群管理经验,具备中大规模(500+服务器)公有云或者私有云集群维护经验者优先。 任职要求 1.计算机相关专业优先; 2.具备5年以上云计算相关工作经历,有大型互联网企业云计算架构设计及维护经验者优先; 3.具备良好的学习能力及抗压能力; 4.有较强的团队意识及沟通能力。
-
工作职责: 1. 运用各种销售工具开发新客户,销售公司全系列产品,为客户制定切实可行的产品方案; 2. 负责与客户,合作伙伴以及甲方客户建立长期而稳定的合作关系; 3. 负责客户的定期拜访,沟通,进行客户关系的维护和进一步开发; 4. 收集分析对应行业信息,及时提交各类报表,材料; 岗位要求 1、本科及以上学历、计算机类、市场营销、软件等相关理工类专业,有计算机系统结构、网络、应用软件的基本知识; 2、三年及以上云算力销售经验优先; 3、有较强的自学能力和市场开拓能力、有较强的团队协作以上和执行力; 4、责任心强,抗压能力强,有亲和力,善于把握人际关系;
-
岗位职责 1、参与云服务的核心组件的开发和设计,提升服务易用性和性能 2、参与传输以及通信协议的开发和性能优化 岗位要求 1、熟练使用Java/Python/Go/C/C++语言的一种或多种进行开发,熟悉该语言的基础框架和原理; 2、有分布式系统设计开发经验,熟练掌握并发编程调试、缓存、消息中间件等机制; 3、熟练掌握数据分析方法和使用数据分析工具优先
-
岗位职责: 1、负责深度学习、计算机视觉和视频分析的算法研发应用以及性能优化,包括但不限于目标检测、图像分类、行为分析、追踪与识别等; 2、负责⼯程项⽬的算法和软件的开发⼯作,结合具体⼯业应⽤场景实现算法的落地; 3、制定并实施训练数据集的采集、标注计划,模型的训练、验证以及部署模型的转换 4、负责相关算法的核心代码实现,优化模型和算法,与服务器后端工程师协调工作。 任职要求: 1、熟悉图像处理、模式识别算法,熟悉GPU、OpenCV等图像处理平台; 2、熟悉深度学习主流框架,熟练应用PyTorch或tensorFlow等至少一种框架,具备相关算法开发与应用经验; 3、熟悉图像分类、⽬标检测、分割等常⻅深度学习算法,熟悉边缘检测、特征提取等传统图像算法; 4、熟悉多⽬视觉、三维重建、视觉测量等 5、有运动视觉开发经验的优先
-
业务方向介绍:百舸异构计算平台是面向大规模深度学习的高性能云原生AI计算平台,为模型算法专家和运维专家提供全面的集群运维支持和任务全生命周期管理,同时具备训练/推理加速、故障容错、智能故障诊断等高级功能,有效训练时长可达98%以上,大幅提升算力使用效率,助力企业在大模型时代的业务转型 工作职责: -负责百度AI计算集群网络性能相关的诊断与优化 -负责百度AI计算集群通信库研发与运维部署 -负责百度AI计算中训练、推理依赖的通信加速 -负责百度AI计算集群与通信关联的其他软件研发工作 任职资格: -熟悉AI计算基本模式与集群设计构建 -了解流行的AI训推框架(如Megatron、vLLM等) -熟悉RDMA等高性能网络技术和NCCL等集合通信库 -有集群管理、运维等相关的研发经验
-
【岗位职责】 1. 负责华为云HCS面向B端政企客户的场景化解决方案规划,设计,开发。包括:政府、交通、金融、安平、能源电力、大企业等行业场景,输出大数据/AI/大模型场景化解决方案,提升HCS场景化解决方案竞争力; 2. 支撑B端客户重大项目拓展,深入客户现场,与周边团队及生态伙伴协同,基于客户需求提供云平台解决方案,孵化行业新场景,确保项目成功。 【岗位要求】 1. 计算机、通信、控制工程、电子信息、数学、信息管理等理工科专业背景; 2. 有过C/C++/Java/C#/Python/Go/PHP等开发经验者优先; 3. 了解云计算、大数据、微服务、AI、安全等云计算知识优先; 4. 有业内主流云厂商开发类岗位、解决方案类岗位实习经验者优先;