-
职位描述: 1. 分布式深度学习训练、推理系统核心技术研发; 2. 分布式系统优化,底层性能(GPU计算、存储、通信)优化; 4. 深度学习框架、超大规模分布式训练、推理等前沿问题的探索与研究,实现技术创新与突破。 职位要求: 推理优化或者分布式训练相关人选,精通CUDA开发
-
职位描述: 1. 分布式深度学习训练、推理系统核心技术研发; 2. 分布式系统优化,底层性能(GPU计算、存储、通信)优化; 4. 深度学习框架、超大规模分布式训练、推理等前沿问题的探索与研究,实现技术创新与突破。 职位要求: 推理优化或者分布式训练相关人选,精通CUDA的优先
-
1. 面向不同的应用场景开发高性能 CUDA 程序 2. 和编译器团队紧密配合,针对硬件体系结构对算法进行分析,设 计,和优化 3. 对现有 CUDA 程序进行改写和适配 岗位要求: 1. 计算机/电子工程/数学/物理,本科及以上学历 2. 精通数据级并行程序设计和 GPGPU 编程,例如 CUDA、OpenCL 3. 精通 C/C++代码的编译、调试、分析和性能优化流程 4. 熟悉计算机体系结构,具有并行算法编程,调试,与优化经验
-
负责视频处理算法以及编码解码在公有云,私有云以及服务器上的并行化开发和部署。 2. 具体工作内容包含但不限于以下内容: 1)把单线程的算法模型改为多线程软件,提高实时性并且充分利用CPU资源, 2)使用OpenGL/OpenCL/汇编等方法充分利用服务器的计算能力, 3)利用公司现有服务器通过Docker,Openstack等方式部署视频处理软件, 4)利用API或者SDK在公有云上开发和部署视频运用。 任职要求 1. 在并行计算相关领域有丰富的工作经验: 1)多线程编程 2)多进程编程 3)OpenGL, OpenCL,Intel汇编
-
工作职责 1.机器学习平台计算集群资源管理与调度优化 2.在GPU上完成超大规模模型并行训练方案设计与开发 3.配合算法团队提升深度学习模型训练效率与质量 职位要求 1.计算机相关专业本科以上学历,有扎实的计算机系统和算法基础 2.熟练使用C/C++/python,熟悉linux开发环境 3.熟悉深度学习算法原理,有算法工作相关经验优先 4.熟悉hadoop、spark等开源计算框架,
-
职位职责: 团队介绍:Ads Infra(广告系统架构)是负责建设字节跳动中国区广告业务架构与基础架构的中台团队。Ads Infra的工作职责包括:负责字节跳动中国区的广告投放系统、广告算法服务和深度学习能力的架构设计与实现;负责抖音、今日头条等各端上的广告业务中台系统研发;负责构建高并发、高性能、高可用的服务框架,设计和研发多数据中心的广告系统架构。我们一端链接广告主的海量营销需求,一端承载字节跳动中国区产品、媒体合作伙伴的海量流量,依托可靠的计算广告技术和深度学习能力,精准匹配广告与用户需求,让营销更高效、更智能、更可持续。 1、针对广告/推荐/搜索等场景,优化模型训练/推理的计算图执行效率; 2、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能训推引擎; 3、设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,以充分利用GPU/NPU的并行计算能力,支持各种机器学习和深度学习模型的构建和部署; 4、负责机器学习系统前瞻技术的调研和引入,例如最新硬件架构、异构计算系统、GPU优化技术、编译优化技术的引入和落地。 职位要求: 1、本科及以上学历,计算机、软件工程等相关专业,具备扎实的计算机基础; 2、熟悉Linux操作系统和开发环境,熟练掌握C/C++/Python等一种或多种编程语言并深入了解语言特性,具备良好的数据结构、算法基础和系统设计能力; 3、拥有强烈的求知欲、优秀的学习和沟通能力; 4、熟悉至少一种机器学习框架(PyTorch/TensorFlow/PaddlePaddle或其他自研框架),熟练掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护。 加分项: 1、熟悉主流高性能并行编程技术,有GPU编程经验(CUDA或Triton); 2、有TensorRT/Cutlass开发经验,熟悉TRT-LLM、VLLM等推理框架; 3、熟悉开源ML编译器代码(XLA/MLIR/TVM)并有相关开发经验; 4、熟悉PyTorch、FSDP、DeepSpeed、Megatron等业界主流分布框架的使用和原理。
-
职位职责: 团队介绍:我们是「豆包视频生成模型-PixelDance」团队,我们专注于开发视频生成模型,解决视频生成的关键问题,包括但不限于高动态性视频生成、内容一致性保障。构建行业领先的视频基础模型,引领技术的未来潮流。视频生成工程团队的工作涉及到模型生产的全周期流程,在这里,你有机会参与到模型的数据生产、训练加速、推理加速、服务部署的每个环节。同时你将接触到最先进的视频生成技术、海量的数据、大规模的集群,我们期待你能够和我们的模型一同Scale UP。 1、负责LLM和Diffusion Model的性能优化; 2、通过TensorRT、量化、剪枝、算子融合、CUDA算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 3、负责ByteDance Research推理优化技术的调研和引入; 4、与算法部门深度合作,进行算法与系统的联合优化。 职位要求: 1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 2、精通C/C++,精通算法与数据结构,熟悉Python; 3、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等; 4、具备丰富的基于CUDA的GPU性能优化经验; 5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如Pytorch、Tensorflow; 6、熟悉TensorRT-LLM、ORCA、VLLM等;了解主流LLM 、Diffusion Model,有LLM 、Diffusion Model加速优化经验者优先。
-
一、公司简介 彩讯股份(创业板股票代码:300634)是一家软件互联网上市公司,是协同办公、 智慧渠道、云和大数据领域的龙头企业。拥有五地研发中心和遍布全国的运营网络,员工超过 3000 人。 公司坚持“以大场景运营效果为导向,全面数字化、智能化”的发展战略,持续加大在人工智能等领域的投入,将成为中国领先的智能数字化企业。 二、项目介绍: AI信创中心介绍: 彩讯股份“AI信创中心”是公司为抢占人工智能技术先机而成立的核心研发机构,是直接向CEO汇报的一级部门。中心汇集公司在人工智能、机器学习、知识图谱、自然语言处理等方面的人才,致力于将人工智能技术应用于公司各业务领域,实现产品、服务的智能化升级。 中心遵循“技术引领,应用驱动,市场导向”的发展策略,通过技术研究来挖掘人工智能的应用潜力,并在公司主营业务中进行示范与落地。 中心重点开展的技术和应用研究包括: 1)基于Transformer与BERT的对话系统与推荐系统。运用预训练语言模型与迁移学习技术,快速实现对话与推荐能力。 2)基于RL的智能决策与智能优化。研发强化学习技术在复杂决策环境中的应用,实现自动化智能决策。 3) 基于CVAE与StyleGAN等技术的智能创意与个性化推荐。生成图像、音乐、文本等创意素材,为个性化推荐提供丰富素材。 4)基于GAN与变分自编码器的客户画像与精准营销。利用生成对抗网络等算法,构建真实全面的数据与客户画像。 中心的研发重点在于企业级AI中间件与行业应用的研发,而非特定的机器学习模型。 中心的职责还包括: 1) 与高校、行业合作伙伴共建AI创新联合实验室,拓展产学研合作。 2) 发展与人工智能产业链上下游的合作伙伴关系,拓展公司的产业影响力。 3) 引领全公司各业务部门的产品与业务智能化转型升级。 4) 人工智能核心技术与产品的研发,不断提高公司的AI能力与实力。 中心将持续投入人工智能前沿技术与产品创新,以人工智能驱动公司各业务向智能化、个性化转型,实现产品服务的差异化和融合创新,为客户提供增强的体验与价值。中心必将成为公司实现产业升级与转型的核心动力之 三、岗位介绍: 【岗位职责】: 1、开源LLM的能力接入与部署; 2、负责LLM训练,模型微调; 3、SFT、RM、PPO等算法研究与优化; 4、负责前沿技术探索和落地。 【岗位要求】: 1.人工智能、计算机、数学/统计学等相关专业硕士及以上学历; 2.熟悉AI领域的前沿研究,具有丰富的研究经验,具备百亿级以上LLM 训练经验优先; 3.了解并行计算、CUDA、网络通信、系统优化、集群硬件架构等 HPC 相关的知识; 4.具有Prompt设计与微调经验优先; 5.熟悉SFT、RM、PPO原理,有实际实践经验者优先; 6.熟悉主流深度学习工具Pytorch,TensorFlow等; 7.具备良好的编程能力,熟练掌握 Python,数据结构和算法设计,熟悉 Linux / Unix 系统和 Shell 编程,熟练使用 Git; 8.在AI开源社区有贡献者优先; 9.在AI领域的核心期刊发表过论文优先; 10.有 TVM、TensorRT 等推理平台优化经验者优先; 11.了解并行推理技术的优先。 四、薪酬福利与职业发展: 我们提供竞争力的薪资待遇和福利待遇,包括期权激励、五险一金、带薪年假、节假日福利、健康体检、培训及晋升机会等。 同时,我们还为员工提供广阔的职业发展空间,鼓励员工在工作中不断成长和进步。 我们的团队充满活力、激情和创新精神,致力于打造一个开放包容、信任互助的工作环境,并定期举行各种团队建设活动,增强彼此之间的沟通和理解。 期待您的加入,一起探索未来无限可能!想更多了解彩讯股份,欢迎进入:https://www.richinfo.cn
-
职位描述 1、负责贝壳一站式机器学习平台的设计研发与迭代改进,为业务提供稳定易用、高性能、高性价比的解决方案; 2、业内机器学习系统与平台前沿技术进展跟进与调研、落地; 3、参与模型训练,模型服务,模型管理,资源调度等机器学习相关问题的开发。 任职要求 1、计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种; 2、参与过大规模分布式系统的开发和维护; 3、良好的沟通能力和团队协作精神,严谨的工作态度与高质量意识 ; 4、善于学习新的知识,动手能力强,有进取心。 加分项: 1、有CUDA C/C++编程经验,有GPU并行计算编程基础(NCCL)经验优先; 2、了解分布式系统、容器相关领域技术,熟悉Kubernetes/docker等优先; 3、熟悉机器学习框架(Tensorflow/Pytorch/Jax)优先。
-
工作职责: 1. 参与公司高性能计算平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 开发公司高频策略所需的高性能回测系统。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
-
岗位职责: 1.负责腾讯音乐集团相关产品推荐算法的设计实现与优化; 2.负责完善现有推荐系统的基础算法及并行计算框架; 3.负责音乐平台业务的基于用户/音乐特性的数据挖掘及推荐策略设计实现; 4.负责能够根据业务数据变化不断设计并调整算法策略来提升算法质量,并最终提升用户体验。 岗位要求: 1.硕士及以上学历; 2.计算机,统计,信息,数学等相关专业毕业优先; 3.扎实可靠的编程能力,精通C/C++/GO至少一门编程语言; 4.熟悉业内推荐算法及数据挖掘领域的技术热点和进展,对互联网在线音乐的推荐系统架构设计有深入了解; 5.了解Hadoop/Spark生态相关技术优先; 6.具备规模分布式数据存储与计算开发经验者优先; 7.沟通能力佳,表达能力出众者,音乐爱好者优先。
-
岗位要求: 1、具备本科及以上学历,计算机、数学等相关专业,5年以上工作经验; 2、熟悉Python,熟悉Linux; 3、熟悉cuda编程,国产化gpu硬件使用的优先; 4、精通Pytorch等主流框架; 5、熟悉nlp自然语言处理技术; 6、了解Transformer架构的大语言模型的模型结构和训练方法,有大语言模型的微调经验; 7、具备良好的学习能力、良好的沟通能力、团队协作能力; 8、***本科学历毕业5年以上,计算机相关专业,学信网可以查。(学历为硬性条件)
-
岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3、负责LLM/多模态模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 4、负责扩散模型的端到端部署和AI绘图的高并发服务流程设计,包括但不限于核心算子/采样器优化、模型优化和压缩、服务流程优化。 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率。 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身。 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验。 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。 6、熟悉LLM/多模态相关的算法技术以及推理加速方法。 7、有团队管理经验者优先。 8、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
工作职责: 1.负责搜狐视频广告引擎系统的架构设计和系统研发工作,支撑天级数亿的广告请求; 2.负责搜狐视频广告交易平台的架构设计和开发维护工作; 3.持续优化现有系统,提高系统稳定性和性能,更好的支持广告投放业务; 任职要求: 1.**本科及以上学历,5年以上广告系统开发经验,对计算广告行业有兴趣,有团队管理经验优先; 2.熟悉C/C++,至少5年以上C/C++开发经验,熟悉openresty者更佳; 3.具备良好的分析解决问题能力,能独立承担工作任务及把控任务进度; 4.熟悉网络编程,多线程编程技术,有大规模系统的设计和开发经验。 5.有广告架构,搜索架构的相关开发经验优先。具有并行计算开发经验的优先考虑,参与大规模开源项目优先; 6.有良好的学习能力和团队协作精神,在技术方向有钻研精神,善于分享。工作积极有责任,认同企业文化,愿意拼搏努力。
-
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1、参与端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。