-
职位职责: 团队介绍:Ads Infra(广告系统架构)是负责建设字节跳动中国区广告业务架构与基础架构的中台团队。Ads Infra的工作职责包括:负责字节跳动中国区的广告投放系统、广告算法服务和深度学习能力的架构设计与实现;负责抖音、今日头条等各端上的广告业务中台系统研发;负责构建高并发、高性能、高可用的服务框架,设计和研发多数据中心的广告系统架构。我们一端链接广告主的海量营销需求,一端承载字节跳动中国区产品、媒体合作伙伴的海量流量,依托可靠的计算广告技术和深度学习能力,精准匹配广告与用户需求,让营销更高效、更智能、更可持续。 1、针对广告/推荐/搜索等场景,优化模型训练/推理的计算图执行效率; 2、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能训推引擎; 3、设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,以充分利用GPU/NPU的并行计算能力,支持各种机器学习和深度学习模型的构建和部署; 4、负责机器学习系统前瞻技术的调研和引入,例如最新硬件架构、异构计算系统、GPU优化技术、编译优化技术的引入和落地。 职位要求: 1、本科及以上学历,计算机、软件工程等相关专业,具备扎实的计算机基础; 2、熟悉Linux操作系统和开发环境,熟练掌握C/C++/Python等一种或多种编程语言并深入了解语言特性,具备良好的数据结构、算法基础和系统设计能力; 3、拥有强烈的求知欲、优秀的学习和沟通能力; 4、熟悉至少一种机器学习框架(PyTorch/TensorFlow/PaddlePaddle或其他自研框架),熟练掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护。 加分项: 1、熟悉主流高性能并行编程技术,有GPU编程经验(CUDA或Triton); 2、有TensorRT/Cutlass开发经验,熟悉TRT-LLM、VLLM等推理框架; 3、熟悉开源ML编译器代码(XLA/MLIR/TVM)并有相关开发经验; 4、熟悉PyTorch、FSDP、DeepSpeed、Megatron等业界主流分布框架的使用和原理。
-
职位职责: 1、支持火山方舟业务需求,分析和优化业务Badcase,与多方角色协同推进项目落地; 2、进行市场调研,梳理C端和B端的客户需求,分析市场空间,给出通用的解决方案,同时定义模型理想态; 3、协助构建模型评测,分析和定位模型能力缺陷,主导数据生产,与算法和数据团队合作推进模型迭代; 4、熟练掌握PE技巧,对一线销售和售前团队进行产品的赋能和技术支持。 职位要求: 1、本科及以上学历,2年及以上产品经理相关工作经验,计算机相关专业优先; 2、较强的分析和沟通能力,对数据敏感,擅长从数据中发现关键问题以及给出有价值的建议,并能推动落地; 3、对大语言模型领域感兴趣,有热情有激情,愿意投身于大语言模型/AIGC等领域积极探索; 4、有很好的归纳总结以及文档能力,能快速理解业务的核心需求,并进行归纳总结和知识沉淀,同时有较强的项目管理能力和多团队协同能力; 5、熟悉海内外大模型服务、AI Native产品优先,AI算法相关领域技术背景、评估和数据分析背景等工作经验的优先。
-
工作职责: 1. 参与公司高性能计算平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 开发公司高频策略所需的高性能回测系统。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
-
岗位职责: 1、负责物联网边缘计算产品的市场趋势分析、竞品分析、客户需求调研,产品规划和产品验证,能够和业务一起为产品线的市场表现负责; 2、协同市场和业务团队,定期做行业动态监测和分析,形成前瞻性的产品规划; 3、基于目标市场、目标客户的需求定义,提炼产品规划,负责撰写产品PRD、产品发布、退市等产品全生命周期管理; 4、具备边缘计算产品的规划设计落地能力,对云原生,AIOT及云边协同有一定的产品规划设计经验,能够着手相关产品规划的设计落地。 任职要求: 1、本科及以上学历,机械类,电子类,软件类等相关专业毕业; 2、从事产品工作5年以上,3年以上边缘计算产品/AI/IoT/云计算工作经验,对分布式云边协同系统有全流程的深刻理解和技术积累,并且有多个百万级别以上出货产品市场成功经验; 3、有独立负责项目的规划设计能力和项目管理能力,对产品市场具有一定的敏锐度,能够把握相关技术的发展动向,并能够从客户和业务的角度来进行产品实现;独立负责过至少一款产品的商业化全过程; 4、有工业现场类产品、机器视觉、机器人,AIOT等软硬件从规划到量产全流程经历的优先考虑,熟悉IPD产品开发方式优先考虑; 5、有创新和创业精神,思维活跃并对新鲜事物有强烈的好奇心; 6、数据敏感,具备较强的数据分析能力,有行业洞察和市场分析能力。
-
岗位职责: 1.服务定价管理:辅助技术团队完成基础设施(计算应用、大数据、存储、数据库等方向)成本定价工作,包括制定成本定价模型、成本参数更新、产品成本价输出并提供成本优化方案; 2.账单系统设计与运营:负责内部业务基础资源使用和结算相关工作,包括内部业务结算的账单与计费系统设计与迭代,数据的录入与更新,计费逻辑公示与澄清等; 3.成本精细化运营:构建基础设施资源从“预算-采购-申领-交付-账单-成本优化”的完整管理链路,实践FinOps,内容包括成本优化虚拟团队的组织与运营,成本使用健康度评估模型的搭建与推广,成本优化辅助工具的设计与使用,成本优化方向和举措的洞察与规划等,以推动成本优化目标的达成; 4.成本分析:定期产出多维度数据分析报告,以协助财务与经营管理者能看清数据并辅助决策。 岗位要求: 1.本科及以上学历(优先),5年以上工作经验,有云计算、FinOps经验更佳; 2.优秀的数据洞察力与数据处理能力,实现多维度数据分析和逻辑设计; 3.优秀的逻辑性和结构性思维,可从全局视角和用户视角把控账单系统设计与迭代方向; 4.熟悉产品常用工具,掌握SQL等数据处理语言; 5.有较强的沟通协调能力、学习能力、抗压能力及多任务处理能力,工作有责任心、性格开朗、积极主动、有自驱力,具有良好的服务精神和团队合作能力。
-
岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3、负责LLM/多模态模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 4、负责扩散模型的端到端部署和AI绘图的高并发服务流程设计,包括但不限于核心算子/采样器优化、模型优化和压缩、服务流程优化。 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率。 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身。 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验。 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。 6、熟悉LLM/多模态相关的算法技术以及推理加速方法。 7、有团队管理经验者优先。 8、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
工作职责: 1. 使用大数据处理架构、机器学习模型进行海量数据挖掘,筛选高质量数据用于大语言模型训练; 2. 开发基于Hive、Spark、Slurm、K8s的大数据文本处理工具; 3. 负责大语言模型的量化,提升推理效率和稳定性。 任职资格: 1. 计算机、数学、统计、NLP等相关专业硕士及以上学历; 2. 有大数据处理、数据挖掘、NLP等相关项目两年以上工作经验; 3. 熟悉常用NLP算法,如GPT、BERT、FastText等; 4. 精通Linux、Hive、Spark、K8s,熟练使用Pytorch; 5. 具备扎实的专业基础和项目经验,良好的沟通能力和团队合作,认真负责、主动积极。
-
岗位职责: 1.研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF等技术; 2.研发多模态的大模型(LMM)预训练、SFT、 RLHF等技术; 3.研发基于大模型的ChatBot、检索增强、Code、Longchain等下游应用 岗位要求: 1.具有硕士/博士学位,专业背景包括自然语言处理、机器学习、数据挖掘、人工智能等相关领域。 2.熟练掌握深度学习框架如Tensorflow、Pytorch等,具备扎实的编程基础和独立的算法实现能力,熟悉langchain并具备相关项目经验者优先考虑。 3.具备大规模语言模型(LLM)的实操经验,有参与大型模型预训练、SFT、RLHF等项目的经验者优先。 4.深入研究和实践自然语言处理、文本生成等领域,并有相关经验。 5.具备良好的逻辑分析能力和数理基础,对算法原理及应用有深入理解。有较强的自学能力和解决问题的能力,对前沿创新技术有热衷钻研的态度。
-
岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等; 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度; 3、负责LLM/多模态模型的端到端部署和流程优化,探索包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等; 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率; 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身; 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验,熟悉CUDA、Triton等算子编写的相关技术; 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化; 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化,熟悉计算机体系结构基础知识,有扎实高性能计算(GPU/x86/ARM等)、或推理框架及AI编译(TRT/TVM等)、或模型算法优化(量化/稀疏等)方面的经验; 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。熟悉常见GPU服务部署框架和服务部署流程,如Triton等,能够实现动态批处理和GPU服务调度,熟悉K8S上GPU的调度和隔离方案,熟悉Docker; 6、熟悉LLM/多模态相关的算法技术以及推理加速方法,具有LLM训练及开发经验,如大模型数据处理、模型微调、预训练、强化学习等,了解TRT-LLM,deepspeed,VLLM等训练或推理加速框架; 7、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
岗位职责: 1、根据客户的需求和业务场景,提出合适的云计算架构方案。有云计算项目的实践经验,包括云架构设计、云平台选择、部署和配置、性能优化等方面。熟悉腾讯云、阿里云和红帽的OpenShift等各种云服务和解决方案,能够根据客户需求提供技术咨询和支持; 2、需要向用户提供容器技术支持,包括帮助用户安装、配置和使用容器服务,以及回答用户的技术咨询和问题; 3、在云平台上部署、配置和管理应用程序和服务,确保云平台能够正常运行。同时需要对云环境进行监测和维护,确保其高可用性和可靠性,并及时处理云服务的故障。 任职要求: 1、对云计算架构设计原则有深入的理解,包括弹性伸缩、高可用性、容灾备份、安全性等方面; 2、具备容器化应用程序的开发和部署经验,熟悉容器编排工具Kubernetes,并能够设计和管理容器化环境,熟练掌握kubernetes、docker的常用操作,对容器的网络、安全、存储、中间件、数据库等方向有深入的理解; 3、具备VMware虚拟化技术的实践经验,包括虚拟机的创建、配置和管理,以及虚拟网络和存储的设置。熟悉VCENTER 6.0 7.0 8.0 各个版本使用,ESXI主机的安装,以及虚拟网络规划,有独自实施和解决用户故障的能力; 4、熟悉华为、联想、浪潮等厂商的服务器和存储产品,了解其硬件架构和性能特性。熟悉各种系统设备的安装和配置,对问题处理有一定的经验; 5、熟悉至少一门脚本语言(shell/python均可),具备底层脚本开发能力,具备编写和维护相关脚本和工具的能力; 6、具备良好的团队合作精神,能够与销售团队和技术团队紧密合作,共同完成项目。愿意分享知识和经验,帮助团队成员提升技术水平。
-
职责描述: 1、 负责自然语言理解NLP算法研究及应用场景的业务需求落地,应用场景包括不限于文本表示、文本计算、文本分类、命名实体、关键词提取、知识库等主流需求; 2、 负责自然语言理解NLP垂直领域或应用场景需求的研发如知识库建设,包括文本序列标注、句法结构与语义分析、多轮对话等算法的研发工作; 3、 跟踪国内外自然语言理解NLP、信息检索IR的最新及前沿算法进展,并预研成果择优应用于相应产品之中。 任职要求: 1、 硕士及以上学历,计算机、自然语言理解、数据挖掘、模式识别、智能科学与技术、软件工程、机器学习和深度学习相关专业; 2、 熟练掌握C/C++、Python、JAVA至少一种计算机编程语言,具备较强代码编写能力; 3、 至少掌握Pytorch/Tensorflow/Theano/Keras其中一种框架设计原理和运用,掌握CNN/RNN/LSTM/图神经网络等主流神经网络模型应用; 4、 具有垂直应用领域案如智能对话、知识库和信息检索其中一个或多个研究方向的项目落地或应用场景实践经历; 5、 具有良好的团队合作意识和学习能力,擅长解决问题与分析问题,热爱自然语言理解技术工作研发; 6、 在国际顶会如ACL和NIPS,或权威期刊发表过论文者优先,或有知名自然语言处理技术企业工作经历者优先考虑。
-
职位描述 1. 配合算法研究员完成算法的落地与部署工作,并在代码与指令集层面优化算法运行效率。 2. 设计基于GPU的高性能算法基础库,支持下游各个算法研发。 职位要求 1、熟悉CUDA工作原理,能独立完成代码热点分析并制定优化方案。 2、良好的编程能力,熟悉python, c++,掌握常见的算法和数据结构知识; 3、良好的工程能力,有较强的的代码结构设计能力,熟练使用git、ssh,cmake等工具。 加分项 1、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
-
工作职责 1.负责云平台计算和虚拟化集群的稳定性维护; 2.负责解决客户云主机,云备份等计算产品的售后问题,对故障定位持续进行改进和优化; 3.负责支撑云计算底座产品的迭代和演进,提高迭代和演进的效率和稳定性; 4.负责和指导开发自动化运维工具,不断研发与探索运维自动化及各类创新途径,缩短运维响应时间,降低运维成本; 5.负责客户侧上云用云方案支持工作。 技能要求 1.熟悉TCP/IP的基本原理和实际应用,精通linux操作系统,网络相关协议栈; 2.精通虚拟化相关技术,如vmware,kvm,docker,containerd等; 3.熟悉常见监控工具,如Prometheus、Grafana、ELK等; 4.至少掌握一门语言,python,go,shell优先; 5.熟悉常用linux服务,包括但不限于iptables,nginx,keepalived,lvs,等。 6.具备openstack、kubernetes等集群管理经验,具备中大规模(500+服务器)公有云或者私有云集群维护经验者优先。 任职要求 1.计算机相关专业优先; 2.具备5年以上云计算相关工作经历,有大型互联网企业云计算架构设计及维护经验者优先; 3.具备良好的学习能力及抗压能力; 4.有较强的团队意识及沟通能力。
-
岗位职责: 1)算法实现与优化:负责自然语言处理相关算法的实现,制定并优化NLP相关的任务算法方案。 2)技术研究与开发:研究和开发自然语言处理技术,包括语言分析、文本处理、语音识别、机器翻译等领域。 3)平台搭建与维护:负责自然语言处理与理解的基础平台搭建,例如LLM优化、分布式训练推理等。 4)数据处理与分析:在大数据环境下,负责自然语言处理、文本分析相关技术研究和实现,实现LLM同具体应用整合。 任职要求: 1) 学历背景:本科及以上学历,计算机科学、自然语言处理、数学、统计学等相关专业。 2) 编程能力:扎实的编程基础,至少精通一种编程语言,如Python、Java等。 3) 理论知识:有NLP领域的理论基础和实践经验,熟悉LLM算法原理。 4) 工作经验:需要3年以上的工作经验,有LLM模型设计和应用经验者优先。 5) 其他技能:熟练掌握常见的NLP算法和技术,熟悉Transformer、BERT、GPT、Diffusion等模型,有多模态大模型经验者优先。 6) 熟悉强化学习、知识蒸馏理论,有相关领域有影响力的论文者优先; 7) 团队合作与沟通:积极主动,责任心强,有良好的团队合作和沟通能力。具备独立开展工作的能力
-
工作职责 1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力