• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:字节跳动ByteDance Research专注于人工智能领域的前沿技术研究,涵盖了自然语言处理、计算机视觉、机器学习、强化学习等多技术研究领域,同时致力于将研究成果落地,为公司现有的产品和业务提供技术支持和服务。 1、为LLM和Diffusion Model提供训练稳定性、易用性、性能和Scale up的优化; 2、能够使用Profiler手段,分析训练瓶颈,使用分布式策略调优、算子优化等手段来提升训练性能; 3、负责训练优化技术的调研和引入; 4、与算法部门深度合作,进行算法与系统的联合优化。 职位要求: 1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 2、熟悉LLM 、Diffusion Model任一场景的训练性能优化; 3、熟悉Pytorch、FSDP、Deepspeed、Megatron等业界主流分布框架的使用和原理,能够进行业务场景的优化,能够跟踪业界最新动态并进行落地; 4、熟练GPU的高性能计算优化技术,具备丰富的基于CUDA的GPU性能优化经验,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等; 5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:字节跳动ByteDance Research致力于人工智能领域的前沿技术研究,涵盖自然语言处理、计算机视觉、机器学习、机器人、AI for Science、Responsible AI等多个领域,同时将研究成果落地,为公司现有的产品和业务提供技术支持和服务。 1、负责LLM和Diffusion Model的性能优化; 2、通过TensorRT、量化、剪枝、算子融合、CUDA算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 3、负责推理优化技术的调研和引入; 4、与算法部门深度合作,进行算法与系统的联合优化。 职位要求: 1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 2、精通C/C++,精通算法与数据结构,熟悉Python; 3、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等; 4、具备丰富的基于CUDA的GPU性能优化经验; 5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如Pytorch、Tensorflow; 6、熟悉TensorRT-LLM、ORCA、VLLM等; 7、了解主流LLM 、Diffusion Model,有LLM 、Diffusion Model加速优化经验者优先。
  • 15k-28k 经验5-10年 / 不限
    IT技术服务|咨询 / 上市公司 / 2000人以上
    性能测试专家 调优优秀。和平里北街 银行测试外派
  • 软件服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1、根据业务场景制定制定性能测试方案、性能测试目标和测试策略; 2、展开性能测试用例设计,脚本编写和测试执行; 3、配合开发进行性能调优,推动产品性能表现的提升 ; 4、分析测试结果并出具性能测试报告,对性能风险提前预警。 任职要求: 1、2年以上大型网站或后台服务器的实际性能测试经验,熟悉性能测试整体流程、测试方法;能独立承担项目性能测试、具备性能测试需求分析能力,有定位系统瓶颈和性能调优的经验; 2、熟悉常用性能测试工具(LR、Jmeter等)中的一种或多种,熟练编写测试脚本; 3、熟悉WEB服务器(如Apache, Nginx)的配置,具备性能测试需求分析能力,有定位系统性能瓶颈和性能调优经验;4、熟练使用至少一种关系型数据库,有数据库性能调优经验; 5、具备一定的开发基础,熟悉Java、PHP、Python等编程语言中的一种或多种优先。 6、全栈型测试,40-50%功能测试,20-30%自动化测试,10%性能测试和安全测试。
  • 30k-50k·14薪 经验3-5年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3、负责LLM/多模态模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 4、负责扩散模型的端到端部署和AI绘图的高并发服务流程设计,包括但不限于核心算子/采样器优化、模型优化和压缩、服务流程优化。 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率。 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身。 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验。 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。 6、熟悉LLM/多模态相关的算法技术以及推理加速方法。 7、有团队管理经验者优先。 8、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 20k-30k 经验3-5年 / 本科
    科技金融 / 不需要融资 / 2000人以上
    岗位职责: 1. 负责业务系统的非功能测试工作,根据项目业务需求指定性能测试方案,执行性能测试,并协助开发进行性能分析,问题定位和调优; 2. 持续优化现有的非功能测试工作流程,提升性能测试工作效率和质量。 任职要求: 1. 本科及以上学历,软件工程类、电子信息类、计算机科学等相关专业背景; 2. 具备3-5年性能测试相关工作经验,熟悉性能测试理论和实践; 3. 熟练使用主流性能测试工具,掌握Java编程语言; 4. 熟悉主流操作系统,熟悉主流数据库; 5. 参与过分布式系统或银行系统性能测试者优先。
  • 14k-18k 经验3-5年 / 本科
    软件服务|咨询 / 上市公司 / 2000人以上
    工作内容: 承担各类应用系统、平台组件的性能测试任务以及可靠性测试任务,按照工作规范交付各项工作成果。 岗位要求: 1、本科毕业,计算机相关专业优先,有开发经验者优先(java或C#)。 2、熟悉性能测试流程,精通一种压测工具的使用(Jmeter或Loadrunner),2年以上的全职性能测试经验。 3、熟悉http协议,具备复杂业务场景下的压测脚本调试能力;熟悉linux的基本操作和linux常规性能指标的解读; 4、熟悉常用中间件(redis、mq、nginx等)的特性,有独立部署配置的能力; 5、熟悉常规的性能问题诊断方法和相关工具链的使用,有独立诊断一般性能问题的能力; 办公点: 珠海横琴方达成大厦
  • 14k-16k 经验5-10年 / 本科
    IT技术服务|咨询 / 上市公司 / 2000人以上
    性能测试 1.5年及以上软件行业工作经验;本科以上学历,学信网可查; 2.计算机技术相关领域或金融相关领域 ; 3.初步具备应用系统功能测试方案编制、性能测试方案编制、测试需求分析、测试案例设计、测试报告编制、测试问题分析能力,并可以指导初级测试人员完成测试用例的编制工作; 4.初步具备测试项目监管能力,能够完成测试项目各个阶段的测试质量检查工作,在指导下可编制监理报告; 5.具备 linux 操作系统、Oracle 数据库管理、网络管理等经验; 6.熟悉熟悉Loadrunner、Jmeter性能测试工具的一种。
  • 40k-60k·16薪 经验3-5年 / 硕士
    金融业 / 不需要融资 / 50-150人
    工作职责: 1. 参与公司高性能计算平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 开发公司高频策略所需的高性能回测系统。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
  • 25k-40k 经验5-10年 / 本科
    软件服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1、根据业务场景制定制定性能测试方案、性能测试目标和测试策略; 2、展开性能测试用例设计,脚本编写和测试执行; 3、配合开发进行性能调优,推动产品性能表现的提升 ; 4、分析测试结果并出具性能测试报告,对性能风险提前预警。 任职要求: 1、2年以上大型网站或后台服务器的实际性能测试经验,熟悉性能测试整体流程、测试方法;能独立承担项目性能测试、具备性能测试需求分析能力,有定位系统瓶颈和性能调优的经验; 2、熟悉常用性能测试工具(LR、Jmeter等)中的一种或多种,熟练编写测试脚本; 3、熟悉WEB服务器(如Apache, Nginx)的配置,具备性能测试需求分析能力,有定位系统性能瓶颈和性能调优经验;4、熟练使用至少一种关系型数据库,有数据库性能调优经验; 5、具备一定的开发基础,熟悉Java、PHP、Python等编程语言中的一种或多种优先。 6、全栈型测试,40-50%功能测试,20-30%自动化测试,10%性能测试和安全测试。
  • 30k-50k·14薪 经验1-3年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等; 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度; 3、负责LLM/多模态模型的端到端部署和流程优化,探索包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等; 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率; 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身; 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验,熟悉CUDA、Triton等算子编写的相关技术; 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化; 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化,熟悉计算机体系结构基础知识,有扎实高性能计算(GPU/x86/ARM等)、或推理框架及AI编译(TRT/TVM等)、或模型算法优化(量化/稀疏等)方面的经验; 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。熟悉常见GPU服务部署框架和服务部署流程,如Triton等,能够实现动态批处理和GPU服务调度,熟悉K8S上GPU的调度和隔离方案,熟悉Docker; 6、熟悉LLM/多模态相关的算法技术以及推理加速方法,具有LLM训练及开发经验,如大模型数据处理、模型微调、预训练、强化学习等,了解TRT-LLM,deepspeed,VLLM等训练或推理加速框架; 7、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 15k-25k 经验3-5年 / 本科
    人工智能服务,科技金融 / 不需要融资 / 500-2000人
    岗位职责 1、负责金融类信息系统的性能测试和调优工作。 2、负责性能测试需求分析、性能测试场景设计、测试数据准备、测试脚本编写和执行、性能测试数据分析和问题排查,以及性能优化建议和验证等相关工作; 3、负责性能测试过程管理以及沟通、协调、报告编制和汇报等工作; 4、负责性能测试技术、方法和工具的研究及推广,推进性能测试能力建设。 岗位要求 1、熟练掌握LoadRunner、Jmeter等性能测试工具及应用; 2、熟练掌握性能监控技术,能够利用Prometheus、nmon、Arthas、jvisualvm等系统监控工具对应用、数据库、中间件等的系统资源进行监控,能够利用pinpoint、skywalking等APM工具进行应用链路追踪; 3、熟悉系统主流技术架构,对分布式、微服务、云原生、高可用及多活等技术架构有一定的理解和应用; 4、具有一定的应用软件开发基础,熟悉Java、Python、C++等至少一门主流编程语言; 5、了解TD/TxSQL、Oracle、Informix等数据库,Linux、AIX等操作系统,Weblogic、NG、ZooKeeper、Redis、MQ等中间件的应用性能和参数调优; 6、具备性能分析能力,能定位性能问题,提出性能优化方案或意见。
  • 14k-17k·13薪 经验5-10年 / 本科
    软件服务|咨询 / 上市公司 / 2000人以上
    一、公司介绍: 彩讯股份(创业板股票代码:300634)是一家软件互联网上市公司,是协同办公、 智慧渠道、云和大数据领域的龙头企业。拥有五地研发中心和遍布全国的运营网络,员工超过 3000 人。 公司坚持“以大场景运营效果为导向,全面数字化、智能化”的发展战略,持续加大在人工智能等领域的投入,将成为中国领先的智能数字化企业。 二、项目介绍: 用管中心项目服务的客户是中移互联网公司,以移动认证为基础,通过号卡认证能力、认证组件化、认证数据采集工具等能力,提供一站式账号管理解决方案,包括一键登录、本机号码校验、二次号等多种服务。累计接入应用近5万个,TOP500客户覆盖率达73%,移动认证用户占全网上网用户渗透率达到42%,业务收入2亿元以上。主要支撑范围包括市场拓展推广支撑、业务运营支撑、产品服务支撑和技术优化维护支撑四方面工作。 三、岗位介绍: 【岗位职责】 1、根据产品特点和需求完成性能测试技术和工具选型、性能测试方案设计与编写; 2、按照总体测试计划制定性能测试计划,明确测试策略、环境搭建、数据准备、人力投入、进度计划、风险管理等相关内容; 3、设计、实现并执行性能测试; 4、总结并报告产品性能测试; 5、参与性能测试工作规划; 6、举办内部性能测试交流与培训,提升部门整体性能测试能力; 【岗位要求】 1、**本科及以上学历,重本优先;计算机或相关专业; 2、熟练使用(windows、linux)操作系统、(oracle、sqlserver、mysql)数据库,能够根据要求独立搭建和维护测试环境; 3、熟悉常用协议,如TCP/IP、http、ssl、https、socket。熟悉dubbo、微服务; 4、掌握软件测试流程和规范;掌握软件需求分析、测试规格分析、测试方案设计、缺陷管理分析等相关测试技术; 5、熟练掌握JAVA、C、C++、Python、Perl、shell中一种,要求能独立编写性能测试脚本; 6、熟悉主流应用服务器如IIS、Apache中的两种以上; 7、精通Loadrunner、jmeter的使用; 8、具备多种跨平台性能监控、数据收集能力。掌握JProbe、Spotlight、sitecope、rpc、nmon等性能监控工具使用; 四、薪酬福利与职业发展: 我们提供竞争力的薪资待遇和福利待遇,包括期权激励、五险一金、带薪年假、节假日福利、健康体检、培训及晋升机会等。 同时,我们还为员工提供广阔的职业发展空间,鼓励员工在工作中不断成长和进步。 我们的团队充满活力、激情和创新精神,致力于打造一个开放包容、信任互助的工作环境,并定期举行各种团队建设活动,增强彼此之间的沟通和理解。 期待您的加入,一起探索未来无限可能! 想更多了解彩讯股份,欢迎进入:https://www.richinfo.cn
  • 20k-40k·16薪 经验3-5年 / 本科
    居住服务 / 上市公司 / 2000人以上
    工作职责: 1.打造贝壳的高性能存储解决方案及推动系统落地, 支撑模型开发的全链路,提高深度学习开发效率以及加速模型训练。 工作内容: 1.调研并设计高性能存储解决方案; 2.高性能存储系统落地及业务适配; 3.提高系统的吞吐及稳定性,建设完善的监控与运维体系. 任职资格: 1. 3~5 年以上后端开发经验; 2.熟悉计算机体系结构、数据结构和算法、操作系统、数据库、网络等基础原理; 3.精通 Golang 或至少一类后端编程语言(C++/JAVA/Python 等)且具备快速转向 Golang 的能力; 4.有分布式的软件架构设计、开发和运维经验,能快速定位和调试问题; 5.有良好的测试习惯以保证高质量软件的产出; 6.优秀的沟通协作能力、分析解决问题能力和学习能力; 7.熟悉 juicefs、alluxio、fluid等系统优先;
  • 35k-65k 经验3-5年 / 本科
    智能硬件,电商平台 / 上市公司 / 2000人以上
    职位描述 1. 配合算法研究员完成算法的落地与部署工作,并在代码与指令集层面优化算法运行效率。 2. 设计基于GPU的高性能算法基础库,支持下游各个算法研发。 职位要求 1、熟悉CUDA工作原理,能独立完成代码热点分析并制定优化方案。 2、良好的编程能力,熟悉python, c++,掌握常见的算法和数据结构知识; 3、良好的工程能力,有较强的的代码结构设计能力,熟练使用git、ssh,cmake等工具。 加分项 1、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
展开