• 50k-100k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责抖音直播及相关产品的大模型算法研发,如模型微调、prompt工程、RAG等相关工作; 2、负责关键场景大模型算法优化,提升业务效果,构建高质量的垂类大模型; 3、推动业务相关大模型应用工具平台的建设,提升业务应用大模型的效率。 职位要求: 1、计算机、人工智能、模式识别等相关专业本科及以上学位; 2、熟悉Linux系统和常用的数据结构,熟练使用Python/C++等至少一种编程语言,熟练使用TensorFlow/PyTorch等至少一种深度学习框架; 3、具有3年以上NLP研究或项目经验,熟悉Attention、Transformer、BERT、GPT等常用模型结构,熟悉LLaMA、ChatGLM等开源大模型原理与实现; 4、在角色对话生成、大模型训练、Agent、RLHF等方面有积累者优先考虑; 5、优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,良好的沟通和团队合作能力。
  • 8k-12k 经验在校/应届 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:直播团队负责为抖音集团提供直播服务。团队负责直播平台技术和直播业务研发,打造灵活稳定的直播服务平台,为用户提优质直播体验,支持电商、本地生活、游戏、节目、多人互动等不同类型的业务场景。直播业务发展迅猛,处于行业头部地位,业务发展空间巨大。现在加入我们,和优秀的人一起做有挑战的事,你的技术与创意将影响亿级用户,激发创意和丰富生活。 1、负责抖音直播及相关产品的大语言模型/AIGC算法研发,如数字人、3D生成、动作驱动、智能对话等相关工作; 2、负责关键场景的算法优化,构建高质量的模型和Agent系统,提升业务效果; 3、跟踪AI前沿技术进展,推动前沿技术的产品化落地。 职位要求: 1、2026届本科及以上学历在读,人工智能、计算机、软件工程等相关专业优先; 2、具有优秀的编程基础,熟练使用Python/C++等至少一种编程语言,熟练使用TensorFlow/PyTorch等至少一种深度学习框架; 3、具有扎实的机器学习/深度学习基础,熟悉常用算法和神经网络模型结构; 4、在计算机视觉和图形学、自然语言处理、强化学习等相关方向发表过高质量论文者优先考虑; 5、具有优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,良好的沟通和团队合作能力。
  • 25k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1、参与端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 15k-20k 经验1-3年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责AI大模型语音产品交付,包括PE、Agent、运营物料等交付; 2、负责优化外呼、质检等语音机器人效果,通过模型评测、模型优化等方式推动机器人效果提升; 3、负责推进标准方案在业务侧的落地,保证效果及业务目标达成; 4、负责持续监控和跟进语音机器人上线后效果,并针对性优化。 职位要求: 1、1年以上AI语音运营经验,有大模型智能外呼、大模型智能质检经验优先; 2、具有处理和分析数据的能力,并熟悉大模型、数据挖掘等相关领域; 3、会基础编程/有深度学习经验/了解NLP技术者(如ChatGPT的原理)者优先; 4、思维活跃、学习能力强、有探索精神、耐心细致、渴望挑战真实业务场景中的对话系统问题。
  • 25k-50k 经验3-5年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1、负责端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、负责训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、5+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 3k-4k 经验在校/应届 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动Data研发部门,负责公司产品线的推荐、广告、系统架构、大数据和开放平台等技术。 1、打造业界领先的多模态数据湖产品,向客户提供新一代大模型数据基础设施; 2、面向大语言模型、多模态模型、AI agent提供数据处理和管理能力; 3、进行市场调研,梳理B端客户需求,分析市场空间和机会,给出商业化产品设计方案; 4、负责产品功能设计,推动研发完成产品功能交付,并推给解决方案和销售团队,完成商业闭环。 职位要求: 1、2026届本科及以上学历在读,计算机、管理或者财经类相关专业,学习过计算机相关课程; 2、掌握至少一门编程语言,包括但不仅限于:Python、Java、C、C++、PHP、Golang; 3、自驱力强,持续学习能力强,结果导向,包容性强,心态开放; 4、具备优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分; 5、每周可以实习4天以上,连续实习3个月以上。
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责抖音直播的大模型治理策略设计与应用,解决业务场景中出现的违法违规、色情低俗等安全风险问题,提升治理效率; 2、推动样本标注及模型训练、评测、上线流程机制,持续迭代大模型策略效能; 3、抽象治理流程,沉淀基于大模型的机审防控、知识库、查询工具等平台能力,覆盖音频、图像、文本及多模态场景,并持续优化。 职位要求: 1、有CV、NLP算法背景,具备数学、计算机等相关专业本科及以上学历; 2、有大模型应用落地经验,熟悉大模型运作链路与评价指标,包括并不限于预训练、SFT、RAG、Agent、PE等; 3、具备良好的学习能力与项目管理能力,能自我驱动,并推进跨团队的沟通协作。
  • 20k-40k·15薪 经验1-3年 / 硕士
    科技金融 / 上市公司 / 500-2000人
    【校招】大语言模型工程师 职位描述: 1. 参与大规模预训练模型的研发工作,探索超大规模模型的极致系统优化; 2. 研究高效的模型调优策略、高质数据建设方法,包括数据建设、指令微调、偏好对齐、模型优化等; 3. 设计、实现、优化分布式系统和并行计算框架,提升训练和推理效率,支持大模型平台化及创新应用落地; 4. 探索大模型在前沿技术和趋势中的应用,包括生成创作、逻辑推理等,并在金融领域下的更多使用场景中进行深入研究和探索。 职位要求: 1. 硕士及以上学历,人工智能、计算机、自动化、数学相关专业优先; 2. 扎实的机器学习基础,熟悉NLP、RL领域技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶会发表论文者优先; 3. 熟练掌握Python及Pytorch/Tensorflow/PaddlePaddle等框架,C/C++熟练者优先; 4. 优秀的代码能力和算法功底,ACM/ICPC、NOI/IOI、Kaggle等竞赛获奖者优先; 5. 熟悉预训练模型算法原理,有大规模模型(>7B参数)训练调优或分布式系统开发经验; 6. 具备出色的问题分析和解决能力,能独立探索技术解决方案。 加分项: 1. 在大模型领域或RL领域,主导过大影响力的项目或论文者; 2. 有较强的学术背景,在会议上发表过相关论文者; 3. 有丰富的实践经验,能够快速将研究成果应用于实际场景中。
  • 40k-70k 经验5-10年 / 硕士
    科技金融 / 上市公司 / 500-2000人
    岗位描述 我们正在寻找一位大模型算法工程师,加入我们的DeepBank算法团队,负责提升 Agent 的规划、推理能力,构建知识库,并探索知识与大模型的融合。   岗位职责 1、Agent 核心算法研发与优化: 深入研究并实现先进的 Agent Planning 和 Reasoning 算法,提升 Agent 在复杂任务场景下的自主规划、逻辑推理、决策制定和问题解决能力 。    2、知识库构建与维护: 负责 Agent 研发平台所需知识库的构建、更新和维护工作,确保知识的准确性、完整性和时效性 。  3、知识与大模型融合研究: 跟踪和研究知识与大模型结合的前沿技术,探索新的方法和潜在的应用场景 。重点研究和实现基于检索增强生成(RAG)的 Agent 系统,探索利用知识图谱等结构化知识增强大模型的推理能力 。    4、特定领域 Agent 算法调优: 针对特定的应用领域,研究和优化 Agent 的算法和策略,以提升其在实际业务场景中的效果 。   5、参与平台技术方案设计与实施: 参与 Agent 研发平台的技术架构设计、模块划分和接口定义工作 。   任职要求 1、计算机科学、人工智能、自然语言处理、机器学习等相关专业硕士及以上学历 。    2、精通 Python 编程,熟悉深度学习框架如 PyTorch 或 TensorFlow 。    3、具备扎实的机器学习、深度学习、强化学习等理论基础,熟悉 Transformer 模型 。有大模型相关项目经验者优先 。    4、熟悉人工智能 Agent 的基本概念和原理 。熟悉 Agent Planning、Reasoning 等关键技术,了解 RAG、Function Calling 等优先 。    5、具备较强的逻辑思维能力、问题解决能力和快速学习能力 。      加分项 1、有实际 Agent 研发或相关项目经验,熟悉 Agent 框架(如 LangChain、AutoGen 等)。    2、熟悉知识图谱、向量数据库等知识库相关技术或工具 。    3、在 AI 会议或期刊上发表过相关论文 。  4、有参与或贡献优秀的开源项目经验 。    5、具备良好的中英文沟通和协作能力 。    6、有特定行业的 Agent 应用开发经验 。 ------------------------------------------------------------------------------------------------------------------------------------------
  • 35k-65k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、深度参与火山方舟大模型平台产品,协同产品和研发团队高质量交付产品; 2、通过测试技术,提升测试效率及测试覆盖度; 3、负责开发测试工具,推进系统的稳定性建设; 4、根据系统特性,探索测试手段,参与专项的质量建设。 职位要求: 1、本科及以上学历,计算机、统计学等相关专业,3年以上工作经验; 2、熟悉一款商业或开源测试工具原理,有设计、开发服务端或客户端测试工具的经验; 3、熟练使用C++/Java/Go/Python任一编程语言; 4、了解大模型,有过模型训练、推理知识的加分; 5、具备良好的团队沟通和协作能力、自我驱动和创新能力; 6、了解机器学习平台、有大模型平台算法开发和测试经验者优先。
  • 35k-70k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。 职位要求: 1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先; 2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练; 3、有领域**会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先; 4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先; 6、出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题;良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
  • 35k-55k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、推动大模型在国际化电商审核场景的应用:协同算法、审核优化多语种自动审核大模型,推进审核人机协同,通过应用大模型,提升审核质效; 2、提示工程:负责审核大模型Prompt的起草、优化、评估及合理应用,提升审核大模型效果; 3、审核模型策略:深度参与审核模型的研发、评估、应用、监控、优化过程,通过数据运营、标注管理、案例分析、跨部门协同等方式,保证审核模型精度及相应审核业务目标达成。 职位要求: 1、本科及以上学历,对大模型有浓厚兴趣,愿意学习领域专业知识,积极探索行业前沿应用,了解提示工程、数据工程、AIGC者优先; 2、较强策略运营能力,擅长数据运营、案例分析、逻辑推理,具备模型、审核、电商等相关经验者优先; 3、具备跨部门协同能力,善于沟通表达,英语流利者优先。
  • 6k-8k 经验在校/应届 / 本科
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1.围绕大模型异构训练集群,尤其是非NV GPU大规模异构硬件集群,面向大模型预训练、Finetune等场景进行新模型使能,系统分析/优化,业务支撑等工作,包括分布式优化框架,AI框架,网络集合通信,算子等方面内容; 2.负责大模型推理引擎的研发和优化,包括推理系统优化、模型量化压缩和模型部署; 3. 熟悉NLP类模型训练场景,有GPT,LlaMa、DeepSeek等相关知识和经验者优先 4. 熟悉视觉类,多模态大模型训练场景,有ViT, Swin Transformer, Stable Diffusion, MoE相关知识和经验者优先 5. 熟悉Megatron, Deepspeed, Colossal AI, FSDP等分布式框架,有相关知识、使用和调优经验者优先 6. 熟悉以下推理框架者优先,如FasterTransformer、vllm、sglang、LMDeploy、TensorRT-LLM等; 7. 熟悉PyTorch分布式场景,有二次开发经验,系统调优知识和经验者优先 8. 熟悉集合通信原理和基本知识,对NCCL有大规模使用,调优经验者优先 9. 熟悉算子开发流程,有CUDA编程知识和相关经验者优先 10. 熟悉NV GPU架构,对其他类型AI芯片有使用经验者优先 岗位基本需求 1. 有扎实的计算机理论基础,熟练掌握C++或Python语言 2. 具备良好的问题分析和一定的解决能力,具有较好的学习能力和好奇心驱动。 岗位亮点 业界前列的NV GPU和非GPU算力规模,协同算法,AI框架,网络,计算,芯片等多个团队共同建设大模型软、硬件技术底座,接触最前沿的AI Infra基础设施,结合最前沿的AI平台软件栈,支撑最前沿的大模型不同领域的算法探索,从算法到算子,从芯片架构到互联集群,从POC到大规模场景,充满机遇与挑战,兼顾学习和成长,在垂直,水平等多个领域和维度,全面感受大模型带来的技术变革!
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、Prompt设计与优化,将审核规则转化为可执行的Prompt设计,确保大模型在内容审核中的高效应用,通过数据分析和模型反馈,持续优化Prompt设计,提升审核策略的精准度; 2、自动化审核策略落地,推动闭环自动审核策略的上线,优化审核效率与准确性,监控策略执行效果,及时调整Prompt设计以应对业务变化; 3、垂直业务支持,针对垂直业务领域,落地已有的解决方案,确保大模型在特定业务场景中的应用效果,独立负责垂直业务的核心指标,确保内容审核策略的持续优化与业务目标的达成; 4、跨部门协作,与合规、产品、技术、数据团队紧密合作,确保Prompt设计符合政策要求并具备可操作性,推动大模型在更多业务场景中的应用; 5、数据分析与报告,通过数据分析工具(如Excel、SQL、Python等)驱动决策,定期输出运营报告,分析策略效果并提出改进建议。 职位要求: 1、本科及以上学历,计算机科学、数据科学、法律、合规管理、语言学或相关专业优先; 2、1-3年相关领域运营治理工作经验,具备电商、内容审核、自然语言处理(NLP)或大模型Prompt设计经验者优先; 3、具备较强的逻辑思维能力,能够将审核规则转化为技术解决方案,同时良好的项目管理能力,能够在快节奏的工作环境中适应不断变化的项目需求者优先; 4、熟练使用数据分析工具(如Excel、SQL、Python等),能够通过数据分析驱动决策; 5、中英文流利,能够进行跨文化沟通,包含但不限于能够与合规、产品、技术、数据团队高效协作。
  • 40k-80k·15薪 经验3-5年 / 本科
    消费生活 / D轮及以上 / 500-2000人
    工作职责 【团队介绍】 小红书技术中台AI应用算法团队专注于图文、视频等场景下的大语言模型、多模态模型、扩散模型等技术的落地应用,通过标准化的AI技术能力支持公司各业务团队,提升技术资源利用率和业务创新迭代速度,持续优化技术研发成本并提升大规模AI应用的系统稳定性。团队兼具活跃的技术氛围、一线业务的真实挑战和相对充足的计算资源,欢迎有志于AGI、AIGC等方向的同学加入。 【工作职责】 1、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易等,持续推动AGI在业务场景下的落地应用; 2、基于成熟的AI平台服务,构建完善的AI原生应用和X+AI应用,包括如智能助理、知识问答、深度研究等,打造具有核心用户价值的热点应用; 3、探索大语言模型、多模态模型、扩散模型等在搜广推场景的落地方案。 任职资格 【任职资格】 1、自然语言处理、机器学习、人工智能等相关专业毕业的硕士/博士,或在自然语言处理、机器学习、人工智能等领域具备相应工作经验的候选人; 2、对AI应用系统有丰富的实战经验,如语义理解、情感分析、RAG、多模态理解及生成等,有扎实的理论基础和丰富的研发经验; 3、具备较强的coding能力,熟练使用Python/C++等语言,熟练掌握DeepSpeed、Megatron等框架;在ACL/EMNLP/ICML/ICLR/NIPS/CVPR/ICCV等顶会有论文发表经历优先; 4、具备探索精神,主动探索并解决技术和业务中存在的挑战,通过技术迭代驱动业务取得收益。