• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责抖音系产品的多媒体泛质量方向下利用大模型技术解决多媒体质量的问题,包括但不限于基于MLLM设计音画质评估模型,AIGC生成内容(图像视频生成、音频生成等)理解/评估,用户体验大模型、音视频反面案例挖掘算法、多模态内容理解等方向; 2、负责深度学习模型的部署的优化工作,能够配合工程团队完成模型的上线开发和应用; 3、基于业务形态和算法技术,挖掘产品体验问题,并与产研团队密切配合,推动业务落地,提升产品用户体验; 4、跟随团队参与校企横向项目、学术论坛会议、数据科学竞赛等,协助团队构建学术/工业界影响力。 职位要求: 1、计算机、人工智能相关专业,本科及以上学历,具有深度学习相关的算法研究和落地经验,具有LLM开发和应用的实践的经历; 2、熟悉CNN/Transformer/Vit/BLIP/BERT等主流模型架构,熟练使用Pytorch、Tensorflow、Caffe、Keras等机器学习框架; 3、具备一定多模态大模型的算法经验(SFT/PE/RLHF/RAG),包括MLLM的训练、微调和评测工作,具备大模型部署实践经验,掌握vLLM、TRT等主流大模型部署框架,熟悉大模型推理优化的基本方案; 4、熟悉图像、音频等多媒体生成算法,如VAE,DIFFUSION等基本架构,了解生成模型的评估方法。 加分项: 1、具有算法工程化、模型蒸馏、模型部署,模型算子调优,SDK设计等工程经验,具备较强的工程能力; 2、在CVPR、ICCV、ECCV、ICML、NeurlIPS等机器学习和计算机视觉**会议发表文章或CVPR NTIRE、Kaggle、CCF、天池等知名数据科学竞赛取得优异成绩优先。
  • 社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 25k-50k 经验3-5年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1、负责端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、负责训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、5+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 30k-50k·13薪 经验5-10年 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、探索前沿的LLM、MLLM、StableDiffusion等在端侧的落地和应用; 2、设计、调试并训练端侧某领域的大模型; 3、负责相关领域的数据收集、清洗、送标、微调、效果评估工作; 4、持续跟踪行业进展,提升团队在该领域的技术能力。 职位要求: 1、熟悉Transformers、大模型、Langchain等最新技术,有相关项目经验优先; 2、熟悉PyTorch、TensorFlow等深度学习框架; 3、良好的团队协作能力; 4、熟悉业内主流大模型原理,训练/Fine-tune策略,数据Pipeline等; 5、创新性强,有良好的动手实现能力,对技术有热情。
  • 旅游|出行 / D轮及以上 / 500-2000人
    我们正在寻找一名具有丰富自然语言处理(NLP)经验的算法工程师,同时需具备大模型相关的经验和知识。如果您还具备Chatbot相关的经验,那将是一个巨大的加分项。此岗位将负责开发和优化我们的AI解决方案,推动NLP和大模型技术在各类应用场景中的落地。 主要职责: 设计和优化NLP算法,提升系统的理解和生成能力。 研究和应用最新的NLP技术,解决复杂的自然语言处理问题。 开发和优化大规模机器学习和深度学习模型,提升系统性能。 与产品团队和数据科学团队紧密合作,了解业务需求并转化为技术方案。 参与大模型相关项目,推动大模型在各类应用场景中的应用。 进行数据分析和挖掘,提供数据驱动的优化建议。 编写高质量的技术文档和报告,分享研究成果和项目进展。 职位要求: 计算机科学、电子工程、数学或相关领域的本科及以上学历。 至少3年在NLP领域的工作经验。 熟悉常见的NLP技术(如分词、命名实体识别、文本分类、情感分析等)。 具有大模型相关的经验(如GPT、BERT、Transformers等)。 精通Python,熟悉TensorFlow、PyTorch等深度学习框架。 具备数据分析和处理能力,能够理解和处理大规模数据集。 良好的团队协作能力和沟通能力,能够与跨部门团队有效合作。 加分项: 有Chatbot开发和优化的实际经验。 拥有电商、金融、医疗等领域的NLP应用经验。 在学术会议或期刊发表过NLP或大模型相关论文者优先。 具有推荐系统或其他AI应用开发经验者优先。 如果你对NLP和大模型充满热情,并希望在快速发展和充满挑战的环境中成长,我们诚邀你的加入!
  • 社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 20k-35k 经验3-5年 / 本科
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1.负责制定数据运营策略,为大模型的训练提供精准有效的数据支持; 2.负责拓展数据生产方案,为大模型在生活服务场景的落地提供数据支持; 3.负责供应商采购招标,设计并实施各类数据管理机制,保证数据质量; 4.负责监测大模型在各应用场景的效果,并提出实质性的改进建议。 岗位基本需求 1.具备本科及以上学历,擅长内容创作,有数据运营相关工作经验; 2.具有良好的数据分析能力,并熟悉大模型、数据挖掘等相关领域; 3.擅长管理供应商或外包团队,能够处理跨团队的沟通协作问题; 4.强调细节并注重端到端效果,能够在快节奏的工作环境中工作,并能够应对工作压力。 具备以下者优先 对大模型方向有深刻见解的优先,有AI方向数据运营及团队管理经验的优先。 岗位亮点 紧跟业界最前沿的大模型能力,深度参与在生活服务等真实场景的落地应用。 其他补充信息 基础研发平台是美团的核心技术平台,旨在打造公司级高性能技术架构、数据科学、服务运维、开发质效提升、信息安全、视觉智能以及企业办公数字智能化等系列关键能力,持续强化平台技术,保障基础设施稳定安全、低成本、高效可持续,全面赋能公司各个业务高速发展。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
  • 20k-40k 经验1-3年 / 本科
    智能硬件,电商平台 / 上市公司 / 2000人以上
    职位描述: 1. 负责以大语言模型 (LLM)、视觉语言模型 (VLM) 为核心的复杂场景理解和泛化技术。 2. 负责研究和设计以语言-动作大模型 (VLA) 在自动驾驶领域的落地,包括但不限于模型的结构、训练技术探索; 3. 负责研究基于自监督技术的自驾大模型,有效利用海量数据。 职位要求: 1. 对大模型算法研究和应用经验丰富,包括但不限于大模型的训练数据构造、模型训练、性能调优等; 2. 对大模型在自动驾驶领域有应用经验优先,包括但不限于利用大模型进行行为场景理解和规划的落地实施; 加分项 1、有计算机视觉或机器学习相关研究经验,有高水平论文发表; 2、参加kaggle或知名会议上举办的相关比赛取得优异成绩; 3、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
  • 25k-35k 经验3-5年 / 本科
    居住服务 / 上市公司 / 2000人以上
    工作职责 负责包括不限于文生图、图生图等相关模型能力建设和产品化落地 1. 负责行业数据的处理,构建高质量的训练、测试数据和评估标准; 2. 负责产品从0-1的定义,并跨部门协作推动确保产品落地; 3. 负责相关产品的用户行为分析,收集用户反馈并推动产品的持续优化和迭代; 4. 持续关注AI行业趋势和新技术,并转化为公司级产品。 任职资格 任职资格 1. 计算机、数学、人工智能等相关专业的***本科及以上学历,1年以上策略或AI产品实践经验(AIGC相关加分); 2. 具有良好的场景洞察、逻辑思维和问题解决能力,能深入业务探索大模型落地方向; 3. 定义目标和路径拆解的能力,成功主导过产品的从0-1; 4. 具备团队合作精神,良好的沟通和协作能力; 5. 产品心、创新精神、快速学习的能力和良好的抗压能力
  • 15k-18k·13薪 经验3-5年 / 大专
    工具类产品 / 上市公司 / 2000人以上
    岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
  • 工具类产品 / 上市公司 / 2000人以上
    岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
  • 35k-60k·16薪 经验3-5年 / 硕士
    居住服务 / 上市公司 / 2000人以上
    岗位职责: 1.建立面向大语言模型的数据去重、清洗、过滤能力。 2.高效处理海量数据,探索大语言模型的数据混合配比。 3.建立大语言模型的通用和领域评测能力。 4.持续跟进行业最新进展,不断优化提升面向大模型的数据算法能力。 任职资格: 1.计算机、人工智能、自然语言处理或相关领域的硕士或博士,能力突出的本科生。 2.具备良好的编程能力,熟练掌握Python等编程语言,掌握PyTorch等至少一种深度学习框架。 3.具备良好的沟通和团队协作能力,有较强的解决问题能力和动手能力。 4.具备1年以上相关领域的工作经验
  • 25k-35k·14薪 经验1-3年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 15k-25k 经验3-5年 / 本科
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1. 研发人工智能领域的相关算法实现, 可以选择NLP、语音、图像领域其中之一。 2. 结合行内业务需求,设计实现方案,并基于大模型进行场景开发和模型的微调优化。 3. 跟踪和关注大模型推理训练领域的前沿技术和趋势,进行技术调研和应用。 岗位要求 1.计算机、电子通信、数学等相关专业,硕士及以上学历或优秀本科生; 2.具备优秀的编程能力,熟练使用Python/C/C++的其中一种; 3.对机器学习、深度学习等人工智能领域有兴趣,有相关领域课题研究或项目经验者优先;; 4.有期刊论文发表或计算机相关竞赛经验者优先; 5. 出色的问题分析及解决能力,能自我驱动,持续面对挑战,积极主动、踏实勤奋。