• 25k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1、参与端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、探索前沿的LLM、MLLM、StableDiffusion等在端侧的落地和应用; 2、设计、调试并训练端侧某领域的大模型; 3、负责相关领域的数据收集、清洗、送标、微调、效果评估工作; 4、持续跟踪行业进展,提升团队在该领域的技术能力。 职位要求: 1、熟悉Transformers、大模型、Langchain等最新技术,有相关项目经验优先; 2、熟悉PyTorch、TensorFlow等深度学习框架; 3、良好的团队协作能力; 4、熟悉业内主流大模型原理,训练/Fine-tune策略,数据Pipeline等; 5、创新性强,有良好的动手实现能力,对技术有热情。
  • 20k-35k 经验3-5年 / 本科
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1.负责制定数据运营策略,为大模型的训练提供精准有效的数据支持; 2.负责拓展数据生产方案,为大模型在生活服务场景的落地提供数据支持; 3.负责供应商采购招标,设计并实施各类数据管理机制,保证数据质量; 4.负责监测大模型在各应用场景的效果,并提出实质性的改进建议。 岗位基本需求 1.具备本科及以上学历,擅长内容创作,有数据运营相关工作经验; 2.具有良好的数据分析能力,并熟悉大模型、数据挖掘等相关领域; 3.擅长管理供应商或外包团队,能够处理跨团队的沟通协作问题; 4.强调细节并注重端到端效果,能够在快节奏的工作环境中工作,并能够应对工作压力。 具备以下者优先 对大模型方向有深刻见解的优先,有AI方向数据运营及团队管理经验的优先。 岗位亮点 紧跟业界最前沿的大模型能力,深度参与在生活服务等真实场景的落地应用。 其他补充信息 基础研发平台是美团的核心技术平台,旨在打造公司级高性能技术架构、数据科学、服务运维、开发质效提升、信息安全、视觉智能以及企业办公数字智能化等系列关键能力,持续强化平台技术,保障基础设施稳定安全、低成本、高效可持续,全面赋能公司各个业务高速发展。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
  • 30k-60k 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责大模型技术在在文本生成、知识库建设、记忆能力、对话、推理能力增强等方面前沿技的跟进、创新,探索适合微博场景的应用解决方案; 任职要求 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2. 熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架 3. 熟悉RAG相关原理,熟悉大语言模型 SFT/RLHF 等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀; 5. 有NLP顶会论文或国际NLP比赛奖项者优先;
  • 旅游|出行 / D轮及以上 / 500-2000人
    我们正在寻找一名具有丰富自然语言处理(NLP)经验的算法工程师,同时需具备大模型相关的经验和知识。如果您还具备Chatbot相关的经验,那将是一个巨大的加分项。此岗位将负责开发和优化我们的AI解决方案,推动NLP和大模型技术在各类应用场景中的落地。 主要职责: 设计和优化NLP算法,提升系统的理解和生成能力。 研究和应用最新的NLP技术,解决复杂的自然语言处理问题。 开发和优化大规模机器学习和深度学习模型,提升系统性能。 与产品团队和数据科学团队紧密合作,了解业务需求并转化为技术方案。 参与大模型相关项目,推动大模型在各类应用场景中的应用。 进行数据分析和挖掘,提供数据驱动的优化建议。 编写高质量的技术文档和报告,分享研究成果和项目进展。 职位要求: 计算机科学、电子工程、数学或相关领域的本科及以上学历。 至少3年在NLP领域的工作经验。 熟悉常见的NLP技术(如分词、命名实体识别、文本分类、情感分析等)。 具有大模型相关的经验(如GPT、BERT、Transformers等)。 精通Python,熟悉TensorFlow、PyTorch等深度学习框架。 具备数据分析和处理能力,能够理解和处理大规模数据集。 良好的团队协作能力和沟通能力,能够与跨部门团队有效合作。 加分项: 有Chatbot开发和优化的实际经验。 拥有电商、金融、医疗等领域的NLP应用经验。 在学术会议或期刊发表过NLP或大模型相关论文者优先。 具有推荐系统或其他AI应用开发经验者优先。 如果你对NLP和大模型充满热情,并希望在快速发展和充满挑战的环境中成长,我们诚邀你的加入!
  • 35k-55k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责汽车行业领域大模型的质量保障工作,其中包含软件的需求分析、模型评测、效果评估等,支持行业内的工程化落地; 2、负责汽车行业领域大模型的测试基建、评测体系的建设,提升业务评测效率和质量; 3、负责大模型业务测试数据的分析和统计,对模型结果、过程数据进行分析、提取、统计; 4、根据产品设计制定测试计划、风险评估、设计测试数据和测试用例,执行测试用例,进行 bug 追踪等; 5、对大模型以及相关方向(如 NLP、CV、多模态等)的前沿技术、评测体系进行持续跟踪和调研。 职位要求: 1、本科及以上学历,计算机、通信、统计等相关专业三年以上工作经验; 2、熟悉 NLP、深度学习、生成式语言大模型等基本原理和技术,熟悉常见的评测指标、效果评估方法; 3、熟悉掌握 Python/Shell 等语言中的一门或者多门; 4、具有良好的沟通能力和团队合作精神、快速的学习能力,具备一定的抗压能力和强烈的责任心; 5、有过 AI 类产品的质量保障工作经历或算法评测经验最佳; 6、有汽车行业相关经验、ToB 交付业务经验。
  • 旅游|出行 / D轮及以上 / 500-2000人
    工作职责: 1、与数据科学家和算法工程师合作,将机器学习模型(主要使用Python开发)转化为可在生产环境中运行的服务,优先处理大模型(如深度学习、预训练语言模型等)的部署需求。 2、负责在Google Cloud Platform (GCP) 上部署和优化模型,确保其高效、稳定地运行,尤其是大规模机器学习模型的部署与优化。 3、使用GCP工具(如Compute Engine、Kubernetes Engine、Cloud Functions等)管理云服务,构建自动化和可扩展的模型服务架构。 4、开发、优化和维护模型的RESTful API,确保模型与前端应用和业务系统的无缝集成。 5、负责模型的持续集成和持续部署(CI/CD),使用GCP Cloud Build、Cloud Deploy等工具,确保开发流程的自动化和部署的稳定性。 6、分析和优化系统性能,使用GCP的监控工具(如Stackdriver)监控和调优模型推理速度及资源使用效率,特别是针对大规模数据处理场景。 职位要求: 1、编程技能:精通Python,具备将机器学习模型开发为后端服务的经验;熟悉Java、Go等其他编程语言者优先。 2、云计算技能:深度了解Google Cloud Platform (GCP),并具备在GCP上部署、管理和优化服务的实际经验。 3、机器学习框架:熟悉TensorFlow、PyTorch、scikit-learn等常见的机器学习框架,能够将算法代码与后端系统集成;有大模型(如GPT、BERT、Transformer等)相关部署和优化经验者优先。 4、DevOps:具备CI/CD实践经验,熟悉Docker、Kubernetes容器化技术,能够构建和维护容器化的微服务架构。 5、数据库管理:了解GCP中的数据库服务,如BigQuery、Cloud SQL、Firestore,具备数据库性能优化和大数据处理能力。 6、沟通协作:具备与算法团队、数据科学家紧密合作的能力,能够有效沟通技术细节并推动项目落地。
  • 社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 25k-35k 经验3-5年 / 本科
    居住服务 / 上市公司 / 2000人以上
    工作职责 负责包括不限于文生图、图生图等相关模型能力建设和产品化落地 1. 负责行业数据的处理,构建高质量的训练、测试数据和评估标准; 2. 负责产品从0-1的定义,并跨部门协作推动确保产品落地; 3. 负责相关产品的用户行为分析,收集用户反馈并推动产品的持续优化和迭代; 4. 持续关注AI行业趋势和新技术,并转化为公司级产品。 任职资格 任职资格 1. 计算机、数学、人工智能等相关专业的***本科及以上学历,1年以上策略或AI产品实践经验(AIGC相关加分); 2. 具有良好的场景洞察、逻辑思维和问题解决能力,能深入业务探索大模型落地方向; 3. 定义目标和路径拆解的能力,成功主导过产品的从0-1; 4. 具备团队合作精神,良好的沟通和协作能力; 5. 产品心、创新精神、快速学习的能力和良好的抗压能力
  • 15k-25k 经验3-5年 / 本科
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1. 研发人工智能领域的相关算法实现, 可以选择NLP、语音、图像领域其中之一。 2. 结合行内业务需求,设计实现方案,并基于大模型进行场景开发和模型的微调优化。 3. 跟踪和关注大模型推理训练领域的前沿技术和趋势,进行技术调研和应用。 岗位要求 1.计算机、电子通信、数学等相关专业,硕士及以上学历或优秀本科生; 2.具备优秀的编程能力,熟练使用Python/C/C++的其中一种; 3.对机器学习、深度学习等人工智能领域有兴趣,有相关领域课题研究或项目经验者优先;; 4.有期刊论文发表或计算机相关竞赛经验者优先; 5. 出色的问题分析及解决能力,能自我驱动,持续面对挑战,积极主动、踏实勤奋。
  • 25k-35k·14薪 经验1-3年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 15k-18k·13薪 经验3-5年 / 大专
    工具类产品 / 上市公司 / 2000人以上
    岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
  • 35k-60k·16薪 经验3-5年 / 硕士
    居住服务 / 上市公司 / 2000人以上
    岗位职责: 1.建立面向大语言模型的数据去重、清洗、过滤能力。 2.高效处理海量数据,探索大语言模型的数据混合配比。 3.建立大语言模型的通用和领域评测能力。 4.持续跟进行业最新进展,不断优化提升面向大模型的数据算法能力。 任职资格: 1.计算机、人工智能、自然语言处理或相关领域的硕士或博士,能力突出的本科生。 2.具备良好的编程能力,熟练掌握Python等编程语言,掌握PyTorch等至少一种深度学习框架。 3.具备良好的沟通和团队协作能力,有较强的解决问题能力和动手能力。 4.具备1年以上相关领域的工作经验
  • 数据服务 / 上市公司 / 500-2000人
    岗位职责: 1、负责具体大模型应用场景开发; 2、根据业务需求编写高质量的代码实现功能; 3、参与辅助编码JetBrains插件的开发和用户问题支持,有较好的问题分析能力和归纳能力; 4、技术、产品文档编写; 5、跟进前沿技术发展,结合业务场景引进行业先进实践,保障技术先进。 任职要求: 1、本科及以上学历,计算机相关专业, 5年及以上开发经验; 2、Java:熟悉Java Spring框架开发; 3、中间件:掌握mysql、redis、kafka、es等中间件开发技术; 4、了解LangChain等大模型应用开发框架原理;熟悉大模型调优相关技术; 5、技术、产品文档编写能力; 6、沟通协作能力,解决用户问题; 7、具备优秀的沟通能力、学习能力,有强烈的上进心和主动性。
  • 25k-50k·15薪 经验3-5年 / 本科
    信息安全,企业服务 / 上市公司 / 2000人以上
    岗位职责: 1.负责制定大模型产品的模型效果评测方案,对微调模型的训练/推理效果、RAG知识检索增强的生成效果设计评估方法和自动化工具,保障大模型的推理效果准确性 2.通过相关工具提高模型评测的效率和覆盖率,分析和评估模型测试结果,发现模型潜在的缺陷、漏洞和性问题 3.持续关注行业的最新测试技术和方法,不断优化测试流程和工具,提高测试效率和质量 任职要求: 1.本科及以上学历,有大模型算法测试经验 2.具备扎实的Pyhon/Shell等编程基础,熟练使用linux系统 3.深入理解机器学习、深度学习相关算法评估方法,熟悉自然语言大模型LLM 训练完模型推理效果测试方法和工具 4.熟悉k8s,有云原生相关项目测试工具开发经验者、大模型评测系统自动化和大模型性能测试经验者优先 5.拥有技术激情和创新意识,快速学习能力,表达能力优秀,乐观向上
展开