• 20k-40k 经验1-3年 / 本科
    智能硬件,电商平台 / 上市公司 / 2000人以上
    职位描述: 1. 负责以大语言模型 (LLM)、视觉语言模型 (VLM) 为核心的复杂场景理解和泛化技术。 2. 负责研究和设计以语言-动作大模型 (VLA) 在自动驾驶领域的落地,包括但不限于模型的结构、训练技术探索; 3. 负责研究基于自监督技术的自驾大模型,有效利用海量数据。 职位要求: 1. 对大模型算法研究和应用经验丰富,包括但不限于大模型的训练数据构造、模型训练、性能调优等; 2. 对大模型在自动驾驶领域有应用经验优先,包括但不限于利用大模型进行行为场景理解和规划的落地实施; 加分项 1、有计算机视觉或机器学习相关研究经验,有高水平论文发表; 2、参加kaggle或知名会议上举办的相关比赛取得优异成绩; 3、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、搭建质量领域大模型,并将其应用于实际测试场景,参与推进大模型、多模态、文本理解、生成算法、强化学习等人工智能技术在测试领域的应用; 2、负责业务的大模型算法研发,如模型微调、Prompt工程、RAG等相关工作; 3、探索数据建设、指令微调、偏好对齐、模型优化,分析模型指标,归纳训练规律,提升训练效果,使其具备优秀的内容理解能力,保证大模型在业务场景中快速适配和高效调用; 4、优化模型结构与训练算法,解决大模型的系统与算法中的难题, 积累行业解决方案。 职位要求: 1、计算机及相关专业; 2、具备优秀的代码能力,扎实的数据结构和基础算法功底,熟练掌握C/C++、Python、Java、Go中的1-2门,熟悉TensorFlow或者PyTorch等深度学习框架,特别是大模型训练、强化学习(RL)算法; 3、掌握大语言模型的算法原理和应用范式,如Fine-tuning、Prompt Engineering等,了解大规模分布式训练、LLM推理,能够设计和优化高并发高吞吐的在线系统,具有对话系统、推荐系统、大规模机器学习系统的实际开发经验和模型训练、部署经验; 4、熟悉Attention、Transformer、BERT、GPT等常用模型结构,熟悉LLaMA、ChatGLM、 LangChain 等开源大模型原理与实现; 5、具备独立解决复杂问题的能力,良好的沟通、问题分析和解决能力,具有团队合作精神,能够与团队共同推进技术进步。
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、探索前沿的LLM、MLLM、StableDiffusion等在端侧的落地和应用; 2、设计、调试并训练端侧某领域的大模型; 3、负责相关领域的数据收集、清洗、送标、微调、效果评估工作; 4、持续跟踪行业进展,提升团队在该领域的技术能力。 职位要求: 1、熟悉Transformers、大模型、Langchain等最新技术,有相关项目经验优先; 2、熟悉PyTorch、TensorFlow等深度学习框架; 3、良好的团队协作能力; 4、熟悉业内主流大模型原理,训练/Fine-tune策略,数据Pipeline等; 5、创新性强,有良好的动手实现能力,对技术有热情。
  • 25k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、参与端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 25k-35k 经验3-5年 / 本科
    消费生活 / 上市公司 / 2000人以上
    核心本地商业(Core ***** Commerce)是美团“零售+科技”战略的重要载体,涵盖了到餐、到综、住宿、门票度假和交通、民宿、外卖、履约配送、闪购、医药等超过200个消费场景,致力于通过“随时随地”的商品和服务,满足消费者的多样性需求,帮大家吃得更好,生活更好。核心本地商业扎根本地消费,围绕消费者的“吃、住、行、游、购、娱”进行深度创新,引领发展了即时零售、团购等多种消费业态,并在全国范围内广泛投资发展本地供给、履约平台等设施,助力创造产业、带动就业。基于多年的持续投入,核心本地商业打造了连接全国超过一千万中小微企业的服务体系,以及全球最大的即时配送网络。由核心本地商业所推行的30分钟“万物到家”体系,已覆盖全国2800多个城镇,为数亿用户提供优质的商品与服务。发展过程中,核心本地商业有效助力商超、连锁、本地小店等各类实体经济主体扩大交易规模、降低交易成本。截至目前,核心本地商业日均创造订单量数千万笔,助力千万商户实现了高质量发展。未来,核心本地商业将继续践行美团“零售+科技”战略,通过更大的投资,更多的技术创新,支持、培育消费新业态,为促进消费、服务民生、带动就业作出力所能及的贡献。欢迎优秀的你加入核心本地商业,我们携手助力市场繁荣,为用户创造更好的消费体验。 岗位职责 1.负责大模型领域的招聘工作,包括但不限于岗位需求分析、招聘计划制定、招聘渠道开拓等。 2.负责制定并执行招聘流程和策略,确保招聘工作的高效推进和顺利完成。 3.负责招聘渠道的维护和拓展,建立并维护与高校、社会招聘渠道的合作关系,保证招聘资源的充足。 4.负责筛选简历、面试和评估候选人,确保招聘流程的公平、公正。 岗位基本需求 1.大学本科及以上学历,人力资源管理、心理学、管理学等相关专业优先考虑。 2.具备4年以上人力资源招聘经验,有大模型领域招聘经验者优先。 3.熟悉招聘流程和方法,熟练掌握各种招聘渠道的使用和管理。 4.具备优秀的人际沟通和协调能力,能够有效与候选人、业务部门进行沟通和协作。 5.具备较强的组织和计划能力,能够制定并执行招聘计划,保证招聘工作的高效推进。 6.具备较强的团队合作意识和领导能力,能够带领团队共同完成招聘目标。 岗位亮点 1.丰富的大模型领域招聘经验,将参与并主导大模型领域的人才招聘工作,获得丰富的行业经验和人才资源。 2.能够与各个业务部门及候选人进行广泛的沟通和协调,提高个人的沟通协调能力和团队合作精神。 3.参与制定和完善招聘政策、流程和标准,提高招聘效率和质量,获得人力资源管理的全面能力提升。
  • 30k-60k 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责大模型技术在在文本生成、知识库建设、记忆能力、对话、推理能力增强等方面前沿技的跟进、创新,探索适合微博场景的应用解决方案; 任职要求 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2. 熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架 3. 熟悉RAG相关原理,熟悉大语言模型 SFT/RLHF 等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀; 5. 有NLP顶会论文或国际NLP比赛奖项者优先;
  • 25k-35k 经验3-5年 / 本科
    居住服务 / 上市公司 / 2000人以上
    工作职责 负责包括不限于文生图、图生图等相关模型能力建设和产品化落地 1. 负责行业数据的处理,构建高质量的训练、测试数据和评估标准; 2. 负责产品从0-1的定义,并跨部门协作推动确保产品落地; 3. 负责相关产品的用户行为分析,收集用户反馈并推动产品的持续优化和迭代; 4. 持续关注AI行业趋势和新技术,并转化为公司级产品。 任职资格 任职资格 1. 计算机、数学、人工智能等相关专业的***本科及以上学历,1年以上策略或AI产品实践经验(AIGC相关加分); 2. 具有良好的场景洞察、逻辑思维和问题解决能力,能深入业务探索大模型落地方向; 3. 定义目标和路径拆解的能力,成功主导过产品的从0-1; 4. 具备团队合作精神,良好的沟通和协作能力; 5. 产品心、创新精神、快速学习的能力和良好的抗压能力
  • 30k-50k·13薪 经验5-10年 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
  • 旅游|出行 / D轮及以上 / 500-2000人
    工作职责: 1、与数据科学家和算法工程师合作,将机器学习模型(主要使用Python开发)转化为可在生产环境中运行的服务,优先处理大模型(如深度学习、预训练语言模型等)的部署需求。 2、负责在Google Cloud Platform (GCP) 上部署和优化模型,确保其高效、稳定地运行,尤其是大规模机器学习模型的部署与优化。 3、使用GCP工具(如Compute Engine、Kubernetes Engine、Cloud Functions等)管理云服务,构建自动化和可扩展的模型服务架构。 4、开发、优化和维护模型的RESTful API,确保模型与前端应用和业务系统的无缝集成。 5、负责模型的持续集成和持续部署(CI/CD),使用GCP Cloud Build、Cloud Deploy等工具,确保开发流程的自动化和部署的稳定性。 6、分析和优化系统性能,使用GCP的监控工具(如Stackdriver)监控和调优模型推理速度及资源使用效率,特别是针对大规模数据处理场景。 职位要求: 1、编程技能:精通Python,具备将机器学习模型开发为后端服务的经验;熟悉Java、Go等其他编程语言者优先。 2、云计算技能:深度了解Google Cloud Platform (GCP),并具备在GCP上部署、管理和优化服务的实际经验。 3、机器学习框架:熟悉TensorFlow、PyTorch、scikit-learn等常见的机器学习框架,能够将算法代码与后端系统集成;有大模型(如GPT、BERT、Transformer等)相关部署和优化经验者优先。 4、DevOps:具备CI/CD实践经验,熟悉Docker、Kubernetes容器化技术,能够构建和维护容器化的微服务架构。 5、数据库管理:了解GCP中的数据库服务,如BigQuery、Cloud SQL、Firestore,具备数据库性能优化和大数据处理能力。 6、沟通协作:具备与算法团队、数据科学家紧密合作的能力,能够有效沟通技术细节并推动项目落地。
  • 旅游|出行 / D轮及以上 / 500-2000人
    我们正在寻找一名具有丰富自然语言处理(NLP)经验的算法工程师,同时需具备大模型相关的经验和知识。如果您还具备Chatbot相关的经验,那将是一个巨大的加分项。此岗位将负责开发和优化我们的AI解决方案,推动NLP和大模型技术在各类应用场景中的落地。 主要职责: 设计和优化NLP算法,提升系统的理解和生成能力。 研究和应用最新的NLP技术,解决复杂的自然语言处理问题。 开发和优化大规模机器学习和深度学习模型,提升系统性能。 与产品团队和数据科学团队紧密合作,了解业务需求并转化为技术方案。 参与大模型相关项目,推动大模型在各类应用场景中的应用。 进行数据分析和挖掘,提供数据驱动的优化建议。 编写高质量的技术文档和报告,分享研究成果和项目进展。 职位要求: 计算机科学、电子工程、数学或相关领域的本科及以上学历。 至少3年在NLP领域的工作经验。 熟悉常见的NLP技术(如分词、命名实体识别、文本分类、情感分析等)。 具有大模型相关的经验(如GPT、BERT、Transformers等)。 精通Python,熟悉TensorFlow、PyTorch等深度学习框架。 具备数据分析和处理能力,能够理解和处理大规模数据集。 良好的团队协作能力和沟通能力,能够与跨部门团队有效合作。 加分项: 有Chatbot开发和优化的实际经验。 拥有电商、金融、医疗等领域的NLP应用经验。 在学术会议或期刊发表过NLP或大模型相关论文者优先。 具有推荐系统或其他AI应用开发经验者优先。 如果你对NLP和大模型充满热情,并希望在快速发展和充满挑战的环境中成长,我们诚邀你的加入!
  • 25k-50k 经验3-5年 / 硕士
    金融 / 不需要融资 / 2000人以上
    工作职责: 1. 负责大模型原生产品的全周期管理,包括市场调研、竞品分析、产品规划、功能定义、迭代计划制定等。 2. 结合大模型技术的最新进展,把握行业趋势和客户需求,为产品方向和创新提出切实可行的建议。 3. 与研发团队紧密合作,确保AI技术和产品功能的准确实现,监控产品开发进度,确保按时交付高质量的产品迭代。 4. 设计和规划大模型原生产品的功能、路线图,确保产品目标与市场需求对齐。指导跨功能团队(技术、设计、销售等)执行产品开发计划,并确保按时发布。 5. 监控产品性能,根据客户反馈和市场数据持续优化产品特性。为高层提供产品性能报告,并就产品未来发展提供建议和策略。 任职资格: 1. 硕士及以上学历,计算机科学、人工智能、或相关专业背景。 2. 至少3年以上AI产品设计及管理经验,熟悉大模型或相关技术。 3. 强烈的产品驱动思维,具备出色的项目管理和团队协作能力。 4. 能够处理复杂的数据分析,并基于此提出改进方案。 5. 优秀的沟通能力,能够与不同背景的团队成员和利益相关者有效交流。
  • 35k-60k·16薪 经验3-5年 / 硕士
    居住服务 / 上市公司 / 2000人以上
    岗位职责: 1.建立面向大语言模型的数据去重、清洗、过滤能力。 2.高效处理海量数据,探索大语言模型的数据混合配比。 3.建立大语言模型的通用和领域评测能力。 4.持续跟进行业最新进展,不断优化提升面向大模型的数据算法能力。 任职资格: 1.计算机、人工智能、自然语言处理或相关领域的硕士或博士,能力突出的本科生。 2.具备良好的编程能力,熟练掌握Python等编程语言,掌握PyTorch等至少一种深度学习框架。 3.具备良好的沟通和团队协作能力,有较强的解决问题能力和动手能力。 4.具备1年以上相关领域的工作经验
  • 15k-18k·13薪 经验3-5年 / 大专
    工具类产品 / 上市公司 / 2000人以上
    岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
  • 25k-35k·14薪 经验1-3年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。