• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育指导、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。 职位要求: 1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先; 2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练; 3、有领域**会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI 比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先; 4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先; 6、出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题;良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
  • 40k-70k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责生成式智能对话场景的算法研发,基于大模型技术建设智能化的对话机器人系统; 2、探索生成式Agent对话算法,包括大模型领域知识融入、对齐、逻辑推理和SFT等任务; 3、建设基于RAG框架的智能问答系统,优化文本&多模态理解、召回、相关性、问答生成等算法; 4、对长文本/海量文本进行深度分析、构建知识图谱,针对用户对话进行抽取事件、情感分析; 5、搭建和优化检索排序、在线生成系统,提供稳定的线上服务。 职位要求: 1、本科及以上学历,优秀的代码能力,掌握常用编程语言和算法,熟悉Pytorch或TF等框架; 2、有机器学习应用经验,有大模型、RAG、智能对话、搜索等领域丰富的实战经验,在生成式大模型、Query与用户理解、召回排序、知识图谱、智能交互中一个或多个领域有深入实践; 3、熟练掌握机器学习算法原理,能熟练运用机器学习、自然语言处理、匹配技术、运筹优化、强化学习、智能生成等技术解决有挑战性的问题,有业界项目经验或顶会论文发表者优先; 4、对数据敏感度极高,有良好的逻辑思维和定义以及解决问题的能力; 5、优秀的产品和业务感知能力,责任心强,积极主动,有良好的沟通能力和团队合作能力,能够完成有挑战的目标。
  • 25k-50k·15薪 经验3-5年 / 本科
    信息安全,企业服务 / 上市公司 / 2000人以上
    岗位职责: 1.负责制定大模型产品的模型效果评测方案,对微调模型的训练/推理效果、RAG知识检索增强的生成效果设计评估方法和自动化工具,保障大模型的推理效果准确性 2.通过相关工具提高模型评测的效率和覆盖率,分析和评估模型测试结果,发现模型潜在的缺陷、漏洞和性问题 3.持续关注行业的最新测试技术和方法,不断优化测试流程和工具,提高测试效率和质量 任职要求: 1.本科及以上学历,有大模型算法测试经验 2.具备扎实的Pyhon/Shell等编程基础,熟练使用linux系统 3.深入理解机器学习、深度学习相关算法评估方法,熟悉自然语言大模型LLM 训练完模型推理效果测试方法和工具 4.熟悉k8s,有云原生相关项目测试工具开发经验者、大模型评测系统自动化和大模型性能测试经验者优先 5.拥有技术激情和创新意识,快速学习能力,表达能力优秀,乐观向上
  • 35k-60k·16薪 经验3-5年 / 硕士
    居住服务 / 上市公司 / 2000人以上
    工作职责: 1. 负责贝壳核心房产业务AI能力建设,利用AIGC相关能力推进业务智能化重塑; 2. 深入业务调研熟悉需求场景,参与和业务、产品、工程研发等横向交流学习; 3. 保持对业务的学习能力和持续热情,能探索调研业务实际场景痛点; 4. 结合业务需求,从Prompt优化,模型finetune等方面优化AI模型效果,解决面向业务场景的应用落地问题; 任职资格: 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2.熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架,掌握大语言模型SFT/LoRA/RLHF等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀;有NLP顶会论文或国际NLP比赛奖项者优先;
  • 20k-35k·15薪 经验1-3年 / 本科
    内容资讯,社交媒体 / 不需要融资 / 2000人以上
    职位描述: 1、全链路特征工程:数据预处理、特征设计和提取 2、模型设计+训练+调优:能够针对业务场景中的复杂问题,设计并优化模型,高质量地解决业务问题 3、模型应用:负责NLP、CV、Audio、多模态相关算法研发与落地,包括但不限于文本内容结构化、多模态内容理解、信息抽取及意图理解 4、探索前沿技术在内容理解领域的应用,包括基础大模型的应用以及场景优化,提出创新技术方案,保持技术领先 任职要求: 1、研究生及以上学历,计算机、自然语言处理、统计学等相关专业优先,有大模型实习背景优先 2、熟悉特征工程、机器学习和深度学习算法、熟练掌握Python 3、较强的分析和解决问题能力,良好的沟通协作能力
  • 20k-35k·15薪 经验3-5年 / 本科
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    岗位职责: 1,负责大模型金融产品的需求调研,产品设计,规划和实际落地; 2,关注同行业竞品业务发展状况,挖掘核心需求; 3,与算法部门深度合作,进行算法与产品的联合优化; 4,结合公司战略,洞察行业生态、技术路线演进,思考和挖掘深层需求。 任职要求: 1,本科及以上学历,金融或计算机工程相关专业 2,3-5年金融业务分析师从业背景或金融软件产品背景优先; 3,充分理解金融软件产品设计细节,思路清晰,能够将需求提炼形成的可落地的产品文档; 4,较强的跨团队沟通协调能力; 5,热爱AI,愿意接受有挑战性的工作,有很强的owner意识,能主动推动项目向前。
  • 工具类产品 / 上市公司 / 2000人以上
    岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
  • 25k-50k 经验1年以下 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 负责围绕AI大模型算法的认知分析的研究工作,具体工作内容包括但不限于: 1. 深入理解大规模语言模型的模型结构、训练过程以及评测方式,根据模型的训练过程以及评测结果,对大语言模型存在的问题进行研究。 2. 深入分析模型评测结果中不符合认知的异常,根据具体的异常制定完善的研究策略,通过对比、归纳等方法,产出研究分析结论,指导模型训练优化。 3. 构建Data-Centric的数据-训练-评测闭环,探索研究包括但不限于下列方向:大模型数据、模型的Scaling Law,研究数据配比、加入方式与时机等对模型效果的影响。 4. 追踪大模型方向的前沿进展,积极主动地学习和探索新数据分析、模型训练以及模型评测方法。 5. 与各相关部门保持良好沟通,深度参与大模型预训练、SFT、RLHF和评测等阶段,共同推动大模型持续优化。 岗位基本需求 1. 硕士及以上学历,计算机、数学、统计学或相关专业; 2. 熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 3. 具有机器学习或深度学习算法的基础知识,熟练掌握自然语言处理、多模态或大模型相关算法和模型; 4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。 5. 对每一行代码负责,对业务方负责,具备工匠精神。 具备以下者优先 1. 在计算机领域顶会(如ACL、EMNLP、NeurIPS、AAAI等)上以一作发表过论文者优先; 2. 具备从事相关行业人工智能开发、算法研究等相关工作经验者优先; 3. 对ChatGPT等相关大模型有深入了解或丰富的使用经验者优先; 岗位亮点 1. 紧跟人工智能行业进展,接触到前沿技术和行业趋势,磨练出对人工智能的独到见解; 2. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能; 3. 与一流的人工智能团队合作,快速成长,提升自身能力; 4. 有机会参与公司的创新项目,跨足不同领域,拓宽人工智能技术的应用范围;
  • 50k-65k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团骑行事业部在全国各个城市开展美团单车、电单车业务,提供绿色、便捷的共享出行服务,是美团出行板块重要的组成部分。我们力求为城市可持续发展提供低碳智能的解决方案,通过技术创新和硬件升级,不断优化全流程骑行体验,为低碳出行提供更好的服务。其中,美团单车旨在为城市居民提供通勤接驳服务,满足用户短途接驳出行需求;美团电单车则满足用户中短途多场景低碳出行需求。 我们有开放的工作氛围,也有充满韧劲和创造力,心系低碳出行的伙伴。加入我们,一起为用户创造更好的出行体验。 岗位职责 1. 负责大模型在AI客服、解决方案专家等交互式对话场景中的应用,提升场景的自动化与智能化水平,改进骑行业务效率; 2. 负责大模型用于提升共享骑行业务的运营效率和用户体验,特别是在AI客服、运营优化等场景中落地 3. 负责大型语言模型的微调、偏好对齐、知识增强等技术探索,积极跟进AIGC业内应用趋势,包括并不限于MoE、RLHF、Long context、RAG、Agent等方向; 4. 与业务、产品团队合作,基于业务需求设计产品、解决方案,并推动其高效实施。 岗位基本需求 1. 计算机科学、人工智能、自然语言处理或相关专业,5年以上工作经验; 2. 扎实的算法基础,熟悉自然语言处理相关理论,熟悉Transformer/BERT/GPT/Llama等基础模型结构,熟悉大模型的微调和评估方法; 3. 熟练掌握至少一种深度学习框架,如PyTorch、TensorFlow、JAX等; 4. 善于分析和发现问题,具备较强的自驱力,具有良好的沟通能力和跨团队协作能力,热衷于追求技术创新,对解决有挑战性的问题充满激情。 具备以下者优先 1. 有ICLR、ICML、CVPR、ICCV等AI顶会、顶刊有论文发表经验,或在具有影响力的AI比赛中获得Top名次,或开源社区项目开发经验; 2. 具有生成式模型训练及开发经验,如大模型数据处理、模型微调、预训练、强化学习、AI Agent等。 3. 有LangChain、AutoGPT、GraphRAG或其他大模型框架开发经验者优先; 4. 有智能客服、智能助手相关项目经验者优先。 岗位亮点 1. 骑行业务深入参与共享单车业务核心算法开发,推动技术创新与实践。 2. 与全球名校师生合作,解决长链路复杂问题,并发表论文。 3. 与专业技术团队合作,推动大模型技术在共享出行业务中的实际应用。
  • 社交媒体 / 上市公司 / 2000人以上
    岗位职责: 1. 负责微博主站搜索业务的语义搜索技术研究和落地,包括:语义相关性、查询理解、问题生成、召回索引等核心技术 2. 基于海量用户行为数据以及人工标注数据,结合自然语言处理、大模型等前沿技术,支持Query改写、内容生成等一系列业务 3. 推进大模型技术在搜索引擎的落地,参与基础大语言模型应用研发,包括但不限于智能问答、物料扩充生成、搜索任务规划、内容优选和排序、工具调用、归纳总结、逻辑推理等能力 职位要求: 1. 熟练掌握机器学习、深度学习等方向理论和应用,动手能力强,有主动探索和思考 2. 掌握RAG、文本生成、模型蒸馏/窃取等技术,并有项目实践经验 3. 熟悉主流大模型算法,对Prompt工程、SFT、Agent等技术有实践经验 4. 熟练使用C++/Java/Python至少一门语言,较强的技术攻关能力,能够跟进领域内最新技术研究成果,并结合应用场景快速实验和调优 5. 优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情 6. 良好的沟通能力,良好的团队合作精神
  • 旅游|出行 / D轮及以上 / 500-2000人
    我们正在寻找一名具有丰富自然语言处理(NLP)经验的算法工程师,同时需具备大模型相关的经验和知识。如果您还具备Chatbot相关的经验,那将是一个巨大的加分项。此岗位将负责开发和优化我们的AI解决方案,推动NLP和大模型技术在各类应用场景中的落地。 主要职责: 设计和优化NLP算法,提升系统的理解和生成能力。 研究和应用最新的NLP技术,解决复杂的自然语言处理问题。 开发和优化大规模机器学习和深度学习模型,提升系统性能。 与产品团队和数据科学团队紧密合作,了解业务需求并转化为技术方案。 参与大模型相关项目,推动大模型在各类应用场景中的应用。 进行数据分析和挖掘,提供数据驱动的优化建议。 编写高质量的技术文档和报告,分享研究成果和项目进展。 职位要求: 计算机科学、电子工程、数学或相关领域的本科及以上学历。 至少3年在NLP领域的工作经验。 熟悉常见的NLP技术(如分词、命名实体识别、文本分类、情感分析等)。 具有大模型相关的经验(如GPT、BERT、Transformers等)。 精通Python,熟悉TensorFlow、PyTorch等深度学习框架。 具备数据分析和处理能力,能够理解和处理大规模数据集。 良好的团队协作能力和沟通能力,能够与跨部门团队有效合作。 加分项: 有Chatbot开发和优化的实际经验。 拥有电商、金融、医疗等领域的NLP应用经验。 在学术会议或期刊发表过NLP或大模型相关论文者优先。 具有推荐系统或其他AI应用开发经验者优先。 如果你对NLP和大模型充满热情,并希望在快速发展和充满挑战的环境中成长,我们诚邀你的加入!
  • 内容资讯,社交媒体 / 不需要融资 / 2000人以上
    1、参与开发长文本理解和生成的相关任务,通过改进文本分析策略和提高信息理解精度,加强模型在处理长文本序列场景中的应用效果。 2、开发和优化轻量化模型部署策略,利用最新的模型加速压缩技术,提升线上部署的效能,包括但不限于模型压缩、知识蒸馏。 3、持续追踪学术界和工业界的研究成果,探索在微博场景内的应用场景 岗位要求: 1. 学历背景:计算机、人工智能、数学等相关专业,本科、硕士学历。1-3年工作经验 2. 理论与实践能力:具备扎实的自然语言处理、机器学习和深度学习的理论基础与算法经验,在相关领域有顶会论文发表者优先考虑。 3. 框架与工具:熟练掌握PyTorch、transformers、vllm等主流深度学习框架,具备解决复杂业务问题并显著提升业务成果的实际经验者优先。 4. 创新与执行力:具备强大的创新思维和问题解决能力,能够应对高难度挑战,具备自我驱动与独立完成任务的能力,同时拥有优秀的沟通技巧与抗压能力。 5. 大模型相关经历:有大模型相关的项目经历,主导过大影响力项目或论文者优先
  • 社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 25k-35k 经验3-5年 / 本科
    居住服务 / 上市公司 / 2000人以上
    工作职责 负责包括不限于文生图、图生图等相关模型能力建设和产品化落地 1. 负责行业数据的处理,构建高质量的训练、测试数据和评估标准; 2. 负责产品从0-1的定义,并跨部门协作推动确保产品落地; 3. 负责相关产品的用户行为分析,收集用户反馈并推动产品的持续优化和迭代; 4. 持续关注AI行业趋势和新技术,并转化为公司级产品。 任职资格 任职资格 1. 计算机、数学、人工智能等相关专业的***本科及以上学历,1年以上策略或AI产品实践经验(AIGC相关加分); 2. 具有良好的场景洞察、逻辑思维和问题解决能力,能深入业务探索大模型落地方向; 3. 定义目标和路径拆解的能力,成功主导过产品的从0-1; 4. 具备团队合作精神,良好的沟通和协作能力; 5. 产品心、创新精神、快速学习的能力和良好的抗压能力
  • 旅游|出行 / D轮及以上 / 500-2000人
    工作职责 支持搜索推荐平台建设,支持酒店、景点、餐饮、租车等多业务线的入搜索需求开发,并抽象沉淀到平台能力; 深入发掘和分析业务需求,充分理解业务,抽象和设计合理的技术方案; 系统代码编写,确保系统健壮性和稳定性,高质量交付等; 持续以自动化手段提高效率。 职位要求 大学本科及以上学历,计算机或相关专业优先; 有扎实的Java技术功底,深入理解一个或多个Java/golang领域,有较强的代码编写能力; 理解技术原理,熟悉设计模式及主流开源框架,elasticsearch、mongo db、MySQL相关技术; 熟悉分布式系统的设计应用,了解多线程开发和基本的网络通信知识,3年以上互联网大型网站服务开发经验; 有过高并发,高可用系统的设计经验,或有过大型电商交易系统平台建设的经验者优先; 有过aws/aliyun上大模型部署开发经验优先。 热爱技术,对行业变化和技术有强烈的好奇心,勤奋好学,不懈努力,有良好的团队协作能力。