-
职位职责: 1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。 职位要求: 1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先; 2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练; 3、有领域**会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先; 4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先; 6、出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题;良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
-
职位职责: 1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。 职位要求: 1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先; 2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练; 3、有领域**会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先; 4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先;出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题; 6、良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
-
岗位职责: 1、负责具体大模型应用场景开发; 2、根据业务需求编写高质量的代码实现功能; 3、参与辅助编码JetBrains插件的开发和用户问题支持,有较好的问题分析能力和归纳能力; 4、技术、产品文档编写; 5、跟进前沿技术发展,结合业务场景引进行业先进实践,保障技术先进。 任职要求: 1、本科及以上学历,计算机相关专业, 5年及以上开发经验; 2、Java:熟悉Java Spring框架开发; 3、中间件:掌握mysql、redis、kafka、es等中间件开发技术; 4、了解LangChain等大模型应用开发框架原理;熟悉大模型调优相关技术; 5、技术、产品文档编写能力; 6、沟通协作能力,解决用户问题; 7、具备优秀的沟通能力、学习能力,有强烈的上进心和主动性。
-
岗位职责: 1.负责制定大模型产品的模型效果评测方案,对微调模型的训练/推理效果、RAG知识检索增强的生成效果设计评估方法和自动化工具,保障大模型的推理效果准确性 2.通过相关工具提高模型评测的效率和覆盖率,分析和评估模型测试结果,发现模型潜在的缺陷、漏洞和性问题 3.持续关注行业的最新测试技术和方法,不断优化测试流程和工具,提高测试效率和质量 任职要求: 1.本科及以上学历,有大模型算法测试经验 2.具备扎实的Pyhon/Shell等编程基础,熟练使用linux系统 3.深入理解机器学习、深度学习相关算法评估方法,熟悉自然语言大模型LLM 训练完模型推理效果测试方法和工具 4.熟悉k8s,有云原生相关项目测试工具开发经验者、大模型评测系统自动化和大模型性能测试经验者优先 5.拥有技术激情和创新意识,快速学习能力,表达能力优秀,乐观向上
-
工作职责: 1. 负责贝壳核心房产业务AI能力建设,利用AIGC相关能力推进业务智能化重塑; 2. 深入业务调研熟悉需求场景,参与和业务、产品、工程研发等横向交流学习; 3. 保持对业务的学习能力和持续热情,能探索调研业务实际场景痛点; 4. 结合业务需求,从Prompt优化,模型finetune等方面优化AI模型效果,解决面向业务场景的应用落地问题; 任职资格: 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2.熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架,掌握大语言模型SFT/LoRA/RLHF等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀;有NLP顶会论文或国际NLP比赛奖项者优先;
-
20k-40k·13薪 经验5-10年 / 本科旅游|出行 / D轮及以上 / 500-2000人工作职责 支持搜索推荐平台建设,支持酒店、景点、餐饮、租车等多业务线的入搜索需求开发,并抽象沉淀到平台能力; 深入发掘和分析业务需求,充分理解业务,抽象和设计合理的技术方案; 系统代码编写,确保系统健壮性和稳定性,高质量交付等; 持续以自动化手段提高效率。 职位要求 大学本科及以上学历,计算机或相关专业优先; 有扎实的Java技术功底,深入理解一个或多个Java/golang领域,有较强的代码编写能力; 理解技术原理,熟悉设计模式及主流开源框架,elasticsearch、mongo db、MySQL相关技术; 熟悉分布式系统的设计应用,了解多线程开发和基本的网络通信知识,3年以上互联网大型网站服务开发经验; 有过高并发,高可用系统的设计经验,或有过大型电商交易系统平台建设的经验者优先; 有过aws/aliyun上大模型部署开发经验优先。 热爱技术,对行业变化和技术有强烈的好奇心,勤奋好学,不懈努力,有良好的团队协作能力。
-
岗位职责: 1.建立面向大语言模型的数据去重、清洗、过滤能力。 2.高效处理海量数据,探索大语言模型的数据混合配比。 3.建立大语言模型的通用和领域评测能力。 4.持续跟进行业最新进展,不断优化提升面向大模型的数据算法能力。 任职资格: 1.计算机、人工智能、自然语言处理或相关领域的硕士或博士,能力突出的本科生。 2.具备良好的编程能力,熟练掌握Python等编程语言,掌握PyTorch等至少一种深度学习框架。 3.具备良好的沟通和团队协作能力,有较强的解决问题能力和动手能力。 4.具备1年以上相关领域的工作经验
-
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1.负责制定数据运营策略,为大模型的训练提供精准有效的数据支持; 2.负责拓展数据生产方案,为大模型在生活服务场景的落地提供数据支持; 3.负责供应商采购招标,设计并实施各类数据管理机制,保证数据质量; 4.负责监测大模型在各应用场景的效果,并提出实质性的改进建议。 岗位基本需求 1.具备本科及以上学历,擅长内容创作,有数据运营相关工作经验; 2.具有良好的数据分析能力,并熟悉大模型、数据挖掘等相关领域; 3.擅长管理供应商或外包团队,能够处理跨团队的沟通协作问题; 4.强调细节并注重端到端效果,能够在快节奏的工作环境中工作,并能够应对工作压力。 具备以下者优先 对大模型方向有深刻见解的优先,有AI方向数据运营及团队管理经验的优先。 岗位亮点 紧跟业界最前沿的大模型能力,深度参与在生活服务等真实场景的落地应用。 其他补充信息 基础研发平台是美团的核心技术平台,旨在打造公司级高性能技术架构、数据科学、服务运维、开发质效提升、信息安全、视觉智能以及企业办公数字智能化等系列关键能力,持续强化平台技术,保障基础设施稳定安全、低成本、高效可持续,全面赋能公司各个业务高速发展。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。
-
我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
-
20k-40k·13薪 经验5-10年 / 本科旅游|出行 / D轮及以上 / 500-2000人工作职责: 1、与数据科学家和算法工程师合作,将机器学习模型(主要使用Python开发)转化为可在生产环境中运行的服务,优先处理大模型(如深度学习、预训练语言模型等)的部署需求。 2、负责在Google Cloud Platform (GCP) 上部署和优化模型,确保其高效、稳定地运行,尤其是大规模机器学习模型的部署与优化。 3、使用GCP工具(如Compute Engine、Kubernetes Engine、Cloud Functions等)管理云服务,构建自动化和可扩展的模型服务架构。 4、开发、优化和维护模型的RESTful API,确保模型与前端应用和业务系统的无缝集成。 5、负责模型的持续集成和持续部署(CI/CD),使用GCP Cloud Build、Cloud Deploy等工具,确保开发流程的自动化和部署的稳定性。 6、分析和优化系统性能,使用GCP的监控工具(如Stackdriver)监控和调优模型推理速度及资源使用效率,特别是针对大规模数据处理场景。 职位要求: 1、编程技能:精通Python,具备将机器学习模型开发为后端服务的经验;熟悉Java、Go等其他编程语言者优先。 2、云计算技能:深度了解Google Cloud Platform (GCP),并具备在GCP上部署、管理和优化服务的实际经验。 3、机器学习框架:熟悉TensorFlow、PyTorch、scikit-learn等常见的机器学习框架,能够将算法代码与后端系统集成;有大模型(如GPT、BERT、Transformer等)相关部署和优化经验者优先。 4、DevOps:具备CI/CD实践经验,熟悉Docker、Kubernetes容器化技术,能够构建和维护容器化的微服务架构。 5、数据库管理:了解GCP中的数据库服务,如BigQuery、Cloud SQL、Firestore,具备数据库性能优化和大数据处理能力。 6、沟通协作:具备与算法团队、数据科学家紧密合作的能力,能够有效沟通技术细节并推动项目落地。
-
美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、负责端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、负责训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、5+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
-
岗位职责: 1,负责大模型金融产品的需求调研,产品设计,规划和实际落地; 2,关注同行业竞品业务发展状况,挖掘核心需求; 3,与算法部门深度合作,进行算法与产品的联合优化; 4,结合公司战略,洞察行业生态、技术路线演进,思考和挖掘深层需求。 任职要求: 1,本科及以上学历,金融或计算机工程相关专业 2,3-5年金融业务分析师从业背景或金融软件产品背景优先; 3,充分理解金融软件产品设计细节,思路清晰,能够将需求提炼形成的可落地的产品文档; 4,较强的跨团队沟通协调能力; 5,热爱AI,愿意接受有挑战性的工作,有很强的owner意识,能主动推动项目向前。
-
工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
-
职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责大模型技术在在文本生成、知识库建设、记忆能力、对话、推理能力增强等方面前沿技的跟进、创新,探索适合微博场景的应用解决方案; 任职要求 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2. 熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架 3. 熟悉RAG相关原理,熟悉大语言模型 SFT/RLHF 等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀; 5. 有NLP顶会论文或国际NLP比赛奖项者优先;
-
岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。