-
职位职责: 1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。 职位要求: 1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先; 2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练; 3、有领域**会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先; 4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先; 6、出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题;良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
-
20k-40k·13薪 经验5-10年 / 本科旅游|出行 / D轮及以上 / 500-2000人工作职责 支持搜索推荐平台建设,支持酒店、景点、餐饮、租车等多业务线的入搜索需求开发,并抽象沉淀到平台能力; 深入发掘和分析业务需求,充分理解业务,抽象和设计合理的技术方案; 系统代码编写,确保系统健壮性和稳定性,高质量交付等; 持续以自动化手段提高效率。 职位要求 大学本科及以上学历,计算机或相关专业优先; 有扎实的Java技术功底,深入理解一个或多个Java/golang领域,有较强的代码编写能力; 理解技术原理,熟悉设计模式及主流开源框架,elasticsearch、mongo db、MySQL相关技术; 熟悉分布式系统的设计应用,了解多线程开发和基本的网络通信知识,3年以上互联网大型网站服务开发经验; 有过高并发,高可用系统的设计经验,或有过大型电商交易系统平台建设的经验者优先; 有过aws/aliyun上大模型部署开发经验优先。 热爱技术,对行业变化和技术有强烈的好奇心,勤奋好学,不懈努力,有良好的团队协作能力。
-
岗位职责: 1. 参与跨模态大模型在自动驾驶产业中的落地,如:自驾场景下的大模型领域微调、端到端自动驾驶建模,以及开放场景下的目标检测/识别技术等; 2. 参与模型的封装、加速推理和性能优化; 3. 参与论文发表或专利申请等相关工作。 岗位基本要求: 1. 计算机科学、人工智能领域的在读硕士/博士研究生,具有扎实的深度学习与计算机视觉基础; 2. 具有优秀的编程能力,熟悉PyTorch、Tensorflow等深度学习框架,能够利用或复现模型,进行模型训练和测试; 3. 熟悉主流大模型(如CLIP、GLIP、GPT-4V等)的原理、性能表现及其差异,具备大模型相关经验者优先; 4. 具备一定的科研能力,能够承担科研推进工作,发表过人工智能领域会议或期刊者优先; 5. 实习时间超过 6 个月。
-
美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 负责围绕AI大模型算法的认知分析的研究工作,具体工作内容包括但不限于: 1. 深入理解大规模语言模型的模型结构、训练过程以及评测方式,根据模型的训练过程以及评测结果,对大语言模型存在的问题进行研究。 2. 深入分析模型评测结果中不符合认知的异常,根据具体的异常制定完善的研究策略,通过对比、归纳等方法,产出研究分析结论,指导模型训练优化。 3. 构建Data-Centric的数据-训练-评测闭环,探索研究包括但不限于下列方向:大模型数据、模型的Scaling Law,研究数据配比、加入方式与时机等对模型效果的影响。 4. 追踪大模型方向的前沿进展,积极主动地学习和探索新数据分析、模型训练以及模型评测方法。 5. 与各相关部门保持良好沟通,深度参与大模型预训练、SFT、RLHF和评测等阶段,共同推动大模型持续优化。 岗位基本需求 1. 硕士及以上学历,计算机、数学、统计学或相关专业; 2. 熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 3. 具有机器学习或深度学习算法的基础知识,熟练掌握自然语言处理、多模态或大模型相关算法和模型; 4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。 5. 对每一行代码负责,对业务方负责,具备工匠精神。 具备以下者优先 1. 在计算机领域顶会(如ACL、EMNLP、NeurIPS、AAAI等)上以一作发表过论文者优先; 2. 具备从事相关行业人工智能开发、算法研究等相关工作经验者优先; 3. 对ChatGPT等相关大模型有深入了解或丰富的使用经验者优先; 岗位亮点 1. 紧跟人工智能行业进展,接触到前沿技术和行业趋势,磨练出对人工智能的独到见解; 2. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能; 3. 与一流的人工智能团队合作,快速成长,提升自身能力; 4. 有机会参与公司的创新项目,跨足不同领域,拓宽人工智能技术的应用范围;
-
职位职责: 1、负责抖音系产品的多媒体泛质量方向下利用大模型技术解决多媒体质量的问题,包括但不限于基于MLLM设计音画质评估模型,AIGC生成内容(图像视频生成、音频生成等)理解/评估,用户体验大模型、音视频反面案例挖掘算法、多模态内容理解等方向; 2、负责深度学习模型的部署的优化工作,能够配合工程团队完成模型的上线开发和应用; 3、基于业务形态和算法技术,挖掘产品体验问题,并与产研团队密切配合,推动业务落地,提升产品用户体验; 4、跟随团队参与校企横向项目、学术论坛会议、数据科学竞赛等,协助团队构建学术/工业界影响力。 职位要求: 1、计算机、人工智能相关专业,本科及以上学历,具有深度学习相关的算法研究和落地经验,具有LLM开发和应用的实践的经历; 2、熟悉CNN/Transformer/Vit/BLIP/BERT等主流模型架构,熟练使用Pytorch、Tensorflow、Caffe、Keras等机器学习框架; 3、具备一定多模态大模型的算法经验(SFT/PE/RLHF/RAG),包括MLLM的训练、微调和评测工作,具备大模型部署实践经验,掌握vLLM、TRT等主流大模型部署框架,熟悉大模型推理优化的基本方案; 4、熟悉图像、音频等多媒体生成算法,如VAE,DIFFUSION等基本架构,了解生成模型的评估方法。 加分项: 1、具有算法工程化、模型蒸馏、模型部署,模型算子调优,SDK设计等工程经验,具备较强的工程能力; 2、在CVPR、ICCV、ECCV、ICML、NeurlIPS等机器学习和计算机视觉**会议发表文章或CVPR NTIRE、Kaggle、CCF、天池等知名数据科学竞赛取得优异成绩优先。
-
职位描述: 1. 负责以大语言模型 (LLM)、视觉语言模型 (VLM) 为核心的复杂场景理解和泛化技术。 2. 负责研究和设计以语言-动作大模型 (VLA) 在自动驾驶领域的落地,包括但不限于模型的结构、训练技术探索; 3. 负责研究基于自监督技术的自驾大模型,有效利用海量数据。 职位要求: 1. 对大模型算法研究和应用经验丰富,包括但不限于大模型的训练数据构造、模型训练、性能调优等; 2. 对大模型在自动驾驶领域有应用经验优先,包括但不限于利用大模型进行行为场景理解和规划的落地实施; 加分项 1、有计算机视觉或机器学习相关研究经验,有高水平论文发表; 2、参加kaggle或知名会议上举办的相关比赛取得优异成绩; 3、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
-
20k-40k·13薪 经验5-10年 / 本科旅游|出行 / D轮及以上 / 500-2000人工作职责: 1、与数据科学家和算法工程师合作,将机器学习模型(主要使用Python开发)转化为可在生产环境中运行的服务,优先处理大模型(如深度学习、预训练语言模型等)的部署需求。 2、负责在Google Cloud Platform (GCP) 上部署和优化模型,确保其高效、稳定地运行,尤其是大规模机器学习模型的部署与优化。 3、使用GCP工具(如Compute Engine、Kubernetes Engine、Cloud Functions等)管理云服务,构建自动化和可扩展的模型服务架构。 4、开发、优化和维护模型的RESTful API,确保模型与前端应用和业务系统的无缝集成。 5、负责模型的持续集成和持续部署(CI/CD),使用GCP Cloud Build、Cloud Deploy等工具,确保开发流程的自动化和部署的稳定性。 6、分析和优化系统性能,使用GCP的监控工具(如Stackdriver)监控和调优模型推理速度及资源使用效率,特别是针对大规模数据处理场景。 职位要求: 1、编程技能:精通Python,具备将机器学习模型开发为后端服务的经验;熟悉Java、Go等其他编程语言者优先。 2、云计算技能:深度了解Google Cloud Platform (GCP),并具备在GCP上部署、管理和优化服务的实际经验。 3、机器学习框架:熟悉TensorFlow、PyTorch、scikit-learn等常见的机器学习框架,能够将算法代码与后端系统集成;有大模型(如GPT、BERT、Transformer等)相关部署和优化经验者优先。 4、DevOps:具备CI/CD实践经验,熟悉Docker、Kubernetes容器化技术,能够构建和维护容器化的微服务架构。 5、数据库管理:了解GCP中的数据库服务,如BigQuery、Cloud SQL、Firestore,具备数据库性能优化和大数据处理能力。 6、沟通协作:具备与算法团队、数据科学家紧密合作的能力,能够有效沟通技术细节并推动项目落地。
-
职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责大模型技术在在文本生成、知识库建设、记忆能力、对话、推理能力增强等方面前沿技的跟进、创新,探索适合微博场景的应用解决方案; 任职要求 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2. 熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架 3. 熟悉RAG相关原理,熟悉大语言模型 SFT/RLHF 等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀; 5. 有NLP顶会论文或国际NLP比赛奖项者优先;
-
岗位职责: 1、从事大语言模型(LLM)预训练算法研究、训练、应用,涉及多语言、知识增强、模型性能提升等方面; 2、负责自然语言处理(NLP)方向基于GPU的并行多机多卡训练、高性能模型推理等; 3、主要从事AIGC语言内容生成工作,将先进的NLP生成技术应用于实际业务,获取业务收益,更好服务用户; 4、前沿技术跟进研究,支持公司通用类和垂类预训练模型研发及效果持续优化。 岗位要求: 1、硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上NLP相关经验,熟练使用pytorch/tensorflow深度学习框架; 2、在NLP文本生成或大模型预训练方向有较深入研究; 3、对 LLM 有深入理解和实践,有预训练、可控内容生成方向经验者优先; 4、熟练掌握GPT、T5等算法训练范式,有从0到1构建NLP大模型(百亿参数以上)经验优先; 5、有NLP顶会发表经验者(ACL/EMNLP/NAACL/SIGIR/NeurIPS等)优先; 6、具备良好的逻辑思维能力、沟通协作能力、自我学习能力。
-
工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
-
工作职责: 1. 使用大数据处理架构、机器学习模型进行海量数据挖掘,筛选高质量数据用于大语言模型训练; 2. 开发基于Hive、Spark、Slurm、K8s的大数据文本处理工具; 3. 负责大语言模型的量化,提升推理效率和稳定性。 任职资格: 1. 计算机、数学、统计、NLP等相关专业硕士及以上学历; 2. 有大数据处理、数据挖掘、NLP等相关项目两年以上工作经验; 3. 熟悉常用NLP算法,如GPT、BERT、FastText等; 4. 精通Linux、Hive、Spark、K8s,熟练使用Pytorch; 5. 具备扎实的专业基础和项目经验,良好的沟通能力和团队合作,认真负责、主动积极。
-
我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
-
工作职责 负责包括不限于文生图、图生图等相关模型能力建设和产品化落地 1. 负责行业数据的处理,构建高质量的训练、测试数据和评估标准; 2. 负责产品从0-1的定义,并跨部门协作推动确保产品落地; 3. 负责相关产品的用户行为分析,收集用户反馈并推动产品的持续优化和迭代; 4. 持续关注AI行业趋势和新技术,并转化为公司级产品。 任职资格 任职资格 1. 计算机、数学、人工智能等相关专业的***本科及以上学历,1年以上策略或AI产品实践经验(AIGC相关加分); 2. 具有良好的场景洞察、逻辑思维和问题解决能力,能深入业务探索大模型落地方向; 3. 定义目标和路径拆解的能力,成功主导过产品的从0-1; 4. 具备团队合作精神,良好的沟通和协作能力; 5. 产品心、创新精神、快速学习的能力和良好的抗压能力
-
岗位职责: 1,负责大模型金融产品的需求调研,产品设计,规划和实际落地; 2,关注同行业竞品业务发展状况,挖掘核心需求; 3,与算法部门深度合作,进行算法与产品的联合优化; 4,结合公司战略,洞察行业生态、技术路线演进,思考和挖掘深层需求。 任职要求: 1,本科及以上学历,金融或计算机工程相关专业 2,3-5年金融业务分析师从业背景或金融软件产品背景优先; 3,充分理解金融软件产品设计细节,思路清晰,能够将需求提炼形成的可落地的产品文档; 4,较强的跨团队沟通协调能力; 5,热爱AI,愿意接受有挑战性的工作,有很强的owner意识,能主动推动项目向前。
-
金蝶软件是一家全球知名的企业管理云SaaS公司,致力于成为“最值得托付的企业服务平台”。随着人工智能技术的飞速发展,金蝶已全面启动“All in AI”的产品战略,我们正在寻找一名经验丰富的大模型资深产品经理,负责洞察和规划企业场景下大模型应用的设计和落地。欢迎各位对AI技术和产品有深刻理解、具备前瞻性思维、对打造上乘大模型产品充满激情的人才加入我们。 岗位职责: 1. 市场洞察与产品规划: 负责对市场趋势进行深入分析,识别企业级客户对大模型应用的需求和挑战,规划并定义具有前瞻性的产品方向和发展路线图,确保产品能够在全球市场中保持竞争力。 2. 产品设计与开发指导: 基于企业级应用场景,指导产品团队设计和开发大模型应用特性。挑战团队创新极限,确保产品设计和功能实现能够超越企业客户的期望。 3. 跨部门协作与项目管理: 与研发、市场、销售等部门紧密合作,确保产品规划和开发进度与金蝶的“All in AI”战略一致,及时调整策略以应对市场变化,推动金蝶打造上乘的AI产品。 任职要求: 1. 产品管理经验: 5年以上的产品管理经验,具备在快速变化的技术环境中规划和管理复杂产品的能力,有大模型企业级产品经验者优先。 2. 技术理解与适应能力: 对大模型技术有深入的兴趣和理解,能够快速吸收和应用新知识,指导团队解决面临的技术挑战。 3. 沟通与领导能力: 出色的跨部门沟通和团队领导能力,能够有效地推动项目进展和团队合作。 4. 创新思维: 具有创新思维,能够面对打造上乘大模型产品的挑战,带领团队探索新技术和新方法。 金蝶软件为员工提供具有竞争力的薪资待遇、广阔的职业发展空间和学习成长机会。如果你具备上述资质,并且对推动金蝶“All in AI”战略,打造上乘的大模型产品充满热情,我们诚邀你加入我们的团队,共同开创美好未来。