-
职位职责: 1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。 职位要求: 1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先; 2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练; 3、有领域**会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先; 4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先;出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题; 6、良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
-
职位职责: 1、负责抖音系产品的多媒体泛质量方向下利用大模型技术解决多媒体质量的问题,包括但不限于基于MLLM设计音画质评估模型,AIGC生成内容(图像视频生成、音频生成等)理解/评估,用户体验大模型、音视频反面案例挖掘算法、多模态内容理解等方向; 2、负责深度学习模型的部署的优化工作,能够配合工程团队完成模型的上线开发和应用; 3、基于业务形态和算法技术,挖掘产品体验问题,并与产研团队密切配合,推动业务落地,提升产品用户体验; 4、跟随团队参与校企横向项目、学术论坛会议、数据科学竞赛等,协助团队构建学术/工业界影响力。 职位要求: 1、计算机、人工智能相关专业,本科及以上学历,具有深度学习相关的算法研究和落地经验,具有LLM开发和应用的实践的经历; 2、熟悉CNN/Transformer/Vit/BLIP/BERT等主流模型架构,熟练使用Pytorch、Tensorflow、Caffe、Keras等机器学习框架; 3、具备一定多模态大模型的算法经验(SFT/PE/RLHF/RAG),包括MLLM的训练、微调和评测工作,具备大模型部署实践经验,掌握vLLM、TRT等主流大模型部署框架,熟悉大模型推理优化的基本方案; 4、熟悉图像、音频等多媒体生成算法,如VAE,DIFFUSION等基本架构,了解生成模型的评估方法。 加分项: 1、具有算法工程化、模型蒸馏、模型部署,模型算子调优,SDK设计等工程经验,具备较强的工程能力; 2、在CVPR、ICCV、ECCV、ICML、NeurlIPS等机器学习和计算机视觉**会议发表文章或CVPR NTIRE、Kaggle、CCF、天池等知名数据科学竞赛取得优异成绩优先。
-
工作职责: 1. 负责大模型原生产品的全周期管理,包括市场调研、竞品分析、产品规划、功能定义、迭代计划制定等。 2. 结合大模型技术的最新进展,把握行业趋势和客户需求,为产品方向和创新提出切实可行的建议。 3. 与研发团队紧密合作,确保AI技术和产品功能的准确实现,监控产品开发进度,确保按时交付高质量的产品迭代。 4. 设计和规划大模型原生产品的功能、路线图,确保产品目标与市场需求对齐。指导跨功能团队(技术、设计、销售等)执行产品开发计划,并确保按时发布。 5. 监控产品性能,根据客户反馈和市场数据持续优化产品特性。为高层提供产品性能报告,并就产品未来发展提供建议和策略。 任职资格: 1. 硕士及以上学历,计算机科学、人工智能、或相关专业背景。 2. 至少3年以上AI产品设计及管理经验,熟悉大模型或相关技术。 3. 强烈的产品驱动思维,具备出色的项目管理和团队协作能力。 4. 能够处理复杂的数据分析,并基于此提出改进方案。 5. 优秀的沟通能力,能够与不同背景的团队成员和利益相关者有效交流。
-
岗位职责: 1.建立面向大语言模型的数据去重、清洗、过滤能力。 2.高效处理海量数据,探索大语言模型的数据混合配比。 3.建立大语言模型的通用和领域评测能力。 4.持续跟进行业最新进展,不断优化提升面向大模型的数据算法能力。 任职资格: 1.计算机、人工智能、自然语言处理或相关领域的硕士或博士,能力突出的本科生。 2.具备良好的编程能力,熟练掌握Python等编程语言,掌握PyTorch等至少一种深度学习框架。 3.具备良好的沟通和团队协作能力,有较强的解决问题能力和动手能力。 4.具备1年以上相关领域的工作经验
-
岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
-
岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
岗位职责: 1.负责制定大模型产品的模型效果评测方案,对微调模型的训练/推理效果、RAG知识检索增强的生成效果设计评估方法和自动化工具,保障大模型的推理效果准确性 2.通过相关工具提高模型评测的效率和覆盖率,分析和评估模型测试结果,发现模型潜在的缺陷、漏洞和性问题 3.持续关注行业的最新测试技术和方法,不断优化测试流程和工具,提高测试效率和质量 任职要求: 1.本科及以上学历,有大模型算法测试经验 2.具备扎实的Pyhon/Shell等编程基础,熟练使用linux系统 3.深入理解机器学习、深度学习相关算法评估方法,熟悉自然语言大模型LLM 训练完模型推理效果测试方法和工具 4.熟悉k8s,有云原生相关项目测试工具开发经验者、大模型评测系统自动化和大模型性能测试经验者优先 5.拥有技术激情和创新意识,快速学习能力,表达能力优秀,乐观向上
-
工作职责: 1. 负责贝壳核心房产业务AI能力建设,利用AIGC相关能力推进业务智能化重塑; 2. 深入业务调研熟悉需求场景,参与和业务、产品、工程研发等横向交流学习; 3. 保持对业务的学习能力和持续热情,能探索调研业务实际场景痛点; 4. 结合业务需求,从Prompt优化,模型finetune等方面优化AI模型效果,解决面向业务场景的应用落地问题; 任职资格: 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2.熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架,掌握大语言模型SFT/LoRA/RLHF等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀;有NLP顶会论文或国际NLP比赛奖项者优先;
-
岗位职责: 1. 参与跨模态大模型在自动驾驶产业中的落地,如:自驾场景下的大模型领域微调、端到端自动驾驶建模,以及开放场景下的目标检测/识别技术等; 2. 参与模型的封装、加速推理和性能优化; 3. 参与论文发表或专利申请等相关工作。 岗位基本要求: 1. 计算机科学、人工智能领域的在读硕士/博士研究生,具有扎实的深度学习与计算机视觉基础; 2. 具有优秀的编程能力,熟悉PyTorch、Tensorflow等深度学习框架,能够利用或复现模型,进行模型训练和测试; 3. 熟悉主流大模型(如CLIP、GLIP、GPT-4V等)的原理、性能表现及其差异,具备大模型相关经验者优先; 4. 具备一定的科研能力,能够承担科研推进工作,发表过人工智能领域会议或期刊者优先; 5. 实习时间超过 6 个月。
-
岗位职责: 1,负责大模型金融产品的需求调研,产品设计,规划和实际落地; 2,关注同行业竞品业务发展状况,挖掘核心需求; 3,与算法部门深度合作,进行算法与产品的联合优化; 4,结合公司战略,洞察行业生态、技术路线演进,思考和挖掘深层需求。 任职要求: 1,本科及以上学历,金融或计算机工程相关专业 2,3-5年金融业务分析师从业背景或金融软件产品背景优先; 3,充分理解金融软件产品设计细节,思路清晰,能够将需求提炼形成的可落地的产品文档; 4,较强的跨团队沟通协调能力; 5,热爱AI,愿意接受有挑战性的工作,有很强的owner意识,能主动推动项目向前。
-
金蝶软件是一家全球知名的企业管理云SaaS公司,致力于成为“最值得托付的企业服务平台”。随着人工智能技术的飞速发展,金蝶已全面启动“All in AI”的产品战略,我们正在寻找一名经验丰富的大模型资深产品经理,负责洞察和规划企业场景下大模型应用的设计和落地。欢迎各位对AI技术和产品有深刻理解、具备前瞻性思维、对打造上乘大模型产品充满激情的人才加入我们。 岗位职责: 1. 市场洞察与产品规划: 负责对市场趋势进行深入分析,识别企业级客户对大模型应用的需求和挑战,规划并定义具有前瞻性的产品方向和发展路线图,确保产品能够在全球市场中保持竞争力。 2. 产品设计与开发指导: 基于企业级应用场景,指导产品团队设计和开发大模型应用特性。挑战团队创新极限,确保产品设计和功能实现能够超越企业客户的期望。 3. 跨部门协作与项目管理: 与研发、市场、销售等部门紧密合作,确保产品规划和开发进度与金蝶的“All in AI”战略一致,及时调整策略以应对市场变化,推动金蝶打造上乘的AI产品。 任职要求: 1. 产品管理经验: 5年以上的产品管理经验,具备在快速变化的技术环境中规划和管理复杂产品的能力,有大模型企业级产品经验者优先。 2. 技术理解与适应能力: 对大模型技术有深入的兴趣和理解,能够快速吸收和应用新知识,指导团队解决面临的技术挑战。 3. 沟通与领导能力: 出色的跨部门沟通和团队领导能力,能够有效地推动项目进展和团队合作。 4. 创新思维: 具有创新思维,能够面对打造上乘大模型产品的挑战,带领团队探索新技术和新方法。 金蝶软件为员工提供具有竞争力的薪资待遇、广阔的职业发展空间和学习成长机会。如果你具备上述资质,并且对推动金蝶“All in AI”战略,打造上乘的大模型产品充满热情,我们诚邀你加入我们的团队,共同开创美好未来。
-
岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
-
美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、负责参与 Scaling law、MoE、RLHF 、Long context 、RAG 等方向的研究。 2、负责参与训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 1、有训练过多模态 generat ive models 的经验。 2、在设计、训练机器学习模型(尤其是LLM)方面有深刻的理解。 3、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源
-
20k-40k·13薪 经验5-10年 / 本科旅游|出行 / D轮及以上 / 500-2000人工作职责 支持搜索推荐平台建设,支持酒店、景点、餐饮、租车等多业务线的入搜索需求开发,并抽象沉淀到平台能力; 深入发掘和分析业务需求,充分理解业务,抽象和设计合理的技术方案; 系统代码编写,确保系统健壮性和稳定性,高质量交付等; 持续以自动化手段提高效率。 职位要求 大学本科及以上学历,计算机或相关专业优先; 有扎实的Java技术功底,深入理解一个或多个Java/golang领域,有较强的代码编写能力; 理解技术原理,熟悉设计模式及主流开源框架,elasticsearch、mongo db、MySQL相关技术; 熟悉分布式系统的设计应用,了解多线程开发和基本的网络通信知识,3年以上互联网大型网站服务开发经验; 有过高并发,高可用系统的设计经验,或有过大型电商交易系统平台建设的经验者优先; 有过aws/aliyun上大模型部署开发经验优先。 热爱技术,对行业变化和技术有强烈的好奇心,勤奋好学,不懈努力,有良好的团队协作能力。
-
我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验