• 25k-35k·14薪 经验1-3年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 50k-80k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:产品覆盖今日头条、头条极速版等各类产品,为上亿用户持续提供优质的资讯、视频等服务。我们通过建立良好的内容生态,鼓励优质的原创内容,为创作者提供优质的服务和创作体验,促进创作和交流,同时我们致力于通过尽可能丰富的内容体裁和尽可能多的分发方式,连接人与信息,丰富大家的精神生活,让人们看到更大的世界。 1、参与基础大语言模型应用研发; 2、推进大模型AI能力在头条热点、AIGC等业务场景的快速落地,结合SFT/RLHF方向的前沿算法持续提升业务效果天花板; 3、关注和推进相关大模型技术在业务场景的落地,包括摘要、智能创作等。 职位要求: 1、自然语言处理、机器学习、人工智能等相关专业的硕士/博士生; 2、熟练使用Tensorflow、Pytorch等深度学习框架,扎实的编程基础,具备独立的算法实现能力; 3、有过大模型预训练、SFT、RLHF等大模型实操经验,From Scratch训练过百亿/千亿基座模型的优先; 4、有大模型领域**会议文章(NerulPS、ICLR、KDD、ICML等)者优先。
  • 40k-70k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责生成式智能对话场景的算法研发,基于大模型技术建设智能化的对话机器人系统; 2、探索生成式Agent对话算法,包括大模型领域知识融入、对齐、逻辑推理和SFT等任务; 3、建设基于RAG框架的智能问答系统,优化文本&多模态理解、召回、相关性、问答生成等算法; 4、对长文本/海量文本进行深度分析、构建知识图谱,针对用户对话进行抽取事件、情感分析; 5、搭建和优化检索排序、在线生成系统,提供稳定的线上服务。 职位要求: 1、本科及以上学历,优秀的代码能力,掌握常用编程语言和算法,熟悉Pytorch或TF等框架; 2、有机器学习应用经验,有大模型、RAG、智能对话、搜索等领域丰富的实战经验,在生成式大模型、Query与用户理解、召回排序、知识图谱、智能交互中一个或多个领域有深入实践; 3、熟练掌握机器学习算法原理,能熟练运用机器学习、自然语言处理、匹配技术、运筹优化、强化学习、智能生成等技术解决有挑战性的问题,有业界项目经验或顶会论文发表者优先; 4、对数据敏感度极高,有良好的逻辑思维和定义以及解决问题的能力; 5、优秀的产品和业务感知能力,责任心强,积极主动,有良好的沟通能力和团队合作能力,能够完成有挑战的目标。
  • 20k-30k 经验3-5年 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    岗位职责: 1.针对海量数据开发包括不局限于金融行业财富业务营销响应、流失预警等营销模型; 2.跟进实施以量化分析为基础的咨询项目,项目业务围绕财富金融业务领域,实施内容包括不局限于流程设计、业务框架设计、特征设计、模型开发、策略制定、实施部署等; 3.熟悉公司所提供的解决方案,配合商务对机构进行方案介绍与答疑;通过量化分析工具为合作机构提供决策分析报告,配合商务有效推动机构合作与落地应用; 4.对海量内部底层数据进行清洗和深度挖掘,探索有效稳定的维度/变量/模型/标签以形成标准化的产品; 任职要求: 1.本科及以上学历,211/985院校毕业优先,数学、统计学、计算机等相关专业优先; 2.具备互联网/财富营销/金融科技机构模型开发/算法/量化策略相关实习经验; 3.熟练运用Python/R进行数据分析或建模,熟练掌握数据库操作(如SQL语句); 4.了解 LR/RF/XGB/LGBM/FM 等机器学习算法的原理及其应用; 5.了解 Hadoop、Hive、Spark 的常用功能; 6.了解推荐算法中召回、排序阶段的常用模型和策略; 7.有金融行业背景、对金融行业财富营销业务有深刻理解者优先; 8.表达清晰,逻辑严谨,对数据敏感,敢于创新,善于发现、探索并解决问题; 9.具备较强独立思考能力、学习能力、自我驱动力、责任心及抗压能力;
  • 30k-50k·13薪 经验5-10年 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
  • 25k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1、参与端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 25k-50k 经验3-5年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1、负责端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、负责训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、5+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 30k-60k 经验1-3年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 30k-60k 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责大模型技术在在文本生成、知识库建设、记忆能力、对话、推理能力增强等方面前沿技的跟进、创新,探索适合微博场景的应用解决方案; 任职要求 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2. 熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架 3. 熟悉RAG相关原理,熟悉大语言模型 SFT/RLHF 等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀; 5. 有NLP顶会论文或国际NLP比赛奖项者优先;
  • 30k-40k·15薪 经验1-3年 / 硕士
    文娱丨内容 / D轮及以上 / 500-2000人
    背景: 在通用大模型开放和开源背景下,我们认为属于我们的创新机会在中间层和应用层,基于最右社区积累的海量数据优势,我们会从AI社交,AI创作两个大的方向进行产品和技术创新。 职位描述: 1. 负责大型语言模型的技术探索和实践落地,包括但不限于 CPT、SFT、DPO、GRPO 等技术 2. 从语言模型的角度,优化模型性能,关注语言模型中的幻觉、长上下文理解、指令遵循、模型评估等问题 3. 关注对话聊天场景,面向应用针对性建模和调优 4. 跟进大模型前沿最新学术研究进展,并运用到模型训练中 要求: 1. 算法及应用综合能力优秀,有大模型经验或推荐/搜索/广告算法领域的技术和实际经验 2. 具备较强的技术攻关能力,能够跟进领域内最新技术研究成果,并结合应用场景快速实验和调优 3. 理解业务目标并能进行合理拆解,具备良好的团队合作精神和沟通意识,对社区,内容平台,社交等产品领域的算法技术有强兴趣
  • 20k-30k 经验不限 / 博士
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    招聘条件: 1、获得博士学位,且获学位时间一般不超过 3 年; 2、年龄一般在 35 周岁以下,身心健康; 3、具备通信、人工智能、大数据相关专业背景,有志于在该领域开展深入研发; 4、具有良好的团队协作能力和表达能力。 岗位待遇 1、签订劳动合同 ; 2、国家博士后一次性资助; 3、支持博士后在站期间申报国家和省市级博士后人才项目和研究项目; 4、协助申请公租房; 5、优秀者协助申报各类国家、北京市人才计划
  • 20k-30k 经验3-5年 / 本科
    数据服务,信息安全 / 不需要融资 / 50-150人
    岗位要求: 本科及以上学历,计算机或者数学相关专业 具备模型微调经验 或 大模型应用开发经验 有大语言模型的数据去重、清洗、过滤经验 具备良好的编程能力,掌握Python及相关AI工具链 工作内容: 基于大模型进行微调、优化与落地 研发高效、可扩展的大模型应用
  • 20k-40k 经验5-10年 / 本科
    数据服务 / B轮 / 150-500人
    职位概览: 担任跨职能开发团队成员,负责开发创新软件解决方案,从概念设计到工程化实现。我们鼓励利用前沿的技术栈和AI结对编程的方式,不断提升软件产品质量和开发效率。 产品方向:工业领域大语言模型应用。 主要职责: - 设计和实现大模型应用产品架构,采用最佳的设计模式以提升系统稳定性和扩展性。 - 开发和维护大模型应用产品代码,确保代码的可读性、可维护性和性能。 - 设计和优化大模型应用效果,如指令调优、工作流优化、模型微调等。 - 为产品落地提供技术支持。 - 在多个项目中有效地平衡优先级,确保按时交付高质量的工作成果。 我们希望您: - 对软件开发有深厚的热爱,追求卓越的代码品味,对代码质量有着非常高的标准。 - 深入理解大语言模型应用的基本原理,能够设计和实施高性能的解决方案。 - 熟练掌握大模型应用开发技巧,提升模型性能和实用性。 - 掌握大模型应用主流开发框架,如LangChain、LlamaIndex等。 - 精通至少两种编程语言(如Python, JavaScript等),具备全栈能力。 - 有开发模型应用经验者优先。
  • 15k-30k 经验3-5年 / 本科
    金融 / 不需要融资 / 50-150人
    岗位职责: 1、 负责公司QDb、ChatFinance 等相关模型产品的开发迭代。 2、参与团队技术交流和分享,提升团队整体技术能力。 岗位要求: 1、计算机科学或相关领域的本科及以上学历,具有 3 年以上后端系统开发经验。 2、精通 Java / Python 编程语言及相关技术框架(SpringBoot、FastAPI)。 3、熟悉 LLM 相关知识。 4、熟练使用 LangChain等框架。 5、熟悉数据库设计、对数仓和数据管理概念有深入理解,具备 BI 相关知识。 6、对ChatGPT、GPT-4、QWen 等大模型有深入研究且有实际工作经验优先。 7、熟悉常见的中间件(消息队列、Nginx、Redis 等)。 8、熟悉微服务架构、Restful API 设计及实现。 9、具备良好的编码习惯,能编写高质量、可维护的代码,熟悉常见的设计模式和软件工程原则。 10、具备良好的沟通能力、团队协作精神和解决问题的能力。
  • 45k-75k 经验不限 / 硕士
    其他 / 不需要融资 / 少于15人
    1. 参与基础大语言模型应用研发; 2. 结合机器学习、强化学习等技术优化基础大语言模型 3. 调研并探索SFT/RLHF方向前沿算法、框架,持续提升现有算法的效率与效果。 任职资格: 1. 有计算机科学、数学、统计学或相关领域的硕士或博士学位; 2. 熟悉Python与深度学习框架,具有良好的编程能力和扎实的数学理论基础; 3. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我; 4. 良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力; 加分项 1. 有相关领域的开源项目、竞赛获奖、顶会论文发表/在投; 2. 熟悉LangChain、DeepSpeed等LLM开源工具,工程能力较强;