-
职位职责: 1、设计、实施和维护高可用、高性能的豆包大模型服务架构; 2、使用Terraform和其他IaC工具管理和自动化云基础设施部署; 3、开发和优化自动化运维工具,提高模型部署效率和系统可靠性; 4、优化大规模分布式模型训练和推理的基础设施; 5、与AI研究团队密切合作,确保新模型和功能的顺利部署和稳定运行; 6、使用Terraform管理多云环境,确保基础设施的一致性和可重复性。 职位要求: 1、本科及以上学历,计算机相关专业,3年以上云计算或者大模型领域的开发或稳定性建设经验; 2、熟练掌握Python/Golang/Java中的一种语言,具备云原生相关技术栈。 加分项: 1、了解机器学习模型部署和服务化的最佳实践; 2、具备在多云环境(如AWS,GCP,Azure)中工作的经验; 3、熟悉 CI/CD 流程,有使用Jenkins,GitLab CI等工具的经验; 4、有大语言模型或其他AI大模型相关运维经验。
-
工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
-
职位职责: 1、负责汽车行业领域大模型的质量保障工作,其中包含软件的需求分析、模型评测、效果评估等,支持行业内的工程化落地; 2、负责汽车行业领域大模型的测试基建、评测体系的建设,提升业务评测效率和质量; 3、负责大模型业务测试数据的分析和统计,对模型结果、过程数据进行分析、提取、统计; 4、根据产品设计制定测试计划、风险评估、设计测试数据和测试用例,执行测试用例,进行 bug 追踪等; 5、对大模型以及相关方向(如 NLP、CV、多模态等)的前沿技术、评测体系进行持续跟踪和调研。 职位要求: 1、本科及以上学历,计算机、通信、统计等相关专业三年以上工作经验; 2、熟悉 NLP、深度学习、生成式语言大模型等基本原理和技术,熟悉常见的评测指标、效果评估方法; 3、熟悉掌握 Python/Shell 等语言中的一门或者多门; 4、具有良好的沟通能力和团队合作精神、快速的学习能力,具备一定的抗压能力和强烈的责任心; 5、有过 AI 类产品的质量保障工作经历或算法评测经验最佳; 6、有汽车行业相关经验、ToB 交付业务经验。
-
工作职责 负责包括不限于文生图、图生图等相关模型能力建设和产品化落地 1. 负责行业数据的处理,构建高质量的训练、测试数据和评估标准; 2. 负责产品从0-1的定义,并跨部门协作推动确保产品落地; 3. 负责相关产品的用户行为分析,收集用户反馈并推动产品的持续优化和迭代; 4. 持续关注AI行业趋势和新技术,并转化为公司级产品。 任职资格 任职资格 1. 计算机、数学、人工智能等相关专业的***本科及以上学历,1年以上策略或AI产品实践经验(AIGC相关加分); 2. 具有良好的场景洞察、逻辑思维和问题解决能力,能深入业务探索大模型落地方向; 3. 定义目标和路径拆解的能力,成功主导过产品的从0-1; 4. 具备团队合作精神,良好的沟通和协作能力; 5. 产品心、创新精神、快速学习的能力和良好的抗压能力
-
工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
-
招聘条件: 1、获得博士学位,且获学位时间一般不超过 3 年; 2、年龄一般在 35 周岁以下,身心健康; 3、具备通信、人工智能、大数据相关专业背景,有志于在该领域开展深入研发; 4、具有良好的团队协作能力和表达能力。 岗位待遇 1、签订劳动合同 ; 2、国家博士后一次性资助; 3、支持博士后在站期间申报国家和省市级博士后人才项目和研究项目; 4、协助申请公租房; 5、优秀者协助申报各类国家、北京市人才计划
-
岗位职责: 1、 负责公司QDb、ChatFinance 等相关模型产品的开发迭代。 2、参与团队技术交流和分享,提升团队整体技术能力。 岗位要求: 1、计算机科学或相关领域的本科及以上学历,具有 3 年以上后端系统开发经验。 2、精通 Java / Python 编程语言及相关技术框架(SpringBoot、FastAPI)。 3、熟悉 LLM 相关知识。 4、熟练使用 LangChain等框架。 5、熟悉数据库设计、对数仓和数据管理概念有深入理解,具备 BI 相关知识。 6、对ChatGPT、GPT-4、QWen 等大模型有深入研究且有实际工作经验优先。 7、熟悉常见的中间件(消息队列、Nginx、Redis 等)。 8、熟悉微服务架构、Restful API 设计及实现。 9、具备良好的编码习惯,能编写高质量、可维护的代码,熟悉常见的设计模式和软件工程原则。 10、具备良好的沟通能力、团队协作精神和解决问题的能力。
-
岗位职责: 1.建立面向大语言模型的数据去重、清洗、过滤能力。 2.高效处理海量数据,探索大语言模型的数据混合配比。 3.建立大语言模型的通用和领域评测能力。 4.持续跟进行业最新进展,不断优化提升面向大模型的数据算法能力。 任职资格: 1.计算机、人工智能、自然语言处理或相关领域的硕士或博士,能力突出的本科生。 2.具备良好的编程能力,熟练掌握Python等编程语言,掌握PyTorch等至少一种深度学习框架。 3.具备良好的沟通和团队协作能力,有较强的解决问题能力和动手能力。 4.具备1年以上相关领域的工作经验
-
岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
岗位职责: 1. 参与跨模态大模型在自动驾驶产业中的落地,如:自驾场景下的大模型领域微调、端到端自动驾驶建模,以及开放场景下的目标检测/识别技术等; 2. 参与模型的封装、加速推理和性能优化; 3. 参与论文发表或专利申请等相关工作。 岗位基本要求: 1. 计算机科学、人工智能领域的在读硕士/博士研究生,具有扎实的深度学习与计算机视觉基础; 2. 具有优秀的编程能力,熟悉PyTorch、Tensorflow等深度学习框架,能够利用或复现模型,进行模型训练和测试; 3. 熟悉主流大模型(如CLIP、GLIP、GPT-4V等)的原理、性能表现及其差异,具备大模型相关经验者优先; 4. 具备一定的科研能力,能够承担科研推进工作,发表过人工智能领域会议或期刊者优先; 5. 实习时间超过 6 个月。
-
我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
-
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 1、参与端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
-
职位描述: 1. 负责以大语言模型 (LLM)、视觉语言模型 (VLM) 为核心的复杂场景理解和泛化技术。 2. 负责研究和设计以语言-动作大模型 (VLA) 在自动驾驶领域的落地,包括但不限于模型的结构、训练技术探索; 3. 负责研究基于自监督技术的自驾大模型,有效利用海量数据。 职位要求: 1. 对大模型算法研究和应用经验丰富,包括但不限于大模型的训练数据构造、模型训练、性能调优等; 2. 对大模型在自动驾驶领域有应用经验优先,包括但不限于利用大模型进行行为场景理解和规划的落地实施; 加分项 1、有计算机视觉或机器学习相关研究经验,有高水平论文发表; 2、参加kaggle或知名会议上举办的相关比赛取得优异成绩; 3、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
-
职位概览: 担任跨职能开发团队成员,负责开发创新软件解决方案,从概念设计到工程化实现。我们鼓励利用前沿的技术栈和AI结对编程的方式,不断提升软件产品质量和开发效率。 产品方向:工业领域大语言模型应用。 主要职责: - 设计和实现大模型应用产品架构,采用最佳的设计模式以提升系统稳定性和扩展性。 - 开发和维护大模型应用产品代码,确保代码的可读性、可维护性和性能。 - 设计和优化大模型应用效果,如指令调优、工作流优化、模型微调等。 - 为产品落地提供技术支持。 - 在多个项目中有效地平衡优先级,确保按时交付高质量的工作成果。 我们希望您: - 对软件开发有深厚的热爱,追求卓越的代码品味,对代码质量有着非常高的标准。 - 深入理解大语言模型应用的基本原理,能够设计和实施高性能的解决方案。 - 熟练掌握大模型应用开发技巧,提升模型性能和实用性。 - 掌握大模型应用主流开发框架,如LangChain、LlamaIndex等。 - 精通至少两种编程语言(如Python, JavaScript等),具备全栈能力。 - 有开发模型应用经验者优先。
-
岗位职责: 负责设计⼤语⾔模型的技术⽅案并落地到⾏业客户的垂直场景中。典型场景包括但不限于多轮对话、 Document QA、结构化信息抽取、私有函数调⽤、AIAgent等等; 负责⼤语⾔模型技术⽅案的端到端研发,包括但不限于⽅案设计、数据准备及处理、⾏业模型训练、指令精 调、模型性能提升、模型效果评测等; 跟踪并分析业内最新研究成果和技术动态,持续优化和改进现有模型和技术⽅案;基于NLP⼤模型探索下⼀ 代语义技术,构建⾏业领先的多模态语义核⼼能⼒; 根据业务需求,与外部团队开展技术交流与沟通; 岗位要求: 计算机相关专业硕⼟及以上学历,有论⽂复现能⼒和算法⼯程交付经验; 精熟练掌握C++、Python等编程语⾔的⼀种或多种,具备良好的编码能⼒,有⼤型⼯程项⽬经验; 熟悉多种⾃然语⾔处理任务,如问答系统,序列标注,情感分析,摘要⽣成及抽取,知识图谱等。有从0到1 构建的⾃然语⾔处理任务的⼯程经验; 了解NLP主流预训练语⾔模型2(GPT/LLaMA/GLM/Bloom/BERT/Qwen),熟练掌握主流深度学习框架 Pytorch; 有团队意识,有良好的⽂档习惯和合作意识; 加分项: 有⼤模型训练框架Deepspeed/ColossalAl/LLaMA Factory使⽤经验者优先; 有垂直领域⼤模型PT、Continue PT、SFT、RLHF经验者优先;