-
岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 负责围绕AI大模型算法的认知分析的研究工作,具体工作内容包括但不限于: 1. 深入理解大规模语言模型的模型结构、训练过程以及评测方式,根据模型的训练过程以及评测结果,对大语言模型存在的问题进行研究。 2. 深入分析模型评测结果中不符合认知的异常,根据具体的异常制定完善的研究策略,通过对比、归纳等方法,产出研究分析结论,指导模型训练优化。 3. 构建Data-Centric的数据-训练-评测闭环,探索研究包括但不限于下列方向:大模型数据、模型的Scaling Law,研究数据配比、加入方式与时机等对模型效果的影响。 4. 追踪大模型方向的前沿进展,积极主动地学习和探索新数据分析、模型训练以及模型评测方法。 5. 与各相关部门保持良好沟通,深度参与大模型预训练、SFT、RLHF和评测等阶段,共同推动大模型持续优化。 岗位基本需求 1. 硕士及以上学历,计算机、数学、统计学或相关专业; 2. 熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 3. 具有机器学习或深度学习算法的基础知识,熟练掌握自然语言处理、多模态或大模型相关算法和模型; 4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。 5. 对每一行代码负责,对业务方负责,具备工匠精神。 具备以下者优先 1. 在计算机领域顶会(如ACL、EMNLP、NeurIPS、AAAI等)上以一作发表过论文者优先; 2. 具备从事相关行业人工智能开发、算法研究等相关工作经验者优先; 3. 对ChatGPT等相关大模型有深入了解或丰富的使用经验者优先; 岗位亮点 1. 紧跟人工智能行业进展,接触到前沿技术和行业趋势,磨练出对人工智能的独到见解; 2. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能; 3. 与一流的人工智能团队合作,快速成长,提升自身能力; 4. 有机会参与公司的创新项目,跨足不同领域,拓宽人工智能技术的应用范围;
-
美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、负责参与 Scaling law、MoE、RLHF 、Long context 、RAG 等方向的研究。 2、负责参与训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 1、有训练过多模态 generat ive models 的经验。 2、在设计、训练机器学习模型(尤其是LLM)方面有深刻的理解。 3、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源
-
职位描述: 1. 负责以大语言模型 (LLM)、视觉语言模型 (VLM) 为核心的复杂场景理解和泛化技术。 2. 负责研究和设计以语言-动作大模型 (VLA) 在自动驾驶领域的落地,包括但不限于模型的结构、训练技术探索; 3. 负责研究基于自监督技术的自驾大模型,有效利用海量数据。 职位要求: 1. 对大模型算法研究和应用经验丰富,包括但不限于大模型的训练数据构造、模型训练、性能调优等; 2. 对大模型在自动驾驶领域有应用经验优先,包括但不限于利用大模型进行行为场景理解和规划的落地实施; 加分项 1、有计算机视觉或机器学习相关研究经验,有高水平论文发表; 2、参加kaggle或知名会议上举办的相关比赛取得优异成绩; 3、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
-
职位职责: 团队介绍:我们是「豆包视频生成模型-PixelDance」团队,我们专注于开发视频生成模型,解决视频生成的关键问题,包括但不限于高动态性视频生成、内容一致性保障。构建行业领先的视频基础模型,引领技术的未来潮流。视频生成工程团队的工作涉及到模型生产的全周期流程,在这里,你有机会参与到模型的数据生产、训练加速、推理加速、服务部署的每个环节。同时你将接触到最先进的视频生成技术、海量的数据、大规模的集群,我们期待你能够和我们的模型一同Scale UP。 1、为LLM和Diffusion Model提供训练稳定性、易用性、性能和Scale up的优化; 2、能够使用Profiler手段,分析训练瓶颈,使用分布式策略调优、算子优化等手段来提升训练性能; 3、负责ByteDance Research训练优化技术的调研和引入; 4、与算法部门深度合作,进行算法与系统的联合优化。 职位要求: 1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 2、熟悉LLM、Diffusion Model任一场景的训练性能优化; 3、熟悉Pytorch、FSDP、Deepspeed、Megatron等业界主流分布框架的使用和原理,能够进行业务场景的优化,能够关注业界最新动态并进行落地; 4、熟练GPU的高性能计算优化技术,具备丰富的基于CUDA的GPU性能优化经验,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等; 5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析。
-
职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责大模型技术在在文本生成、知识库建设、记忆能力、对话、推理能力增强等方面前沿技的跟进、创新,探索适合微博场景的应用解决方案; 任职要求 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2. 熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架 3. 熟悉RAG相关原理,熟悉大语言模型 SFT/RLHF 等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀; 5. 有NLP顶会论文或国际NLP比赛奖项者优先;
-
职位职责: 1、负责字节跳动自研大模型的能力迭代,全流程参与模型训练和算法探索; 2、深度参与 AI 创新业务,从业务视角提炼模型问题,定制理想态模型数据和标准; 3、结合线上反馈、业务诉求、评测等,不断完善对模型理想态的认知,并持续优化效果。 职位要求: 1、本科及以上学历,5 年以上工作经验,有 AI 或模型相关经验者优先; 2、喜欢 AI,有好奇心,对行业前沿高度关注; 3、逻辑思维好,有团队协作能力; 4、学习和理解能力强,喜欢产品创新。
-
岗位职责: 1、针对个人及小微企业信贷业务,以促进业务发展、风险管控为目标,进行大数据分析、挖掘,形成有效的规则、模型; 2、负责客户挖掘、授信、流失、预警等信贷业务生命周期数据分析及模型开发; 3、负责信贷客户风险成因分析; 4、负责信贷业务数据分析、模型效果监控。 任职要求: 1、本科及以上学历,5年以上相关工作经验; 2、熟悉个人、小微企业信贷业务; 3、熟练掌握数据清洗、缺失处理方法; 4、熟练掌握逻辑回归建模方法; 5、熟练掌握机器学习建模方法,能理解并解释使用的机器学习算法; 6、掌握模型验证方法; 7、掌握模型效果、稳定性等模型监控方法; 8、善于归纳总结,主动跟踪学习最新的数据分析、模型开发技术、方法。
-
工作职责 1. 跟进国内外安全技术趋势, 进行一定的技术验证和评估。 2. 研究并分析安全威胁, 提出相应的解决方案。 3. 负责大模型相关的攻防技术研究,支持大模型安全检测评估。 4. 研究前沿技术在入侵检测中的应用。 5. 负责内部应用系统安全检测和评估。 任职要求 1. 熟练掌握常见攻防技术,深入理解常见漏洞原理 ,具备丰富的渗透测试实战经验,渗透测试思路清晰; 2. 至少熟练掌握Java、Python、Golang等一种编程语言,能够熟练完成漏洞分析及利用工具编写; 3. 具备人工智能背景, 云安全(k8s,docker,qemu等),信创环境测试经验者优先; 4. 对信息安全有浓厚的兴趣和热情,具备丰富的攻防实践的优先; 5. 具备良好的学习能力,积极进取,能够快速适应新技术和新环境;
-
工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
-
工作职责: 1、负责国际化金融信贷产品的模型设计、开发、测试和部署工作;模型范围覆盖反欺诈、风控、营销、运营、催收等多个业务; 2、负责外部数据测试与联合建模工作,需要设计并出具标准化的评测报告,辅助关联的业务、产品、策略等团队评估与决策; 3、负责搭建模型与数据源监控,跟踪相关应用策略效果,响应策略测算与调整需求; 4、持续关注行业动向,主动贴近业务挖掘需求;以解决问题为目标,将业务难题转化为落地的技术方案,以实际技术成果提升业务效果; 5、关注技术进展,包括机器学习、复杂数据源深度挖掘、大模型等,以开放和务实的心态探索国际化金融信贷领域应用方案的优化和升级,大胆假设并实践论证,持续提升技术效率与效能。 任职要求: 1、国内外知名大学毕业,本科及以上学历,统计/数学/计算机专业优先,有信贷模型开发工作经验优先; 2、熟练掌握各种统计模型和机器学习算法,如各类经典回归模型、分类模型等;理解LR、XGB等常用算法的基本原理;有模型调优和成功落地经验优先; 3、熟练掌握至少一门主流的建模语言,如Python,SAS,R等;熟练掌握SQL; 4、对数据和业务有足够敏感度;有不错的结构化思维和逻辑分析能力,务实进取,善于跨团队合作与沟通; 5、具备不错的英文读写能力,一定的英文沟通能力。
-
20k-40k·13薪 经验5-10年 / 本科旅游|出行 / D轮及以上 / 500-2000人工作职责: 1、与数据科学家和算法工程师合作,将机器学习模型(主要使用Python开发)转化为可在生产环境中运行的服务,优先处理大模型(如深度学习、预训练语言模型等)的部署需求。 2、负责在Google Cloud Platform (GCP) 上部署和优化模型,确保其高效、稳定地运行,尤其是大规模机器学习模型的部署与优化。 3、使用GCP工具(如Compute Engine、Kubernetes Engine、Cloud Functions等)管理云服务,构建自动化和可扩展的模型服务架构。 4、开发、优化和维护模型的RESTful API,确保模型与前端应用和业务系统的无缝集成。 5、负责模型的持续集成和持续部署(CI/CD),使用GCP Cloud Build、Cloud Deploy等工具,确保开发流程的自动化和部署的稳定性。 6、分析和优化系统性能,使用GCP的监控工具(如Stackdriver)监控和调优模型推理速度及资源使用效率,特别是针对大规模数据处理场景。 职位要求: 1、编程技能:精通Python,具备将机器学习模型开发为后端服务的经验;熟悉Java、Go等其他编程语言者优先。 2、云计算技能:深度了解Google Cloud Platform (GCP),并具备在GCP上部署、管理和优化服务的实际经验。 3、机器学习框架:熟悉TensorFlow、PyTorch、scikit-learn等常见的机器学习框架,能够将算法代码与后端系统集成;有大模型(如GPT、BERT、Transformer等)相关部署和优化经验者优先。 4、DevOps:具备CI/CD实践经验,熟悉Docker、Kubernetes容器化技术,能够构建和维护容器化的微服务架构。 5、数据库管理:了解GCP中的数据库服务,如BigQuery、Cloud SQL、Firestore,具备数据库性能优化和大数据处理能力。 6、沟通协作:具备与算法团队、数据科学家紧密合作的能力,能够有效沟通技术细节并推动项目落地。
-
岗位职责: 1. 负责大模型平台的产品设计和对外商业化落地,研究产品商业模式,指定制定产品策略,不断扩大落地规模; 2. 负责需求分析、撰写需求文档并跟进开发、测试及上线,可以与销售、运营、研发多方紧密协同,推进项目的稳步执行; 3. 掌握大模型应用的原理和流程,独立推动多业务线、算法,平台等部门对接,确保现有产品高效、高质量迭代和落地; 4. 具有优秀的沟通能力,能敏锐的挖掘外部客户的需求痛点,独立制定解决策略。 职位要求: 1. **本科或硕士以上学历,人工智能、自然语言处理、机器学习、计算机等相关专业方向,基础扎实; 2. 3年以上人工智能产品设计和开发经验,有大模型研究和落地商业化经验; 3. 对大模型、AI开发、机器学习/深度学习等开发全链路、大模型应用域景、分布式训练的相关知识有基础了解,有计算机专业或机器学习专业背景或从业经历优先; 4. 具备较强的逻辑分析能力和平台产品设计能力,了解AI平台、容器服务、GPU、LLM等方面产品和技术。有设计复杂平台系统或后台类产品等相关产品经验优先; 5. 具有优秀的沟通和团队协作能力,善于跨部门合作,推进项目落地。具有良好的项目管理和执行能力,对开发流程、标准熟悉,对技术方案、测试方案有把控力; 6. 做事认真细致,追求用户体验,独立工作能力强,有出色的问题拆解和解决能力; 7. 高度的责任心,吃苦耐劳,具有客户服务精神和团队精神; 8. 自驱、结果导向;喜欢挑战性的工作,工作激情饱满,性格开朗,能承受工作压力。
-
30k-50k 经验5-10年 / 本科旅游|出行 / D轮及以上 / 500-2000人我们正在寻找一名具有丰富自然语言处理(NLP)经验的算法工程师,同时需具备大模型相关的经验和知识。如果您还具备Chatbot相关的经验,那将是一个巨大的加分项。此岗位将负责开发和优化我们的AI解决方案,推动NLP和大模型技术在各类应用场景中的落地。 主要职责: 设计和优化NLP算法,提升系统的理解和生成能力。 研究和应用最新的NLP技术,解决复杂的自然语言处理问题。 开发和优化大规模机器学习和深度学习模型,提升系统性能。 与产品团队和数据科学团队紧密合作,了解业务需求并转化为技术方案。 参与大模型相关项目,推动大模型在各类应用场景中的应用。 进行数据分析和挖掘,提供数据驱动的优化建议。 编写高质量的技术文档和报告,分享研究成果和项目进展。 职位要求: 计算机科学、电子工程、数学或相关领域的本科及以上学历。 至少3年在NLP领域的工作经验。 熟悉常见的NLP技术(如分词、命名实体识别、文本分类、情感分析等)。 具有大模型相关的经验(如GPT、BERT、Transformers等)。 精通Python,熟悉TensorFlow、PyTorch等深度学习框架。 具备数据分析和处理能力,能够理解和处理大规模数据集。 良好的团队协作能力和沟通能力,能够与跨部门团队有效合作。 加分项: 有Chatbot开发和优化的实际经验。 拥有电商、金融、医疗等领域的NLP应用经验。 在学术会议或期刊发表过NLP或大模型相关论文者优先。 具有推荐系统或其他AI应用开发经验者优先。 如果你对NLP和大模型充满热情,并希望在快速发展和充满挑战的环境中成长,我们诚邀你的加入!
-
工作职责 1. 负责开发、维护基于GPT类自回归及Bert类非自回归NLP模型数字化产品;涉及模型设计、训练、调试等核心工作; 2. 参与后台开发,进行技术调研、可行性分析以及系统与流程结构设计,确保模型的有效落地及性能优化; 3.负责数据处理和模型训练流程,从样本筛选到数据增强,不断提升模型性能和应用效果; 4.与产品团队及前后端紧密合作,深度理解客户需求,利用先进的语言模型技术解决实际业务问题。 任职要求 1. 硕士及以上学历,计算机科学、人工智能、语言学或相关专业; 2. 必须具备深厚的NLP领域知识,熟练掌握Bert类等传统大语言模型及GPT生成类大语言模型等技术; 3. 优秀的Python编程技能和工程化能力,有实际的模型开发到部署经验; 4.对技术研究和经济金融实际问题的解决充满热情,具有自我驱动力,强烈责任心,以及良好的抗压能力。 加分项: 1. 有在经济金融领域内模型研发及应用的实践经验,并能独立解决行业问题; 2.对经济金融市场运作有深入了解,能将技术应用于市场分析、风险评估等方面; 3.成功的项目案例,尤其是在智能数据问答、智能报告等AI产品上的实践经验; 4.熟悉模型优化、自然语言处理的最新进展和技术动态。