-
美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、负责参与 Scaling law、MoE、RLHF 、Long context 、RAG 等方向的研究。 2、负责参与训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 1、有训练过多模态 generat ive models 的经验。 2、在设计、训练机器学习模型(尤其是LLM)方面有深刻的理解。 3、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源
-
美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 负责围绕AI大模型算法的认知分析的研究工作,具体工作内容包括但不限于: 1. 深入理解大规模语言模型的模型结构、训练过程以及评测方式,根据模型的训练过程以及评测结果,对大语言模型存在的问题进行研究。 2. 深入分析模型评测结果中不符合认知的异常,根据具体的异常制定完善的研究策略,通过对比、归纳等方法,产出研究分析结论,指导模型训练优化。 3. 构建Data-Centric的数据-训练-评测闭环,探索研究包括但不限于下列方向:大模型数据、模型的Scaling Law,研究数据配比、加入方式与时机等对模型效果的影响。 4. 追踪大模型方向的前沿进展,积极主动地学习和探索新数据分析、模型训练以及模型评测方法。 5. 与各相关部门保持良好沟通,深度参与大模型预训练、SFT、RLHF和评测等阶段,共同推动大模型持续优化。 岗位基本需求 1. 硕士及以上学历,计算机、数学、统计学或相关专业; 2. 熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 3. 具有机器学习或深度学习算法的基础知识,熟练掌握自然语言处理、多模态或大模型相关算法和模型; 4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。 5. 对每一行代码负责,对业务方负责,具备工匠精神。 具备以下者优先 1. 在计算机领域顶会(如ACL、EMNLP、NeurIPS、AAAI等)上以一作发表过论文者优先; 2. 具备从事相关行业人工智能开发、算法研究等相关工作经验者优先; 3. 对ChatGPT等相关大模型有深入了解或丰富的使用经验者优先; 岗位亮点 1. 紧跟人工智能行业进展,接触到前沿技术和行业趋势,磨练出对人工智能的独到见解; 2. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能; 3. 与一流的人工智能团队合作,快速成长,提升自身能力; 4. 有机会参与公司的创新项目,跨足不同领域,拓宽人工智能技术的应用范围;
-
职位职责: 1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。 职位要求: 1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先; 2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练; 3、有领域**会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先; 4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先;出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题; 6、良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
-
职位职责: 团队介绍:飞书作为先进的企业协作与管理平台,是字节跳动在B端与企业服务领域的重要布局。不仅一站式整合办公协作套件,更提供高效的组织管理、业务管理和 AI 智能伙伴等先进工具,帮助组织和个人为 AI 时代做好准备。各行业越来越多先进企业,都选择与飞书共创行业最佳实践。先进团队,先用飞书。 1、负责飞书面向大消费(消费品牌、零售服务、本地生活)、大健康行业的市场营销工作; 2、对接、沟通与整合行业内外部资源方,独立策划落地营销活动,提高客户覆盖率; 3、关注活动MQL的转化,提高整体转化率,理顺线索到商机(市场到销售)的信息交互; 4、协调内外部行业资源,加速商机阶段推进,促进赢单。 职位要求: 1、本科及以上学历,具备较为丰富的TOB销售/市场相关工作经验,有消费零售行业经验优先; 2、熟悉软件相关行业的商业模式,具备很好的数据分析能力及洞察力; 3、有丰富的市场营销/活动/运营相关工作经验,能独立完成资源到落地的闭环; 4、结果导向,不设边界,能够交付高质量结果;擅长沟通表达,善于建立人脉关系。
-
工作职责: 1. 负责大模型原生产品的全周期管理,包括市场调研、竞品分析、产品规划、功能定义、迭代计划制定等。 2. 结合大模型技术的最新进展,把握行业趋势和客户需求,为产品方向和创新提出切实可行的建议。 3. 与研发团队紧密合作,确保AI技术和产品功能的准确实现,监控产品开发进度,确保按时交付高质量的产品迭代。 4. 设计和规划大模型原生产品的功能、路线图,确保产品目标与市场需求对齐。指导跨功能团队(技术、设计、销售等)执行产品开发计划,并确保按时发布。 5. 监控产品性能,根据客户反馈和市场数据持续优化产品特性。为高层提供产品性能报告,并就产品未来发展提供建议和策略。 任职资格: 1. 硕士及以上学历,计算机科学、人工智能、或相关专业背景。 2. 至少3年以上AI产品设计及管理经验,熟悉大模型或相关技术。 3. 强烈的产品驱动思维,具备出色的项目管理和团队协作能力。 4. 能够处理复杂的数据分析,并基于此提出改进方案。 5. 优秀的沟通能力,能够与不同背景的团队成员和利益相关者有效交流。
-
岗位职责: 1.建立面向大语言模型的数据去重、清洗、过滤能力。 2.高效处理海量数据,探索大语言模型的数据混合配比。 3.建立大语言模型的通用和领域评测能力。 4.持续跟进行业最新进展,不断优化提升面向大模型的数据算法能力。 任职资格: 1.计算机、人工智能、自然语言处理或相关领域的硕士或博士,能力突出的本科生。 2.具备良好的编程能力,熟练掌握Python等编程语言,掌握PyTorch等至少一种深度学习框架。 3.具备良好的沟通和团队协作能力,有较强的解决问题能力和动手能力。 4.具备1年以上相关领域的工作经验
-
岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
-
岗位职责: 1.负责制定大模型产品的模型效果评测方案,对微调模型的训练/推理效果、RAG知识检索增强的生成效果设计评估方法和自动化工具,保障大模型的推理效果准确性 2.通过相关工具提高模型评测的效率和覆盖率,分析和评估模型测试结果,发现模型潜在的缺陷、漏洞和性问题 3.持续关注行业的最新测试技术和方法,不断优化测试流程和工具,提高测试效率和质量 任职要求: 1.本科及以上学历,有大模型算法测试经验 2.具备扎实的Pyhon/Shell等编程基础,熟练使用linux系统 3.深入理解机器学习、深度学习相关算法评估方法,熟悉自然语言大模型LLM 训练完模型推理效果测试方法和工具 4.熟悉k8s,有云原生相关项目测试工具开发经验者、大模型评测系统自动化和大模型性能测试经验者优先 5.拥有技术激情和创新意识,快速学习能力,表达能力优秀,乐观向上
-
工作职责: 1. 使用大数据处理架构、机器学习模型进行海量数据挖掘,筛选高质量数据用于大语言模型训练; 2. 开发基于Hive、Spark、Slurm、K8s的大数据文本处理工具; 3. 负责大语言模型的量化,提升推理效率和稳定性。 任职资格: 1. 计算机、数学、统计、NLP等相关专业硕士及以上学历; 2. 有大数据处理、数据挖掘、NLP等相关项目两年以上工作经验; 3. 熟悉常用NLP算法,如GPT、BERT、FastText等; 4. 精通Linux、Hive、Spark、K8s,熟练使用Pytorch; 5. 具备扎实的专业基础和项目经验,良好的沟通能力和团队合作,认真负责、主动积极。
-
职位描述: 1. 负责以大语言模型 (LLM)、视觉语言模型 (VLM) 为核心的复杂场景理解和泛化技术。 2. 负责研究和设计以语言-动作大模型 (VLA) 在自动驾驶领域的落地,包括但不限于模型的结构、训练技术探索; 3. 负责研究基于自监督技术的自驾大模型,有效利用海量数据。 职位要求: 1. 对大模型算法研究和应用经验丰富,包括但不限于大模型的训练数据构造、模型训练、性能调优等; 2. 对大模型在自动驾驶领域有应用经验优先,包括但不限于利用大模型进行行为场景理解和规划的落地实施; 加分项 1、有计算机视觉或机器学习相关研究经验,有高水平论文发表; 2、参加kaggle或知名会议上举办的相关比赛取得优异成绩; 3、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
-
20k-40k·13薪 经验5-10年 / 本科旅游|出行 / D轮及以上 / 500-2000人工作职责: 1、与数据科学家和算法工程师合作,将机器学习模型(主要使用Python开发)转化为可在生产环境中运行的服务,优先处理大模型(如深度学习、预训练语言模型等)的部署需求。 2、负责在Google Cloud Platform (GCP) 上部署和优化模型,确保其高效、稳定地运行,尤其是大规模机器学习模型的部署与优化。 3、使用GCP工具(如Compute Engine、Kubernetes Engine、Cloud Functions等)管理云服务,构建自动化和可扩展的模型服务架构。 4、开发、优化和维护模型的RESTful API,确保模型与前端应用和业务系统的无缝集成。 5、负责模型的持续集成和持续部署(CI/CD),使用GCP Cloud Build、Cloud Deploy等工具,确保开发流程的自动化和部署的稳定性。 6、分析和优化系统性能,使用GCP的监控工具(如Stackdriver)监控和调优模型推理速度及资源使用效率,特别是针对大规模数据处理场景。 职位要求: 1、编程技能:精通Python,具备将机器学习模型开发为后端服务的经验;熟悉Java、Go等其他编程语言者优先。 2、云计算技能:深度了解Google Cloud Platform (GCP),并具备在GCP上部署、管理和优化服务的实际经验。 3、机器学习框架:熟悉TensorFlow、PyTorch、scikit-learn等常见的机器学习框架,能够将算法代码与后端系统集成;有大模型(如GPT、BERT、Transformer等)相关部署和优化经验者优先。 4、DevOps:具备CI/CD实践经验,熟悉Docker、Kubernetes容器化技术,能够构建和维护容器化的微服务架构。 5、数据库管理:了解GCP中的数据库服务,如BigQuery、Cloud SQL、Firestore,具备数据库性能优化和大数据处理能力。 6、沟通协作:具备与算法团队、数据科学家紧密合作的能力,能够有效沟通技术细节并推动项目落地。
-
岗位职责: 1. 负责大模型平台的产品设计和对外商业化落地,研究产品商业模式,指定制定产品策略,不断扩大落地规模; 2. 负责需求分析、撰写需求文档并跟进开发、测试及上线,可以与销售、运营、研发多方紧密协同,推进项目的稳步执行; 3. 掌握大模型应用的原理和流程,独立推动多业务线、算法,平台等部门对接,确保现有产品高效、高质量迭代和落地; 4. 具有优秀的沟通能力,能敏锐的挖掘外部客户的需求痛点,独立制定解决策略。 职位要求: 1. **本科或硕士以上学历,人工智能、自然语言处理、机器学习、计算机等相关专业方向,基础扎实; 2. 3年以上人工智能产品设计和开发经验,有大模型研究和落地商业化经验; 3. 对大模型、AI开发、机器学习/深度学习等开发全链路、大模型应用域景、分布式训练的相关知识有基础了解,有计算机专业或机器学习专业背景或从业经历优先; 4. 具备较强的逻辑分析能力和平台产品设计能力,了解AI平台、容器服务、GPU、LLM等方面产品和技术。有设计复杂平台系统或后台类产品等相关产品经验优先; 5. 具有优秀的沟通和团队协作能力,善于跨部门合作,推进项目落地。具有良好的项目管理和执行能力,对开发流程、标准熟悉,对技术方案、测试方案有把控力; 6. 做事认真细致,追求用户体验,独立工作能力强,有出色的问题拆解和解决能力; 7. 高度的责任心,吃苦耐劳,具有客户服务精神和团队精神; 8. 自驱、结果导向;喜欢挑战性的工作,工作激情饱满,性格开朗,能承受工作压力。
-
岗位职责: 1、从事大语言模型(LLM)预训练算法研究、训练、应用,涉及多语言、知识增强、模型性能提升等方面; 2、负责自然语言处理(NLP)方向基于GPU的并行多机多卡训练、高性能模型推理等; 3、主要从事AIGC语言内容生成工作,将先进的NLP生成技术应用于实际业务,获取业务收益,更好服务用户; 4、前沿技术跟进研究,支持公司通用类和垂类预训练模型研发及效果持续优化。 岗位要求: 1、硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上NLP相关经验,熟练使用pytorch/tensorflow深度学习框架; 2、在NLP文本生成或大模型预训练方向有较深入研究; 3、对 LLM 有深入理解和实践,有预训练、可控内容生成方向经验者优先; 4、熟练掌握GPT、T5等算法训练范式,有从0到1构建NLP大模型(百亿参数以上)经验优先; 5、有NLP顶会发表经验者(ACL/EMNLP/NAACL/SIGIR/NeurIPS等)优先; 6、具备良好的逻辑思维能力、沟通协作能力、自我学习能力。
-
1、参与开发长文本理解和生成的相关任务,通过改进文本分析策略和提高信息理解精度,加强模型在处理长文本序列场景中的应用效果。 2、开发和优化轻量化模型部署策略,利用最新的模型加速压缩技术,提升线上部署的效能,包括但不限于模型压缩、知识蒸馏。 3、持续追踪学术界和工业界的研究成果,探索在微博场景内的应用场景 岗位要求: 1. 学历背景:计算机、人工智能、数学等相关专业,本科、硕士学历。1-3年工作经验 2. 理论与实践能力:具备扎实的自然语言处理、机器学习和深度学习的理论基础与算法经验,在相关领域有顶会论文发表者优先考虑。 3. 框架与工具:熟练掌握PyTorch、transformers、vllm等主流深度学习框架,具备解决复杂业务问题并显著提升业务成果的实际经验者优先。 4. 创新与执行力:具备强大的创新思维和问题解决能力,能够应对高难度挑战,具备自我驱动与独立完成任务的能力,同时拥有优秀的沟通技巧与抗压能力。 5. 大模型相关经历:有大模型相关的项目经历,主导过大影响力项目或论文者优先
-
岗位职责: 1、负责大模型在具体业务场景下的应用研发; 2、探索大模型与具体业务的结合,编写demo尝试与验证,验证解决具体业务问题的可行性; 3、与工程开发团队对接,将大模型功能模块整合进业务流与现有业务系统中; 4、负责追踪大模型应用进展,预研前沿技术问题。 任职要求 1、熟练使用Python等编程语言、掌握Langchain,autogen 等基于LLM的编程框架; 2、了解并有能力研究Llama、ChatGLM等开源大模型的本地化部署与应用; 3、扎实的prompt engineering基本功; 4、具备深度学习领域扎实的理论基础,熟悉常见的深度学习模型和算法; 5、良好的英语读写能力,可以阅读英文文献,对前沿技术充满好奇心; 6、良好的学习能力、团队协作能力和沟通能力。
热门职位