• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。 职位要求: 1、计算机相关专业本科及以上学历,1年以上算法研发工作经验,有相关方向技术和研究背景的候选人优先; 2、优秀的代码能力、数据结构和基础算法功底,C/C++或Python熟练; 3、有领域**会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、有编程/AI比赛获奖(ACM/ICPC、NOI/IOI、Top Coder、Kaggle等)优先; 4、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 5、在大模型领域,主导参与过大影响力的项目或论文者优先;出色的独立分析和解决问题的能力,能深入解决大模型优化和应用存在的问题; 6、良好自驱力和沟通协作能力,能和团队一起探索新技术,推进技术进步。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、结合对云平台异构类AI加速器(GPU)应用特点,深入理解及上层应用迭代路标,整理输出清晰的GPU类硬件产品规划路标,确保硬件方案的领先性; 2、负责异构类GPU产品业务场景资源需求画像、跨代跨平台场景化性能收益测试验证,设计性能测试方案,执行性能测试,针对系统性能瓶颈分析,提出调优建议并协助调试验证完成,输出性能测试报告;协调解决新硬件、新技术落地过程中遇到的技术问题; 3、异构类GPU产品业务场景收益对比评估,确定选型方案,输出方案迭代标准算力/资源折算方案; 4、结合产业链的最新技术能力和硬件产品架构特点,提供综合竞争力领先的异构硬件解决方案,输出自主研发硬件服务器产品资料; 5、监控和分析异构云硬件在实际应用中的质量、性能表现,并提供系统的技术支持能力,推动改进识别和落地。 职位要求: 1、本科及以上学历,电子工程或者计算机相关专业,5年及以上异构领域的硬件开发、测试或性能调优基础经验; 2、良好的Unix/Linux操作系统基础及熟练使用常用命令,具备独立分析定位问题、分析和解决问题的能力; 3、熟悉各类常见异构类平台,如大模型训练、GPU推理场景等硬件平台;熟悉主流厂商服务器硬件产品组件,如处理器、硬盘、网卡、SAS卡及测试方法,熟悉掌握Speccpu/Fio/Iperf/Stream/Mlc/lmbench/MLperf等工具及相关调优手段;深入理解操作系统内核、虚拟化、GPU架构原理、DPDK等技术原理; 4、具有直接的互联网业务组件/场景的性能测试开发经验更好,精通压力、负载测试; 5、具备较强的团队沟通和协作能力,有较强的全局视野、沟通组织能力、项目推动能力;具备较强的学习能力和逻辑思维能力,关注前沿技术,较好的团队协作及团队意识,有较强的责任心和执行力,工作态度积极向上,具备正能量; 6、对ToB产品的端到端交付过程、产品逻辑有较系统的理解。
  • 25k-50k 经验3-5年 / 硕士
    金融 / 不需要融资 / 2000人以上
    工作职责: 1. 负责大模型原生产品的全周期管理,包括市场调研、竞品分析、产品规划、功能定义、迭代计划制定等。 2. 结合大模型技术的最新进展,把握行业趋势和客户需求,为产品方向和创新提出切实可行的建议。 3. 与研发团队紧密合作,确保AI技术和产品功能的准确实现,监控产品开发进度,确保按时交付高质量的产品迭代。 4. 设计和规划大模型原生产品的功能、路线图,确保产品目标与市场需求对齐。指导跨功能团队(技术、设计、销售等)执行产品开发计划,并确保按时发布。 5. 监控产品性能,根据客户反馈和市场数据持续优化产品特性。为高层提供产品性能报告,并就产品未来发展提供建议和策略。 任职资格: 1. 硕士及以上学历,计算机科学、人工智能、或相关专业背景。 2. 至少3年以上AI产品设计及管理经验,熟悉大模型或相关技术。 3. 强烈的产品驱动思维,具备出色的项目管理和团队协作能力。 4. 能够处理复杂的数据分析,并基于此提出改进方案。 5. 优秀的沟通能力,能够与不同背景的团队成员和利益相关者有效交流。
  • 25k-35k·14薪 经验1-3年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 23k-35k 经验3-5年 / 硕士
    软件服务|咨询 / 上市公司 / 2000人以上
    一、公司简介 彩讯股份(创业板股票代码:300634)是一家软件互联网上市公司,是协同办公、 智慧渠道、云和大数据领域的龙头企业。拥有五地研发中心和遍布全国的运营网络,员工超过 3000 人。 公司坚持“以大场景运营效果为导向,全面数字化、智能化”的发展战略,持续加大在人工智能等领域的投入,将成为中国领先的智能数字化企业。 二、项目介绍: AI信创中心介绍: 彩讯股份“AI信创中心”是公司为抢占人工智能技术先机而成立的核心研发机构,是直接向CEO汇报的一级部门。中心汇集公司在人工智能、机器学习、知识图谱、自然语言处理等方面的人才,致力于将人工智能技术应用于公司各业务领域,实现产品、服务的智能化升级。 中心遵循“技术引领,应用驱动,市场导向”的发展策略,通过技术研究来挖掘人工智能的应用潜力,并在公司主营业务中进行示范与落地。 中心重点开展的技术和应用研究包括: 1)基于Transformer与BERT的对话系统与推荐系统。运用预训练语言模型与迁移学习技术,快速实现对话与推荐能力。 2)基于RL的智能决策与智能优化。研发强化学习技术在复杂决策环境中的应用,实现自动化智能决策。 3) 基于CVAE与StyleGAN等技术的智能创意与个性化推荐。生成图像、音乐、文本等创意素材,为个性化推荐提供丰富素材。 4)基于GAN与变分自编码器的客户画像与精准营销。利用生成对抗网络等算法,构建真实全面的数据与客户画像。 中心的研发重点在于企业级AI中间件与行业应用的研发,而非特定的机器学习模型。 中心的职责还包括: 1) 与高校、行业合作伙伴共建AI创新联合实验室,拓展产学研合作。 2) 发展与人工智能产业链上下游的合作伙伴关系,拓展公司的产业影响力。 3) 引领全公司各业务部门的产品与业务智能化转型升级。 4) 人工智能核心技术与产品的研发,不断提高公司的AI能力与实力。 中心将持续投入人工智能前沿技术与产品创新,以人工智能驱动公司各业务向智能化、个性化转型,实现产品服务的差异化和融合创新,为客户提供增强的体验与价值。中心必将成为公司实现产业升级与转型的核心动力之 三、岗位介绍: 【岗位职责】: 1、开源LLM的能力接入与部署; 2、负责LLM训练,模型微调; 3、SFT、RM、PPO等算法研究与优化; 4、负责前沿技术探索和落地。 【岗位要求】: 1.人工智能、计算机、数学/统计学等相关专业硕士及以上学历; 2.熟悉AI领域的前沿研究,具有丰富的研究经验,具备百亿级以上LLM 训练经验优先; 3.了解并行计算、CUDA、网络通信、系统优化、集群硬件架构等 HPC 相关的知识; 4.具有Prompt设计与微调经验优先; 5.熟悉SFT、RM、PPO原理,有实际实践经验者优先; 6.熟悉主流深度学习工具Pytorch,TensorFlow等; 7.具备良好的编程能力,熟练掌握 Python,数据结构和算法设计,熟悉 Linux / Unix 系统和 Shell 编程,熟练使用 Git; 8.在AI开源社区有贡献者优先; 9.在AI领域的核心期刊发表过论文优先; 10.有 TVM、TensorRT 等推理平台优化经验者优先; 11.了解并行推理技术的优先。 四、薪酬福利与职业发展: 我们提供竞争力的薪资待遇和福利待遇,包括期权激励、五险一金、带薪年假、节假日福利、健康体检、培训及晋升机会等。 同时,我们还为员工提供广阔的职业发展空间,鼓励员工在工作中不断成长和进步。 我们的团队充满活力、激情和创新精神,致力于打造一个开放包容、信任互助的工作环境,并定期举行各种团队建设活动,增强彼此之间的沟通和理解。 期待您的加入,一起探索未来无限可能!想更多了解彩讯股份,欢迎进入:https://www.richinfo.cn
  • 25k-50k·15薪 经验3-5年 / 本科
    信息安全,企业服务 / 上市公司 / 2000人以上
    岗位职责: 1.负责制定大模型产品的模型效果评测方案,对微调模型的训练/推理效果、RAG知识检索增强的生成效果设计评估方法和自动化工具,保障大模型的推理效果准确性 2.通过相关工具提高模型评测的效率和覆盖率,分析和评估模型测试结果,发现模型潜在的缺陷、漏洞和性问题 3.持续关注行业的最新测试技术和方法,不断优化测试流程和工具,提高测试效率和质量 任职要求: 1.本科及以上学历,有大模型算法测试经验 2.具备扎实的Pyhon/Shell等编程基础,熟练使用linux系统 3.深入理解机器学习、深度学习相关算法评估方法,熟悉自然语言大模型LLM 训练完模型推理效果测试方法和工具 4.熟悉k8s,有云原生相关项目测试工具开发经验者、大模型评测系统自动化和大模型性能测试经验者优先 5.拥有技术激情和创新意识,快速学习能力,表达能力优秀,乐观向上
  • 35k-60k·16薪 经验3-5年 / 硕士
    居住服务 / 上市公司 / 2000人以上
    工作职责: 1. 负责贝壳核心房产业务AI能力建设,利用AIGC相关能力推进业务智能化重塑; 2. 深入业务调研熟悉需求场景,参与和业务、产品、工程研发等横向交流学习; 3. 保持对业务的学习能力和持续热情,能探索调研业务实际场景痛点; 4. 结合业务需求,从Prompt优化,模型finetune等方面优化AI模型效果,解决面向业务场景的应用落地问题; 任职资格: 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2.熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架,掌握大语言模型SFT/LoRA/RLHF等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀;有NLP顶会论文或国际NLP比赛奖项者优先;
  • 20k-35k·15薪 经验3-5年 / 本科
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    岗位职责: 1,负责大模型金融产品的需求调研,产品设计,规划和实际落地; 2,关注同行业竞品业务发展状况,挖掘核心需求; 3,与算法部门深度合作,进行算法与产品的联合优化; 4,结合公司战略,洞察行业生态、技术路线演进,思考和挖掘深层需求。 任职要求: 1,本科及以上学历,金融或计算机工程相关专业 2,3-5年金融业务分析师从业背景或金融软件产品背景优先; 3,充分理解金融软件产品设计细节,思路清晰,能够将需求提炼形成的可落地的产品文档; 4,较强的跨团队沟通协调能力; 5,热爱AI,愿意接受有挑战性的工作,有很强的owner意识,能主动推动项目向前。
  • 25k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、负责参与 Scaling law、MoE、RLHF 、Long context 、RAG 等方向的研究。 2、负责参与训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 1、有训练过多模态 generat ive models 的经验。 2、在设计、训练机器学习模型(尤其是LLM)方面有深刻的理解。 3、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源
  • 25k-50k 经验1年以下 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 负责围绕AI大模型算法的认知分析的研究工作,具体工作内容包括但不限于: 1. 深入理解大规模语言模型的模型结构、训练过程以及评测方式,根据模型的训练过程以及评测结果,对大语言模型存在的问题进行研究。 2. 深入分析模型评测结果中不符合认知的异常,根据具体的异常制定完善的研究策略,通过对比、归纳等方法,产出研究分析结论,指导模型训练优化。 3. 构建Data-Centric的数据-训练-评测闭环,探索研究包括但不限于下列方向:大模型数据、模型的Scaling Law,研究数据配比、加入方式与时机等对模型效果的影响。 4. 追踪大模型方向的前沿进展,积极主动地学习和探索新数据分析、模型训练以及模型评测方法。 5. 与各相关部门保持良好沟通,深度参与大模型预训练、SFT、RLHF和评测等阶段,共同推动大模型持续优化。 岗位基本需求 1. 硕士及以上学历,计算机、数学、统计学或相关专业; 2. 熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 3. 具有机器学习或深度学习算法的基础知识,熟练掌握自然语言处理、多模态或大模型相关算法和模型; 4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。 5. 对每一行代码负责,对业务方负责,具备工匠精神。 具备以下者优先 1. 在计算机领域顶会(如ACL、EMNLP、NeurIPS、AAAI等)上以一作发表过论文者优先; 2. 具备从事相关行业人工智能开发、算法研究等相关工作经验者优先; 3. 对ChatGPT等相关大模型有深入了解或丰富的使用经验者优先; 岗位亮点 1. 紧跟人工智能行业进展,接触到前沿技术和行业趋势,磨练出对人工智能的独到见解; 2. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能; 3. 与一流的人工智能团队合作,快速成长,提升自身能力; 4. 有机会参与公司的创新项目,跨足不同领域,拓宽人工智能技术的应用范围;
  • 旅游|出行 / D轮及以上 / 500-2000人
    工作职责 支持搜索推荐平台建设,支持酒店、景点、餐饮、租车等多业务线的入搜索需求开发,并抽象沉淀到平台能力; 深入发掘和分析业务需求,充分理解业务,抽象和设计合理的技术方案; 系统代码编写,确保系统健壮性和稳定性,高质量交付等; 持续以自动化手段提高效率。 职位要求 大学本科及以上学历,计算机或相关专业优先; 有扎实的Java技术功底,深入理解一个或多个Java/golang领域,有较强的代码编写能力; 理解技术原理,熟悉设计模式及主流开源框架,elasticsearch、mongo db、MySQL相关技术; 熟悉分布式系统的设计应用,了解多线程开发和基本的网络通信知识,3年以上互联网大型网站服务开发经验; 有过高并发,高可用系统的设计经验,或有过大型电商交易系统平台建设的经验者优先; 有过aws/aliyun上大模型部署开发经验优先。 热爱技术,对行业变化和技术有强烈的好奇心,勤奋好学,不懈努力,有良好的团队协作能力。
  • 30k-50k·13薪 经验5-10年 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
  • 30k-50k 经验3-5年 / 硕士
    电商,硬件 / 上市公司 / 150-500人
    岗位职责: 1、从事大语言模型(LLM)预训练算法研究、训练、应用,涉及多语言、知识增强、模型性能提升等方面; 2、负责自然语言处理(NLP)方向基于GPU的并行多机多卡训练、高性能模型推理等; 3、主要从事AIGC语言内容生成工作,将先进的NLP生成技术应用于实际业务,获取业务收益,更好服务用户; 4、前沿技术跟进研究,支持公司通用类和垂类预训练模型研发及效果持续优化。 岗位要求: 1、硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上NLP相关经验,熟练使用pytorch/tensorflow深度学习框架; 2、在NLP文本生成或大模型预训练方向有较深入研究; 3、对 LLM 有深入理解和实践,有预训练、可控内容生成方向经验者优先; 4、熟练掌握GPT、T5等算法训练范式,有从0到1构建NLP大模型(百亿参数以上)经验优先; 5、有NLP顶会发表经验者(ACL/EMNLP/NAACL/SIGIR/NeurIPS等)优先; 6、具备良好的逻辑思维能力、沟通协作能力、自我学习能力。
  • 30k-60k 经验1-3年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 30k-60k 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责大模型技术在在文本生成、知识库建设、记忆能力、对话、推理能力增强等方面前沿技的跟进、创新,探索适合微博场景的应用解决方案; 任职要求 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2. 熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架 3. 熟悉RAG相关原理,熟悉大语言模型 SFT/RLHF 等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀; 5. 有NLP顶会论文或国际NLP比赛奖项者优先;