-
岗位描述 我们正在寻找一位大模型算法工程师,加入我们的DeepBank算法团队,负责提升 Agent 的规划、推理能力,构建知识库,并探索知识与大模型的融合。 岗位职责 1、Agent 核心算法研发与优化: 深入研究并实现先进的 Agent Planning 和 Reasoning 算法,提升 Agent 在复杂任务场景下的自主规划、逻辑推理、决策制定和问题解决能力 。 2、知识库构建与维护: 负责 Agent 研发平台所需知识库的构建、更新和维护工作,确保知识的准确性、完整性和时效性 。 3、知识与大模型融合研究: 跟踪和研究知识与大模型结合的前沿技术,探索新的方法和潜在的应用场景 。重点研究和实现基于检索增强生成(RAG)的 Agent 系统,探索利用知识图谱等结构化知识增强大模型的推理能力 。 4、特定领域 Agent 算法调优: 针对特定的应用领域,研究和优化 Agent 的算法和策略,以提升其在实际业务场景中的效果 。 5、参与平台技术方案设计与实施: 参与 Agent 研发平台的技术架构设计、模块划分和接口定义工作 。 任职要求 1、计算机科学、人工智能、自然语言处理、机器学习等相关专业硕士及以上学历 。 2、精通 Python 编程,熟悉深度学习框架如 PyTorch 或 TensorFlow 。 3、具备扎实的机器学习、深度学习、强化学习等理论基础,熟悉 Transformer 模型 。有大模型相关项目经验者优先 。 4、熟悉人工智能 Agent 的基本概念和原理 。熟悉 Agent Planning、Reasoning 等关键技术,了解 RAG、Function Calling 等优先 。 5、具备较强的逻辑思维能力、问题解决能力和快速学习能力 。 加分项 1、有实际 Agent 研发或相关项目经验,熟悉 Agent 框架(如 LangChain、AutoGen 等)。 2、熟悉知识图谱、向量数据库等知识库相关技术或工具 。 3、在 AI 会议或期刊上发表过相关论文 。 4、有参与或贡献优秀的开源项目经验 。 5、具备良好的中英文沟通和协作能力 。 6、有特定行业的 Agent 应用开发经验 。 ------------------------------------------------------------------------------------------------------------------------------------------
-
工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
-
工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
-
岗位职责: 1. 负责AI产品全生命周期管理,重点聚焦大语言模型(LLM)在业务场景的落地应用; 2. 深入理解主流大语言模型(如GPT系列、豆包、文心一言、Deepseek等)技术特性,设计符合业务需求的AI解决方案; 3. 主导AI能力与业务场景的融合规划,构建从需求分析、方案设计到效果验证的完整闭环; 4. 协调算法、工程、业务团队,推动大模型微调、提示工程、RAG等技术的产品化实施; 5. 建立AI产品价值评估体系,持续跟踪产品效果并迭代优化; 6. 关注行业前沿技术动态,规划AI产品技术演进路线。 任职要求: 1. 本科及以上学历,10年以上产品经验; 2. 具备主流大模型实战经验,至少主导过1个以上LLM落地项目全流程; 3. 熟练掌握Prompt Engineering、Fine-tuning等大模型应用技术; 4. 熟悉LangChain、LlamaIndex等主流AI应用开发框架; 5. 具备优秀的业务抽象能力,能将复杂业务需求转化为技术解决方案; 6. 熟悉机器学习全流程,具备基础算法理解能力。 加分项: 1. 有NLP/多模态大模型项目经验者优先; 2. 具备技术背景(算法/开发经验)者优先; 3. 有AI Agent、知识库系统建设经验者优先; 4. 在GitHub等平台有AI项目贡献者优先。 能力要求: - 技术理解力:能准确评估不同LLM的适用场景和技术边界; - 场景洞察力:善于发现高价值AI应用场景,设计可行落地路径; - 产品架构力:能构建包含数据、算法、工程的完整解决方案; - 商业敏感度:具备成本收益分析能力,平衡技术投入与商业价值; 我们提供: - 参与前沿AI技术落地的核心项目机会; - 与优秀AI研发团队协作的工作环境; - 行业竞争力的薪酬+AI项目专项激励; - 定期技术培训与学术会议参与机会;
-
职位职责: 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新应用场景; 2、负责大模型应用的构建过程,从需求分析、模型设计到开发实现与优化,确保应用的高效性与准确性; 3、对大模型应用的效果进行持续调优,通过数据分析与算法改进,提升模型的性能和用户体验; 4、与跨部门团队紧密合作,包括工程师、产品经理等,共同推动项目的顺利进行; 5、关注行业动态与技术趋势,及时引入新的算法技术和理念,为公司的技术发展提供前瞻性建议。 职位要求: 1、本科及以上学历,计算机科学、人工智能、数学等相关专业,具有1年以上大模型相关工作经验; 2、熟练掌握至少一种主流的深度学习框架,如TensorFlow、PyTorch等; 3、熟悉大模型相关技术,对大模型核心技术有深入的理解,包括但不限于模型架构、训练算法、优化策略等,有大模型SFT、RLHF等实操经验者优先; 4、熟悉大模型主流应用场景,如RAG、Graph-based RAG、Agent等,有实际落地经验者优先; 5、熟悉大模型应用开发框架,包括但不限于Langchain、LlamaIndex等,有实际应用开发和项目落地经验者优先; 6、具备优秀的编程能力,熟练使用Python、C++等编程语言。
-
职位职责: 1、设计、实施和维护高可用、高性能的豆包大模型服务架构; 2、使用Terraform和其他IaC工具管理和自动化云基础设施部署; 3、开发和优化自动化运维工具,提高模型部署效率和系统可靠性; 4、优化大规模分布式模型训练和推理的基础设施; 5、与AI研究团队密切合作,确保新模型和功能的顺利部署和稳定运行; 6、使用Terraform管理多云环境,确保基础设施的一致性和可重复性。 职位要求: 1、本科及以上学历,计算机相关专业,3年以上云计算或者大模型领域的开发或稳定性建设经验; 2、熟练掌握Python/Golang/Java中的一种语言,具备云原生相关技术栈。 加分项: 1、了解机器学习模型部署和服务化的最佳实践; 2、具备在多云环境(如AWS,GCP,Azure)中工作的经验; 3、熟悉 CI/CD 流程,有使用Jenkins,GitLab CI等工具的经验; 4、有大语言模型或其他AI大模型相关运维经验。
-
【校招】大语言模型工程师 职位描述: 1. 参与大规模预训练模型的研发工作,探索超大规模模型的极致系统优化; 2. 研究高效的模型调优策略、高质数据建设方法,包括数据建设、指令微调、偏好对齐、模型优化等; 3. 设计、实现、优化分布式系统和并行计算框架,提升训练和推理效率,支持大模型平台化及创新应用落地; 4. 探索大模型在前沿技术和趋势中的应用,包括生成创作、逻辑推理等,并在金融领域下的更多使用场景中进行深入研究和探索。 职位要求: 1. 硕士及以上学历,人工智能、计算机、自动化、数学相关专业优先; 2. 扎实的机器学习基础,熟悉NLP、RL领域技术,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶会发表论文者优先; 3. 熟练掌握Python及Pytorch/Tensorflow/PaddlePaddle等框架,C/C++熟练者优先; 4. 优秀的代码能力和算法功底,ACM/ICPC、NOI/IOI、Kaggle等竞赛获奖者优先; 5. 熟悉预训练模型算法原理,有大规模模型(>7B参数)训练调优或分布式系统开发经验; 6. 具备出色的问题分析和解决能力,能独立探索技术解决方案。 加分项: 1. 在大模型领域或RL领域,主导过大影响力的项目或论文者; 2. 有较强的学术背景,在会议上发表过相关论文者; 3. 有丰富的实践经验,能够快速将研究成果应用于实际场景中。
-
(AI大模型方向)架构及技术规划高级工程师
[深圳·深圳湾] 07:04发布21k-25k·15薪 经验5-10年 / 本科移动互联网,信息安全 / 不需要融资 / 150-500人岗位职责: (一)技术规划 1. 研究行业信息技术应用趋势,定期发布行业信息技术应用分析报告; 2. 推进公司科技研发体系建设; 3. 研究并提出公司技术发展路径和研发规划,并推动落实; 4. 落实技术规划有关工作; 5. 部门指派的研发项目架构设计、核心代码编写等高层级技术工作; 6. 公司内部公共组件和工具的规划和开发; 7. 对研发各项目组的技术培训和技术指导,以及疑难技术问题的分析、定位及修正; 8. 开展内外部技术交流。 (二)售前支持 1. 售前各技术解决方案的设计; 2. 作为业务角色与技术、商务角色组成售前团队共同推进各售前机会。 任职要求: 1.本科及以上学历,计算机、人工智能、数学等相关专业; 2.8年以上人工智能开发、架构设计工作经验,具备扎实的技术开发基础;具备大语言模型训练、微调经验者优先; 3. 能力要求: (1)编程能力:精通Python,熟悉C++/Java等编程语言;熟练使用主流深度学习框架(如TensorFlow、PyTorch、Keras等);具备高性能计算(HPC)或分布式计算经验者优先。 (2)深度学习理论:扎实的机器学习与深度学习理论基础,熟悉CNN、RNN、Transformer等主流模型架构;熟悉强化学习、迁移学习、联邦学习等前沿技术者优先。 (3)数据处理能力:熟悉大数据处理工具(如Hadoop、Spark、Flink等);具备数据清洗、特征工程、数据可视化等经验;熟悉SQL及NoSQL数据库(如MySQL、MongoDB等)。 (4)模型设计与开发:具备完整的AI模型开发经验,包括需求分析、模型设计、训练调优、部署上线等全流程;熟悉模型压缩、量化、剪枝等优化技术;有实际落地项目经验者优先。 (5)架构设计能力:熟悉微服务架构、容器化技术(如Docker、Kubernetes);具备高并发、高可用系统的设计经验;熟悉AI模型服务化(如模型即服务,MaaS)的架构设计。 (6)团队协作与沟通:具备良好的技术文档撰写能力;能够高效协调跨部门资源,能独立推动项目落地;有技术团队管理经验者优先。 4. 员工应通过本公司试用期考核。 其他信息: 工作时间:08:30-12:00 13:30-17:00 双休(研发团队弹性1小时上下班) 福利待遇:加班调休及餐补 保险保障:五险一金(一档社保、12%公积金)、商业保险、集团职工互助金、年度体检 休假福利:每年20天的探亲假(报销路费)、法定节假日、带薪年假、产假(产检假.陪产假.哺乳假) 培训福利:入职培训、内外部技能培训、员工拓展、技术交流、内训师奖励 生活保障:企业面向新入职优秀人才提供宿舍、政府人才房、免费接收档案 员工活动:文体协会、生日会、团建、健步走 员工关怀:结婚.生育.重疾.受灾丧亡慰问金、妈妈小屋 -
招聘条件: 1、获得博士学位,且获学位时间一般不超过 3 年; 2、年龄一般在 35 周岁以下,身心健康; 3、具备通信、人工智能、大数据相关专业背景,有志于在该领域开展深入研发; 4、具有良好的团队协作能力和表达能力。 岗位待遇 1、签订劳动合同 ; 2、国家博士后一次性资助; 3、支持博士后在站期间申报国家和省市级博士后人才项目和研究项目; 4、协助申请公租房; 5、优秀者协助申报各类国家、北京市人才计划
-
背景: 在通用大模型开放和开源背景下,我们认为属于我们的创新机会在中间层和应用层,基于最右社区积累的海量数据优势,我们会从AI社交,AI创作两个大的方向进行产品和技术创新。 职位描述: 1. 负责大型语言模型的技术探索和实践落地,包括但不限于 CPT、SFT、DPO、GRPO 等技术 2. 从语言模型的角度,优化模型性能,关注语言模型中的幻觉、长上下文理解、指令遵循、模型评估等问题 3. 关注对话聊天场景,面向应用针对性建模和调优 4. 跟进大模型前沿最新学术研究进展,并运用到模型训练中 要求: 1. 算法及应用综合能力优秀,有大模型经验或推荐/搜索/广告算法领域的技术和实际经验 2. 具备较强的技术攻关能力,能够跟进领域内最新技术研究成果,并结合应用场景快速实验和调优 3. 理解业务目标并能进行合理拆解,具备良好的团队合作精神和沟通意识,对社区,内容平台,社交等产品领域的算法技术有强兴趣
-
岗位职责 负责AI大模型的评测与分析工作,与模型训练团队配合不断优化提升AI大模型效果。具体工作内容包括但不限于: 1. 深入理解大规模预训练语言模型,参与模型评测方案的制定与评测数据集的建设。 2. 通过对模型进行全方面细致的评测,明确模型能力边界,对模型能力进行深入分析,产出围绕大模型的客观认知,从而为模型训练迭代提供指导意见。 3. 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。 4. 与各相关部门保持良好沟通,深度参与大模型训练及应用,为各大模型相关方提供评测及相关的模型分析支持,共同推动大模型的训练与应用。 5. 良好的项目管理能力,有一定的抗压能力和优良的意志品质。 任职资格: 1. 本科及以上学历,计算机、数学、统计学或相关专业; 2. 了解Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 3. 对机器学习或深度学习算法的基础知识,自然语言处理或大模型相关算法和模型感兴趣; 4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。 5. 紧跟人工智能行业进展,对前沿技术和行业趋势有比较高的敏感度 7. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能; 8. 有生成式大模型(如stable diffusion)研究经验; 9.英语达到4级以上优先 10.有项目经验的优先。
-
岗位职责: 1、 负责公司QDb、ChatFinance 等相关模型产品的开发迭代。 2、参与团队技术交流和分享,提升团队整体技术能力。 岗位要求: 1、计算机科学或相关领域的本科及以上学历,具有 3 年以上后端系统开发经验。 2、精通 Java / Python 编程语言及相关技术框架(SpringBoot、FastAPI)。 3、熟悉 LLM 相关知识。 4、熟练使用 LangChain等框架。 5、熟悉数据库设计、对数仓和数据管理概念有深入理解,具备 BI 相关知识。 6、对ChatGPT、GPT-4、QWen 等大模型有深入研究且有实际工作经验优先。 7、熟悉常见的中间件(消息队列、Nginx、Redis 等)。 8、熟悉微服务架构、Restful API 设计及实现。 9、具备良好的编码习惯,能编写高质量、可维护的代码,熟悉常见的设计模式和软件工程原则。 10、具备良好的沟通能力、团队协作精神和解决问题的能力。
-
1. 参与基础大语言模型应用研发; 2. 结合机器学习、强化学习等技术优化基础大语言模型 3. 调研并探索SFT/RLHF方向前沿算法、框架,持续提升现有算法的效率与效果。 任职资格: 1. 有计算机科学、数学、统计学或相关领域的硕士或博士学位; 2. 熟悉Python与深度学习框架,具有良好的编程能力和扎实的数学理论基础; 3. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我; 4. 良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力; 加分项 1. 有相关领域的开源项目、竞赛获奖、顶会论文发表/在投; 2. 熟悉LangChain、DeepSpeed等LLM开源工具,工程能力较强;
-
岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
-
岗位职责: 1. 研发人工智能领域的相关算法实现, 可以选择NLP、语音、图像领域其中之一。 2. 结合行内业务需求,设计实现方案,并基于大模型进行场景开发和模型的微调优化。 3. 跟踪和关注大模型推理训练领域的前沿技术和趋势,进行技术调研和应用。 岗位要求 1.计算机、电子通信、数学等相关专业,硕士及以上学历或优秀本科生; 2.具备优秀的编程能力,熟练使用Python/C/C++的其中一种; 3.对机器学习、深度学习等人工智能领域有兴趣,有相关领域课题研究或项目经验者优先;; 4.有期刊论文发表或计算机相关竞赛经验者优先; 5. 出色的问题分析及解决能力,能自我驱动,持续面对挑战,积极主动、踏实勤奋。