-
岗位职责: 1. 负责计算机视觉算法和深度学习算法的前沿技术的研发工作。 2. 负责物体检测(行人、车辆、OCR、通用目标)、分类、跟踪、识别、图像理解、图像质量评估和增强,视频分析等前沿技术研发和实现。 岗位要求: 1. 图像处理、模式识别、机器学习相关专业硕士及以上。 2. 在深度学习、统计机器学习、计算机视觉和最优化方法等方面有较深入的研究。 3. 熟悉物体(行人、车辆、人脸、通用目标)检测、跟踪与识别算法。 4. 熟悉图像理解(分类、分割等)、视频分析算法。 5. 熟悉cnn,rcnn,frcnn,boost,svm其中至少一种,并且有实战经验 6. 动手能力强,熟练掌握C/C /Python/Matlab语言,有较强的算法分析和实现能力 7. 精通Caffe、MxNet、Tensorflow、Cuda-convnet、Torch等任一种深度学习开源框架者优先。 8. 有智能安防领域经验者优先。
-
岗位职责: 1、负责行车场景周视感知算法设计和开发工作,包括高速/城区等场景中的障碍物、车道线等感知任务的模型及后处理算法开发工作 2、负责泊车场景环视感知算法设计和开发工作,包括室内、室外等场景中的车位、障碍物等感知任务的模型及后处理算法开发工作 3、负责自动驾驶领域大模型等前沿技术研发工作 任职要求: 1、计算机、汽车工业、机器人、电子或相关专业; 2、熟悉当前主流的深度学习算法,包括但不限于BEV感知、无监督训练、大模型、目标检测、图像分割、多任务学习、多传感融合等领域; 3、熟悉常用的深度学习框架,如PyTorch、TensorFlow、MxNet等,要求至少对其中一种框架较为熟练; 4、至少精通Python或C++编程,熟悉常用的视觉算法库如numpy/opencv等,了解常用的传统图像处理算法。 5、具备针对车载端侧平台检测/分割等算法设计经验和落地能力,有针对自动驾驶场景落地障碍物、车道线、红绿灯、freespace等算法经验者优先。 6、具有正确的价值观、内在驱动力;具有较强的学习能力、沟通能力和团队协作能力;能主动解决问题;能够承受较强的工作压力。
-
职位职责: 1、从事视频理解基础模型的预训练、微调和优化研究。探索视频理解的能力边界和新应用; 2、搭建数据收集和处理流水线,设计评估方法,优化训练框架,使模型能在大规模数据上进行训练; 3、参与孵化与视频理解技术相关的新产品。 职位要求: 1、计算机、自动化、数学、电子等相关专业的博士; 2、在计算机视觉、多模态大模型等领域有积累,并取得了有深度的研究成果,作为主要作者在**会议/期刊发表过相关论文; 3、具备良好的团队协作素质,自驱性强,具备独立开展研究工作的能力; 4、算法和编程能力强,熟练掌握Pytorch等深度学习框架,Python编程语言,有大规模的模型训练经验优先。
-
工作职责 : 1. 负责计算机视觉、多模态AIGC内容生成领域的核心算法研发及效果优化,包含物体检测和识别、物体分割、视频内容理解、图文视频内容生成、虚拟数字人等方向; 2. 追踪和学习人工智能领域的国际前沿技术研究,结合业务需求,研发计算机视觉、多模态内容生成类算法,推动AI技术在保险领域的智能应用及落地,根据业务需求持续追踪应用效果并进行优化迭代,赋能保险行业智能化营销,数字化运营等。 任职资格 : 1. 硕士及以上学历,具备扎实的计算机基础知识,3年以上计算机科学、人工智能相关领域工作经验,熟悉物体识别与分类、物体跟踪、三维视觉、视频内容理解、文生图/图生文、虚拟数字人等主流算法及应用; 2. 算法基础扎实,有较强的算法理解和实现能力,熟悉掌握C/C++,Python等编程语言、常用数据结构算法以及Linux环境开发和实现, 熟悉掌握Tensorflow, Pytorch等深度学习框架,有熟练框架使用及模型训练及模型部署经验; 3. 学习能力强,紧跟国际前沿技术,富有创造性思维,表达能力良好,能独立高效完成中英文技术文档撰写。 4. 在相关国际会议或主流期刊,如CVPR、ICCV、ECCV、NeurIPS、SIGGRAPH等发表论文者优先,有计算机视觉/深度学习方向比赛经验并取得优秀名次者优先,有高质量Github项目经验者优先。 5. 责任心强,积极主动,有良好的沟通能力和团队合作能力,有技术负责、项目管理、多团队协作管理经验者优先。
-
岗位职责: 1、参与页面分析挖掘算法的研究与实现,通过算法策略优化页面分类模型、文本分类模型。 2、利用文本挖掘、图像理解等业界先进技术,对多模态内容进行挖掘与理解。 3、工作范围涵盖网页筛选与理解、网页与站点分类和去重、多类型非网页类多模态数据的处理和理解。 岗位基本要求: 1、计算机相关专业本科及以上相关学历,具备优秀的理解力、沟通能力和团队协作能力。 2、熟练掌握 c++/python/Java等编程语言,并且在机器学习,自然语言处理领域有扎实的理论功底和动手能力。具备优秀的逻辑思维能力和数据科学能力,在相关领域比赛中获奖优先。 3、在信息检索、自然语言处理/图像与视频理解等方面有非常扎实的理论功底,以及丰富的解决实际问题的项目经验。有信息检索相关领域工作经验优先。 4、善于学习领域前沿技术并能快速应用到实际工作当中,在自然语言处理,信息检索、计算机视觉等领域有相关学术论著优先。
-
岗位职责: 1. 根据产品需求开发清洁机器人所需的slam导航软件,包括:SLAM建图及定位(激光、视觉或rgbd融合均可)、地图优化、动态更新、延边探索、覆盖规划、区域分割、动态避障及脱困算法等: 2. 负责算法的规划设计、编码实现以及单元测试; 3. 负责前沿算法的跟踪以及预研; 4. 负责相关技术文档的撰写; 任职要求: 1. 计算机理工科相关专业,以SLAM算法为专业研究方向者优先,,985&211**本科以上学历,3年及以上机器人导航算法方面工作经验; 2. 熟悉常见的开源SLAM方案; 3. 熟悉机器人导航,具有多传感器融合和多传感器标定的理论和实践经验; 4. 掌握基础算法知识,如EKF、UKF、PF等; 5. 具有较强的编程能力,熟练使用C/C++; 6. 扎实的数学功底,能够推导传感器中常用的数据转换,滤波公式; 7. 良好的英文读写能力,工作积极主动,能发现问题并解决问题。
-
职位职责: 字节跳动ByteDance Research致力于人工智能领域的前沿技术研究,涵盖自然语言处理、计算机视觉、机器学习、机器人、AI for Science、Responsible AI等多个领域,同时将研究成果落地,为公司现有的产品和业务提供技术支持和服务。 1、建设大规模的视频生成基础模型,取得世界领先水平; 2、进行算法的设计和效果迭代,探索视频生成最优的模型架构和最佳的训练方法,不断提升生成能力上限。 职位要求: 1、有视频生成、图片生成、多模态预训练、视频理解、图片理解,其中一个或者多个领域的研究经验,并对相关工作有深刻的理解; 2、优秀的代码能力,熟练掌握Pytorch,能在较短时间内独立实现论文算法,并且能有针对性地优化; 3、优秀的团队合作能力和持续学习能力,能在团队合作中高效推进项目进展; 4、深入理解Diffusion Models、Image/Video Tokenizers 、Transformer Scaling up经验者优先;开发出相关领域中重要任务 SoTA 模型者优先。
-
1.负责视频理解、视频编辑处理与创意生成相关算法研发。 2.负责视频技术在美团的全场景落地,助力业务解决视频内容生产、分发、展示等环节的实际问题,包括但不限于:视频多模态内容理解,视频智能创作,视频画质增强。 岗位要求: 1.2年以上工作经验。 2.熟练掌握模式识别和计算机视觉的基础理论和方法,在一个或多个领域有深入研究:视频分类与结构化分析、动作识别、视频跨模态表征、视频质量评价、视频超分等。 3.具备扎实的工程能力,熟悉TensorFlow,PyTorch等主流框架。 4.具有广阔的技术视野,紧跟领域前沿,善于通过创造性的方法解决复杂的实际问题。 5.具有优秀的团队协作和项目推动能力。 具备以下优先: 1.在视频搜索推荐,视频剪辑创作等领域,具有行业应用经验。 2.在业界大规模视频数据集上有过研发经验。 3.在计算机视觉的通用或细分领域的权威竞赛中取得较好名次。 4.在计算机视觉领域内的**会议或权威期刊发表过论文。 岗位亮点: 1.前沿探索与业务落地相结合。以公司业务为依托迭代创新,技术应用场景广泛覆盖本地生活服务与零售电商行业。 2.公司核心计算机视觉算法团队,技术氛围好,成长空间大。
-
职位描述 1、使用多源传感器(包括但不限于相机与LiDAR)开发基于不同依据的高精度定位模块,用于自动驾驶中分米级别的高精度定位与姿态估计; 2、处理多源传感器与定位算法输出结果的融合; 职位要求 基础项(前三项至少满足一项) 1、熟悉计算机视觉中多视角几何知识; 2、熟悉常用vSLAM,VO/VIO或LiDAR SLAM算法,有实际动手或项目经验; 3、熟悉基于滤波和优化的状态估计算法,并可以灵活运用解决实际问题; 4、熟悉python, c++,有很强的动手能力。 加分项 1、有计算机视觉或机器人相关研究经验,有高水平论文发表; 2、有大规模定位系统开发和实践经验,有实际处理原始传感器数据的动手经历。
-
职位描述: 1. 负责以大语言模型 (LLM)、视觉语言模型 (VLM) 为核心的复杂场景理解和泛化技术。 2. 负责研究和设计以语言-动作大模型 (VLA) 在自动驾驶领域的落地,包括但不限于模型的结构、训练技术探索; 3. 负责研究基于自监督技术的自驾大模型,有效利用海量数据。 职位要求: 1. 对大模型算法研究和应用经验丰富,包括但不限于大模型的训练数据构造、模型训练、性能调优等; 2. 对大模型在自动驾驶领域有应用经验优先,包括但不限于利用大模型进行行为场景理解和规划的落地实施; 加分项 1、有计算机视觉或机器学习相关研究经验,有高水平论文发表; 2、参加kaggle或知名会议上举办的相关比赛取得优异成绩; 3、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
-
岗位职责: 1. 负责AIGC相关的系统功能实现及模型训练(文生图方向) 2. 跟踪国内外最新人工智能算法发展方向和相应技术 3. 负责机器学习、深度学习等研究工作,解决人工智能在实践中面临的问题 岗位要求: 技能要求 1. 硕士及以上学历,图像处理、模式识别、人工智能、计算机等相关专业 2. 熟练掌握Python编程语言以及常用的AIGC库 , 如PyTorch ,Tensorflow, HuggingFace 等工具,熟悉Linux环境 3. 熟练掌握一种深度学习框架,掌握多种框架者优先 4. 熟悉AIGC者优先,如 Diffusers , Stable Diffusion , MidJourney , Controlnet , Lora, ChatGPT 等,对AIGC有着高浓度兴趣,并对AI前沿有较敏锐的洞察 5. 了解机器学习算法,图像与视觉,对自然语言理解,知识图谱等领域的现状与最新进展,并在其中一个领域有实践经验,并保持对前沿的深刻理解
-
1、参与开发长文本理解和生成的相关任务,通过改进文本分析策略和提高信息理解精度,加强模型在处理长文本序列场景中的应用效果。 2、开发和优化轻量化模型部署策略,利用最新的模型加速压缩技术,提升线上部署的效能,包括但不限于模型压缩、知识蒸馏。 3、持续追踪学术界和工业界的研究成果,探索在微博场景内的应用场景 岗位要求: 1. 学历背景:计算机、人工智能、数学等相关专业,本科、硕士学历。1-3年工作经验 2. 理论与实践能力:具备扎实的自然语言处理、机器学习和深度学习的理论基础与算法经验,在相关领域有顶会论文发表者优先考虑。 3. 框架与工具:熟练掌握PyTorch、transformers、vllm等主流深度学习框架,具备解决复杂业务问题并显著提升业务成果的实际经验者优先。 4. 创新与执行力:具备强大的创新思维和问题解决能力,能够应对高难度挑战,具备自我驱动与独立完成任务的能力,同时拥有优秀的沟通技巧与抗压能力。 5. 大模型相关经历:有大模型相关的项目经历,主导过大影响力项目或论文者优先
-
我们正在寻找一位经验丰富的推荐算法工程师,负责推荐算法的框架搭建和工程效能优化工作。该职位将主要负责TF和PyTorch框架在推荐系统中的应用,包括离线和在线训练优化、模型部署及生成式模型的实时预估。我们期待您的加入,共同推动公司的技术和业务发展。 岗位职责: 1. 离线Pipeline优化:优化TF框架的离线和在线逻辑,提升TF集群训练和GPU训练的离线pipeline资源利用率和效率。 2. 模型Serving:探索并搭建基于TF/PyTorch的Serving方案,实现推荐场景下的近线和在线预估流程。 3. 生成式模型应用:落地推荐领域的生成式模型预估框架,负责对应的训练加速和实时预估的部署。 4. 算法研发:优化工程效率,提升推荐系统的性能和效果。构建通用有效的工具和框架。 任职要求: 1. 教育背景:计算机科学相关专业本科及以上学历。 2. 工作背景:推荐算法领域3年以上的工作经验。 3. 技术经验: - 熟悉TF/PyTorch框架,具备离线Pipeline和在线Serving相应的部署和优化能力。 - 熟悉GPU加速相关技术,能够优化大规模数据的训练速度。 - 具有生成式模型应用经验,能够实现生成式模型的训练加速和实时预估部署。 4. 编程能力:精通Python编程,熟悉C++/Java或其他编程语言者优先。 5. 工程经验:具备扎实的工程能力,有大型推荐系统开发和优化经验者优先。 6. 沟通能力:良好的团队合作精神,具备跨团队沟通协作的能力。 7. 创新精神:热爱技术创新,乐于接受挑战,并能够持续学习和应用新技术。 优先条件: 1. 互联网公司推荐系统的相关工作经验。 2. 在推荐算法、机器学习或深度学习领域有高质量论文或专利。 3. 开源项目贡献经验。
-
工作职责 1.针对医疗领域特定问题,定义任务流程,收集或构建高质量数据集,对LLM进行微调; 2.利用提示工程、模型微调、调用工具插件等方式完成医疗领域特定应用的探索尝试; 3.尝试提升大语言模型在医疗方面的能力,包括但不限于高效训练、人工反馈对齐、多模态、可控文本生成、生成质量评估,以提升LLM性能。 任职要求 1.研究生及以上学历,计算机、电子工程、自动化控制等专业背景,有NLP的研究经验; 2.有扎实的数理基础和良好的逻辑思维能力,有深度学习算法框架使用经验; 3.良好的编程能力,熟悉Python,pytorch,linux下常用指令; 4.熟悉现有的多种大语言模型,例如llama、qwen等; 5拥有医疗自然语言处理项目经验,或者对人工智能在医疗领域的应用有强烈兴趣; 6.有中文文本处理经验者优先,有计算机、医学、生物信息学等领域论文发表或者大赛获奖经历者优先。
-
岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。