-
职位职责: 1、从事视频理解基础模型的预训练、微调和优化研究。探索视频理解的能力边界和新应用; 2、搭建数据收集和处理流水线,设计评估方法,优化训练框架,使模型能在大规模数据上进行训练; 3、参与孵化与视频理解技术相关的新产品。 职位要求: 1、计算机、自动化、数学、电子等相关专业的博士; 2、在计算机视觉、多模态大模型等领域有积累,并取得了有深度的研究成果,作为主要作者在**会议/期刊发表过相关论文; 3、具备良好的团队协作素质,自驱性强,具备独立开展研究工作的能力; 4、算法和编程能力强,熟练掌握Pytorch等深度学习框架,Python编程语言,有大规模的模型训练经验优先。
-
职位职责: 日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:智能创作团队是字节跳动AI、特效和音视频创作技术和业务中台,负责了抖音、剪映等核心产品的技术和业务研发,涵盖了深度学习、计算机视觉、图形学、语音、拍摄编辑、特效、客户端、服务端工程等技术领域,并以多种形式向公司内部各业务线提供业界最前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、可以将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、提出和实现前沿的算法,保持算法在工业界和学术界的领先。 职位要求: 1、2025届及以后毕业,硕士及以上学历在读,计算机、软件工程等相关专业优先; 2、有扎实的数学和算法基础,有快速学习新技术的能力; 3、有扎实的编程基础,熟悉c++/python等编程语言,具有快速复现前沿论文的能力; 4、熟悉caffe、tensorflow、mxnet、pytorch、keras等框架中的一种或者一种以上; 5、在机器学习、图像分类和识别、图像视频理解、图像分割、目标检测、OCR、手机端图像处理、视觉创作、3D、图形学、多模态、AIGC、NLP等方面有经验者优先; 6、在**学术会议上发表论文者优先; 7、每周出勤时间不少于4天,连续实习3个月及以上。
-
我们正在寻找25届应届生和25-29届实习生,加入我们的团队,共同推进盘古基础视觉大模型的前沿研究和应用。欢迎对技术充满热情的你投递简历! 主要职责: 1. 参与盘古视觉大模型的前沿研究和应用,包括: 开集和闭集分割,检测 多模态对齐 多模态对话(MLLM) Diffusion图像和视频生成 3d重建和生成 2. 推动研究成果在工业、遥感、智慧城市等领域的项目落地。 职位要求: 计算机、电子信息、软件相关专业,本科及以上学历 熟练掌握Python,pytorch等深度学习常用工具 具备较强的自我学习能力,实习10个月以上 熟悉Transformer、mamba,CNN等常见架构 了解视觉理解,多模态对齐、对话、diffusion,3d GS等前沿技术 发表过高水平论文者优先
-
基础研发平台是美团的核心技术平台,立足于“零售+科技”的战略定位,通过打造人工智能、大数据、云计算、安全等核心技术能力,以及研发效能平台、企业应用平台等公共服务,为业务提供稳定安全、扩展易用、技术领先的平台技术和产品服务。 在这里,我们会参与到最前沿的技术研发和探索;能够接触超规模集群、海量数据,挑战高复杂业务场景,有机会与业界一流的工程师一起并肩前行。 在这里,我们有超强的技术氛围,持续向社区贡献业界实践,加速行业技术发展;我们有完善的互联网学习生态圈,重视底层逻辑和方法论,助力职业生涯的非线性成长。 真诚地邀请你,和我们一起驱动技术发展,创造行业价值。 岗位职责 从事计算机视觉算法和机器学习算法的研发,包括:人脸识别,检测/跟踪,表情识别/属性识别,活体识别,人脸编辑/人脸生成,3D人脸识别 / 3D人脸重建,多模态学习,虚拟人技术的算法研究、开发,以及现有方案优化。 岗位基本需求 1. 硕士或博士在读,计算机、电子信息、数学等专业; 2. 熟练掌握计算机视觉和机器学习的基础算法; 3. 熟练使用一种深度学习框架(Pytorch,Tensorflow, Mxnet, Caffe); 4. 较强的学习和实践能力,快速实现算法、模型,并持续提高性能。 岗位亮点 1. 以公司实际业务为依托,有完善的技术转化和落地机制; 2. 场景全覆盖,视觉技术方向的选择空间大; 3. 注重技术创新与探索,关注前沿技术。
-
岗位职责: 1、负责深度学习、计算机视觉和视频分析的算法研发应用以及性能优化,包括但不限于目标检测、图像分类、行为分析、追踪与识别等; 2、负责⼯程项⽬的算法和软件的开发⼯作,结合具体⼯业应⽤场景实现算法的落地; 3、制定并实施训练数据集的采集、标注计划,模型的训练、验证以及部署模型的转换 4、负责相关算法的核心代码实现,优化模型和算法,与服务器后端工程师协调工作。 任职要求: 1、熟悉图像处理、模式识别算法,熟悉GPU、OpenCV等图像处理平台; 2、熟悉深度学习主流框架,熟练应用PyTorch或tensorFlow等至少一种框架,具备相关算法开发与应用经验; 3、熟悉图像分类、⽬标检测、分割等常⻅深度学习算法,熟悉边缘检测、特征提取等传统图像算法; 4、熟悉多⽬视觉、三维重建、视觉测量等 5、有运动视觉开发经验的优先
-
一、岗位职责 1, 参与公司图像相关的算法设计与开发,包含图像分类,图像搜素,目标检测与分割等技术; 2,参与OCR相关的文字检测与识别工作; 3,参与人脸识别相关的人脸检测、人脸关键点检测、人脸识别等工作; 二、任职要求 1, 计算机、数学或统计等相关专业硕士及以上学历。 2, 熟悉一种常见的深度学习框架,熟悉常见的机器学习、深度学习算法; 3, 熟练使用python,tensorflow,pytorch等编程语言和深度学习框架 4, 有大规模图像搜索、图像/视频分类和识别、人脸识别、OCR文字检测与识别等相关工作经历。 5, 能够设计和实现相关计算机视觉算法,并在实际系统应用中进行优化和改进;
-
职责: 1、根据相关文献完成计算机类内容撰写; 2、根据评审意见,完成修改并通过审核; 要求: 1、计算机类相关专业,或图书编辑经验; 2、有百科词条写作经验优先; 3、有一定写作功底,能快速提炼信息并编写成文稿; 4、能够耐心研读写作指引,完成规范要求。
-
职位描述 1、跟进计算机视觉及多模态等前沿技术方向,能够实现前沿算法,保持算法在工业界和学术界的领先; 2、探索计算机视觉及多模态算法在内容理解和内容生成等领域的应用,参与和推动技术落地到快手各产品线,如搜索、推荐、电商、商业化等; 3、打造算法技术在工业界和学术界的影响力,参与相关专利、顶会论文的发表。 任职要求 1、实习至少4-6个月、具备快速学习新技术、跟踪最新文献能力,优秀的自我驱动及沟通表达能力; 2、在多模态理解与生成算法方面有经验者优先,在**学术会议上发表论文者优先; 3、有扎实的工程能力,能够快速复现前沿论文和实现算法; 4、主观能动性强,具备优秀的逻辑思维能力,对解决有挑战的事情充满热情。
-
岗位职责: 1、负责视频/直播内容理解,多标签等相关算法的研发和落地; 2、负责乐我无限短视频、直播、商业化等场景的多模态内容理解工作,应用计算机视觉、NLP等技术,提升短视频、直播及商业化的推荐、搜索的效果和体验; 3、负责视频相关的语义理解、标签识别等工作,基于视频内容和用户行为构建embedding特征,持续优化并时刻保持技术先进性,将业界SOTA模型落地并改进以获取业务线上收益,并保持独立创新; 4、负责相关的文本理解、视觉检索、视频生成等工作。 任职要求: 1、硕士及以上学历,计算机/信号处理/统计等相关专业毕业,至少3年以上相关工作经验,在图像处理,计算机视觉,深度学习方面有深入研究。 2、算法基础扎实,动手能力强,有较强的算法理解和实现能力,熟悉掌握C/C++,Python等编程语言以及常用数据结构算法; 3、有视频分类,目标检测,文本视觉相关性,视频生成等项目经验优先; 4、熟悉掌握深度学习框架,包括但不限于Tensorflow, Pytorch, Caffe, MXNet等,有一定框架使用及模型训练经验; 5、富有创造性思维,具备良好的服务意识和高效的团队沟通与协作能力。
-
研究方向: 深度学习(CNN, RNN)/计算机视觉/图像视频处理: 如图像和视频的分类、检测、识别、编辑、分割、 重建、3D视觉、图像生成、GAN、计算成像等 职位描述: 理论创新:研究领域最新技术,提出新idea 算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 落地实现:核心代码实现,输出demo或SDK,根据产品反馈迭代优化 职位要求: 计算机/电子信息/数学相关专业,硕士及以上学历 掌握C/C++/Python至少一种 熟悉常用CV库和深度学习框架(Caffe/PyTorch/TensorFlow等) 基础扎实,对计算机视觉和人工智能研究和落地有热情 一周可实习5天,至少可以实习3个月。
-
研究方向: 深度学习(CNN, RNN)/计算机视觉/图像视频处理: 如图像和视频的分类、检测、识别、编辑、分割、 重建、3D视觉、图像生成、GAN、计算成像等 职位描述: 理论创新:研究领域最新技术,提出新idea,撰写技术专利或论文 算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 落地实现:核心代码实现,输出demo或SDK,根据产品反馈迭代优化 职位要求: 计算机/电子信息/数学相关专业,硕士及以上学历 熟练掌握C/C++/Python至少一种,工程实现能力强 熟悉常用CV库和深度学习框架(Caffe/PyTorch/TensorFlow等) 基础扎实,对计算机视觉和人工智能研究和落地有热情
-
工作职责 -负责百度商业转化数据算法研发工作,负责转化数据的去重、归因、过滤、分级等核心算法 -负责基于转化数据,构建面向广告触发、模型、创意、机制等策略应用的基础数据挖掘及算法工作 -负责基于转化数据完善商业用户及客户画像,提升用户及客户画像在广告策略中的效果 -负责协同架构、前端、平台等团队推动广告转化数据及基于广告转化数据的通用策略应用及落地 任职资格 -计算机及计算机相关专业本科及以上学历 -熟悉Linux/Unix开发环境,熟练使用C/C++、Shell/Python语言,具有良好的开发素养 -具备搜索、推荐、广告等业务领域内大数据处理及基础算法应用相关经验优先 -具备广告策略算法、内容理解、NLP、机器学习领域相关经验优先 -熟悉商业广告检索系统,熟悉计算广告,并有相关经验的优先 -具备优秀的逻辑思维能力,对解决挑战性问题充满热情,善于分析和解决问题 ,勇于面对挑战性问题 -具有良好的学习能力、时间和流程意识、沟通能力、团队合作、坦诚直接
-
岗位职责 1. 负责人脸识别、行人重识别、多目标检测与分割、视频内容理解、三维重建等模型的研发工作 2. 独立承担计算机视觉产品中的一个或多个独立模块的算法设计与落地部署 3. 跟进、复现、优化相关领域的前沿算法,参与构建公司计算机视觉核心技术架构,沉淀创新性研究成果 任职条件 1. 独立完成过(或者主要负责人)一个图像处理项目,熟练使用python或者c++语言 2. 熟练运用机器学习算法解决工程中的问题 3. 熟练使用tensorflow或者pytorch框架 4. 熟悉多目标检测及追踪算法,并能根据现场数据做出合理的算法修正 5. 能够使用onnx、ncnn、tensorrt等至少一种模型转换及部署工具 6. 计算机相关专业硕士及以上学历 7. 2年以上计算机视觉研发经验 8. 对行人重识别、目标分割算法、三维重建等算法中的一种或者多种有比较深入的研究,了解目前图像领域的新技术,在网络模型优化、损失函数优化、三维重建等方面有完整研发经验者优先
-
岗位职责 1. 负责人脸识别、目标检测与跟踪、模型部署等相关算法研发工作 2. 跟进、复现、优化相关领域的前沿算法,并在对应产品中完成落地 任职条件 1. 计算机相关专业硕士及以上学历 2. 一年以上计算机视觉研发经验 3. 了解数字图像处理的基础知识 4. 掌握传统机器学习模型原理(决策树、贝叶斯分类器、svm、集成学习) 5. 熟悉tensorflow或者pytorch的基础使用方法 6. 熟悉常见的检测模型,并能根据需求进行一些模型改造及训练 7. 了解opencv的调用,并能根据opencv编写基础的图像处理工程 8. 在目标检测,人脸识别和模型轻量化方面有商业级算法研发经验者优先
-
1、负责AR/MR/VR相关算法的移动端/云端算法的研发和优化,分析并解决实际问题; 2、聚焦NeRF、图/文生3D模型、3D内容创作/编辑等前沿技术方向,为用户提供低成本、高质量设计素材和视频编辑工具; 3、推动3D视觉技术与公司业务的结合落地,为用户创造差异化的体验,包括短视频/直播/美颜特效等。 任职要求 1、研究方向为2D计算机视觉、深度学习、3D视觉等领域,对vSLAM、XR、AIGC 3D生成相关领域有研究及实践经验优先; 2、参与或主导3D模型生成一项或多项相关工作,具有综合使用各类算法实现特定功能的能力; 3、参与或主导NeRF、Differentiable Rendering、自动重拓扑等一项或多项相关工作,具有综合使用各类算法实现特定功能的能力; 4、具备扎实的编程能力(C/C++,Python),有良好的数学功底; 5、热爱技术,有较好的学习能力、沟通能力和团队意识。