• 硬件,人工智能,工具 / 天使轮 / 少于15人
    关于我们: 我们是一家源自美国硅谷的科技公司,致力于在全自动飞行汽车领域推动创新的边界。我们的团队由充满活力、富有技术热情并且拥有共同愿景的个人组成,共同创建突破性的解决方案。利用先进的人工智能和自动导航技术,我们立志将城市空中出行的概念变为现实,迎来一个人类飞行便捷高效的新时代。加入我们,为该领域的突破性进展做出贡献。如果您对推动创新的边界充满热情,我们诚邀您成为我们充满活力的团队的一员! 职位概述: 作为一名机器视觉与图像处理软件工程师,您将在我们的自动返航和智能自主导航软件开发中担任关键角色。您将负责设计、开发和优化视觉定位与导航算法、图像预处理算法、目标检测与识别技术、态势感知系统以及视觉大语言模型的应用。通过您在计算机视觉和工程方面的专业知识,您将帮助我们创建下一代全自动飞行汽车和无人机的核心技术,确保在复杂环境中的安全与可靠性。 岗位职责: 算法开发: 优化和实现基于摄像头图像的视觉定位和视觉导航算法,确保其准确性、 稳健性和实时性。 实现目标识别和检测,特别是自主着陆能力,通过识别跑道和机场实现安全着陆。 进行图像语义分割和情景理解,增强无人机在复杂环境下的自主性。 使用深度学习模型(包括CNN、RNN、Transformer、VLM等)进行图像预处理和优化。 开发和优化去雾、去噪、去阴影、畸变矫正和颜色矫正算法,提升图像质量。 机器学习整合: 集成深度学习技术以改善视觉定位软件的适应性和鲁棒性。 优化: 持续优化软件性能,解决与可扩展性和资源约束相关的挑战。 测试和验证: 开发并实施软件端测试,验证各种条件和场景下视觉定位软件的可靠性和准确性。 资格要求: 计算机科学、机器人或相关领域的硕士学历+2年以上相关工作经验(或本科学历+3年以上相关工作经验)。 精通C++和Python,具备在C++平台上使用深度学习模型的经验。 在开发计算机视觉导航或图像处理算法方面具有丰富的实践经验:至少3年以上计算机视觉和图像处理相关经验,精通OpenCV,熟悉机器学习框架(PyTorch、LibTorch、 TensorFlow、Caffe等),熟悉各种深度学习模型(CNN、RNN、Transformer、VLM等)并有相关项目经验。 在开发和实施SLAM算法方面具有丰富的实践经验,至少2年以上相关经验。 熟悉ROS 2(特别是Humble版本),有相关项目经验者优先。 了解相机和无人机的相关知识,包括相机校准、图像捕获技术和无人机摄影测量。 在目标识别、目标检测、图像语义分割和情景理解方面有丰富经验。 优先技能: 有视觉定位技术、视觉导航技术、视觉里程计、SLAM 和传感器融合方面的经验。 具备运用深度学习模型进行图像处理的能力,如 SuperPoint 和 SuperGlue。 具备视觉导航经验,如光流导航和特征跟踪导航。 了解摄像头校准和几何计算机视觉。 曾参与无人机、自动驾驶汽⻋、机器人或自主系统软件开发工作。 有高空无人机图像处理经验者优先。 有处理大规模图像数据集和实时视频处理经验者优先。 良好的问题解决能力和创新思维,能够在远程工作环境中有效沟通和协作。 较强的问题解决能力,能够独立工作并具有团队合作精神。 福利: 具有竞争力的薪资和股权选项。 项目完成金和利润分成计划。 灵活的工作时间和100%远程工作选项。 职业成长和学习创新技术的广阔机会。 协作和包容的公司文化。 使用前沿技术和真实应用的实践经验。 工作地点: 工作地点不限,可100%远程工作。 工作时间: 没有固定的每日工作时长要求,但需确保工作质量和及时性。 申请方式: 请将您的简历、过往工作经验及相关项目链接发送至电子邮箱:*********************** 在邮件中,请简要说明您为何适合此职位,以及您对未来空中交通技术的看法。
  • 15k-25k 经验1-3年 / 硕士
    硬件,人工智能,工具 / 天使轮 / 少于15人
    关于我们: 我们是一家位于硅谷的前沿科技公司,致力于将未来的空中出行变为现实。我们的使命是开发全自动飞行汽车和无人机技术,让城市空中交通更加便捷和安全。我们汇集了一群富有创新精神和技术专长的专业人才,致力于突破当前技术的界限,开创空中出行的新纪元。如果您渴望参与这一充满挑战与机遇的领域,并推动世界向前发展,我们诚邀您加入我们的团队,共同打造未来。 职位概述: 作为自主飞行算法工程师,您将成为我们团队的重要一员,负责开发和实现支持飞行器自主性的核心算法。您将在高复杂度的环境下设计传感器融合和视觉感知算法,确保飞行器能够在动态环境中进行高维度的自主导航和避障。您的工作将直接影响飞行器的安全性、可靠性和效率,是我们未来技术成功的关键。 岗位职责: 1. 传感器数据融合: 设计并优化多传感器数据融合算法,将来自相机、激光雷达、IMU、GPS等传感器的数据整合为一致的三维环境模型。 2. 视觉感知与导航: 开发和实现先进的视觉感知算法,支持飞行器在复杂环境中的定位、导航和障碍物检测。 3. 合成视景与场景理解: 实施飞行器God’s Eye View(三维合成视景),提升飞行器对环境的全面感知能力,并据此做出安全有效的自主决策。 4. 实时系统开发: 设计高性能的实时计算框架,确保算法在资源受限的环境下能够快速、可靠地运行。 5. 算法优化与验证: 持续优化算法性能,并在仿真环境和实际飞行测试中验证算法的可靠性与稳定性。 6. 系统集成与协作: 与硬件工程师、控制工程师和软件开发团队紧密合作,确保算法在不同平台上的无缝集成与运行。 7. 创新与研发: 探索和研究最新的计算机视觉、深度学习和自主系统技术,将其应用于自主飞行器的开发中。 8. 技术文档与知识分享: 编写和维护详细的技术文档,并在团队内外分享技术成果,推动公司整体技术水平的提升。 资格要求: - 计算机科学、自动驾驶、机器人或相关领域的硕士及以上学历,或具有同等经验的本科生。 - 至少1年计算机视觉、机器人或自动驾驶领域的算法开发经验。 - 精通C++和Python编程,具备在嵌入式系统或边缘计算设备上部署自动驾驶AI算法的经验。 - 深入理解SLAM、视觉里程计、目标检测与跟踪、以及多传感器数据融合等技术。 - 熟悉深度学习框架(如PyTorch、TensorFlow)和计算机视觉库(如OpenCV)。 - 具备汽车领域Bird’s Eye View (BEV)经验者或飞机领域合成视景技术开发经验。 - 了解自动驾驶领域的各种传感器,包括但不限于摄像头、激光雷达、雷达、超声波、IMU和声呐等。 - 英文流利,能熟练阅读SOTA论文和跟踪前沿技术趋势。 优先条件: - 有自主系统(如无人机、自动驾驶汽车、机器人等)开发经验者优先。 - 有英文论文发表和前沿技术研究经验者优先。 - 具备无人机图像处理或视觉导航算法开发经验者优先。 - 有处理大规模实时图像数据和视频流的经验者优先。 - 具备ROS 2的实际项目开发经验,有多线程编程和实时系统开发经验,能够优化算法的执行效率和稳定性。 福利待遇: - 具有竞争力的薪酬和利润分成。 - 股权激励。 - 灵活的工作时间与远程工作机会,支持全球优秀人才的加入。 - 参与前沿技术研发,推动空中出行技术的革新与发展。 - 提供个人成长和职业发展的广阔空间,支持持续学习和技能提升。 工作地点: 可远程工作,地点不限。 申请方式: 如果您对未来的空中交通技术充满激情,并且具备我们所需的专业技能,请将您的简历和相关项目作品发送至:***********************。我们期待与您一起,探索空中出行的无限可能。
  • 40k-55k·15薪 经验5-10年 / 本科
    汽车丨出行 / 未融资 / 2000人以上
    岗位职责: 1、负责行车场景周视感知算法设计和开发工作,包括高速/城区等场景中的障碍物、车道线等感知任务的模型及后处理算法开发工作 2、负责泊车场景环视感知算法设计和开发工作,包括室内、室外等场景中的车位、障碍物等感知任务的模型及后处理算法开发工作 3、负责自动驾驶领域大模型等前沿技术研发工作 任职要求: 1、计算机、汽车工业、机器人、电子或相关专业; 2、熟悉当前主流的深度学习算法,包括但不限于BEV感知、无监督训练、大模型、目标检测、图像分割、多任务学习、多传感融合等领域; 3、熟悉常用的深度学习框架,如PyTorch、TensorFlow、MxNet等,要求至少对其中一种框架较为熟练; 4、至少精通Python或C++编程,熟悉常用的视觉算法库如numpy/opencv等,了解常用的传统图像处理算法。 5、具备针对车载端侧平台检测/分割等算法设计经验和落地能力,有针对自动驾驶场景落地障碍物、车道线、红绿灯、freespace等算法经验者优先。 6、具有正确的价值观、内在驱动力;具有较强的学习能力、沟通能力和团队协作能力;能主动解决问题;能够承受较强的工作压力。
  • 15k-30k·15薪 经验3-5年 / 硕士
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1. 负责计算机视觉算法和深度学习算法的前沿技术的研发工作。 2. 负责物体检测(行人、车辆、OCR、通用目标)、分类、跟踪、识别、图像理解、图像质量评估和增强,视频分析等前沿技术研发和实现。 岗位要求: 1. 图像处理、模式识别、机器学习相关专业硕士及以上。 2. 在深度学习、统计机器学习、计算机视觉和最优化方法等方面有较深入的研究。 3. 熟悉物体(行人、车辆、人脸、通用目标)检测、跟踪与识别算法。 4. 熟悉图像理解(分类、分割等)、视频分析算法。 5. 熟悉cnn,rcnn,frcnn,boost,svm其中至少一种,并且有实战经验 6. 动手能力强,熟练掌握C/C /Python/Matlab语言,有较强的算法分析和实现能力 7. 精通Caffe、MxNet、Tensorflow、Cuda-convnet、Torch等任一种深度学习开源框架者优先。 8. 有智能安防领域经验者优先。
  • 18k-36k 经验3-5年 / 硕士
    金融业 / 上市公司 / 2000人以上
    工作职责 : 1. 负责计算机视觉、多模态AIGC内容生成领域的核心算法研发及效果优化,包含物体检测和识别、物体分割、视频内容理解、图文视频内容生成、虚拟数字人等方向; 2. 追踪和学习人工智能领域的国际前沿技术研究,结合业务需求,研发计算机视觉、多模态内容生成类算法,推动AI技术在保险领域的智能应用及落地,根据业务需求持续追踪应用效果并进行优化迭代,赋能保险行业智能化营销,数字化运营等。 任职资格 : 1. 硕士及以上学历,具备扎实的计算机基础知识,3年以上计算机科学、人工智能相关领域工作经验,熟悉物体识别与分类、物体跟踪、三维视觉、视频内容理解、文生图/图生文、虚拟数字人等主流算法及应用; 2. 算法基础扎实,有较强的算法理解和实现能力,熟悉掌握C/C++,Python等编程语言、常用数据结构算法以及Linux环境开发和实现, 熟悉掌握Tensorflow, Pytorch等深度学习框架,有熟练框架使用及模型训练及模型部署经验; 3. 学习能力强,紧跟国际前沿技术,富有创造性思维,表达能力良好,能独立高效完成中英文技术文档撰写。 4. 在相关国际会议或主流期刊,如CVPR、ICCV、ECCV、NeurIPS、SIGGRAPH等发表论文者优先,有计算机视觉/深度学习方向比赛经验并取得优秀名次者优先,有高质量Github项目经验者优先。 5. 责任心强,积极主动,有良好的沟通能力和团队合作能力,有技术负责、项目管理、多团队协作管理经验者优先。
  • 60k-80k 经验5-10年 / 硕士
    硬件 / 不需要融资 / 2000人以上
    一、职位概述 作为视觉方向的大模型算法工程师/专家,你将负责设计、开发和优化基于深度学习的计算机视觉模型,以解决复杂的视觉任务,并推动公司在人工智能领域的技术创新和业务发展。 二、主要职责 1. 算法研究与开发 • 跟踪和研究最新的深度学习和计算机视觉技术,探索其在实际应用中的潜力。 • 设计和开发高效的视觉大模型,包括但不限于图像分类、目标检测、语义分割等任务。 • 优化模型架构和训练算法,提高模型的性能和效率。 2. 数据处理与分析 • 收集、整理和标注大规模的视觉数据集,确保数据的质量和多样性。 • 分析数据分布和特点,为模型设计和训练提供依据。 • 开发数据增强技术,提高模型的泛化能力。 3. 模型训练与优化 • 搭建和维护高性能的计算环境,进行大规模模型训练。 • 监控训练过程,调整超参数,确保模型的收敛和稳定性。 • 采用模型压缩和加速技术,降低模型的计算成本和存储需求。 4. 技术应用与创新 • 将视觉大模型应用于实际项目中,解决具体的业务问题。 • 与其他团队合作,推动人工智能技术在产品和服务中的集成和落地。 • 探索新的应用场景和技术方向,为公司的发展提供创新思路。 5. 图像编辑场景应用 • 针对不同的图像编辑场景,如人像美化、背景替换、图像修复等,开发相应的视觉大模型算法。 • 优化图像编辑算法,提高编辑效果的自然度和真实感。 • 结合用户需求和反馈,不断改进图像编辑功能,提升用户体验。 三、任职要求 1. 教育背景 • 计算机科学、电子工程、数学等相关专业硕士及以上学历。博士优先 2. 技术能力 • 具备扎实的深度学习和计算机视觉理论基础,熟悉常见的深度学习框架(如 PyTorch、TensorFlow 等)。 • 有丰富的视觉大模型开发经验,能够独立完成模型设计、训练和优化。 • 熟练掌握数据处理和分析技术,具备大规模数据处理能力。 • 具备良好的编程能力,熟练使用 Python、C++等编程语言。 3. 创新能力 • 具有较强的创新意识和探索精神,能够独立思考和解决问题。 • 关注人工智能领域的最新技术动态,积极尝试新的方法和技术。 4. 团队合作 • 具备良好的团队合作精神和沟通能力,能够与不同背景的人员合作。 • 有责任心,工作认真负责,能够承受一定的工作压力。
  • 35k-70k 经验3-5年 / 本科
    消费生活 / 上市公司 / 2000人以上
    岗位职责: 1、参与页面分析挖掘算法的研究与实现,通过算法策略优化页面分类模型、文本分类模型。 2、利用文本挖掘、图像理解等业界先进技术,对多模态内容进行挖掘与理解。 3、工作范围涵盖网页筛选与理解、网页与站点分类和去重、多类型非网页类多模态数据的处理和理解。 岗位基本要求: 1、计算机相关专业本科及以上相关学历,具备优秀的理解力、沟通能力和团队协作能力。 2、熟练掌握 c++/python/Java等编程语言,并且在机器学习,自然语言处理领域有扎实的理论功底和动手能力。具备优秀的逻辑思维能力和数据科学能力,在相关领域比赛中获奖优先。 3、在信息检索、自然语言处理/图像与视频理解等方面有非常扎实的理论功底,以及丰富的解决实际问题的项目经验。有信息检索相关领域工作经验优先。 4、善于学习领域前沿技术并能快速应用到实际工作当中,在自然语言处理,信息检索、计算机视觉等领域有相关学术论著优先。
  • 60k-80k 经验10年以上 / 硕士
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责AI算法领域的需求分析和架构设计,涉及大模型(LLM、VLM等)、CV视觉、语音等领域; 2、负责如上领域的业界关键技术洞察,技术竞争力规划,提出相关技术决策; 3、跨领域组织团队进行算法技术的落地,确保技术产出符合关键规划。 职位要求: 1、硕士研究生及以上学历,计算机或算法相关专业,并对大模型算法有架构经验; 2、具备大模型结构/推理/训练优化经验,包括但不限于:蒸馏、剪枝、量化、注意力机制等;熟悉其他机器学习、深度学习等相关算法领域; 3、具备把AI模型算法落地产品的经验,包含但不限于智能助手(对话系统、视觉等),并有算法性能优化经验; 4、具备良好的团队协作和沟通能力,能够与不同背景的团队成员有效合作,实现共同目标; 5、具备创新思维,对新技术和行业趋势保持敏感,并能够应用创新思维解决复杂的技术挑战。
  • 35k-65k 经验不限 / 本科
    智能硬件,电商平台 / 上市公司 / 2000人以上
    职位描述 1. 将独立感知模块的输出统一并进行融合,得到适合后续模块的表示。 2. 设计系统和完善的算法与传感器失效检测模块 职位要求 1、熟悉基于滤波和优化的状态估计算法,并可以灵活运用解决实际问题; 2、良好的编程能力,熟悉python, c++,掌握常见的算法和数据结构知识。 加分项 1、熟悉计算机视觉中多视角几何知识; 2、熟悉传统统计机器学习知识,如概率图模型等,并有项目实践经验; 3、参加kaggle比赛获得前十名者; 4、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
  • 35k-50k·16薪 经验3-5年 / 硕士
    居住服务 / 上市公司 / 2000人以上
    参与AIGC领域最有商业价值的落地方向之一—AI辅助装修设计,集团重点项目团队。 工作职责 1. 负责文生图、图生图、多模态AIGC等方向的算法研发工作; 2. 持续跟踪行业前沿算法进展,结合具体业务场景进行算法优化和应用落地; 3. 结合产品需求,从prompt优化,模型finetune等方面优化AI辅助设计模型效果,解决面向业务场景的应用落地问题; 4. 与工程、产品团队配合,推动团队成果的应用落地。 任职资格 1. 计算机、人工智能等相关专业的***硕士研究生及以上学历,2年以上互联网公司算法研发经验,博士优先; 2. 具有扎实的计算机视觉基础,熟悉常见的生成式模型,包括但不限于GAN、VAE、Diffusion,有相关方向会议/期刊论文者优先; 3. 具备较强的学习能力和清晰的逻辑思维能力,对AI生成技术的应用抱有强烈的好奇心和兴趣; 4. 具备良好的团队合作、沟通表达能力。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 字节跳动ByteDance Research致力于人工智能领域的前沿技术研究,涵盖自然语言处理、计算机视觉、机器学习、机器人、AI for Science、Responsible AI等多个领域,同时将研究成果落地,为公司现有的产品和业务提供技术支持和服务。 1、建设大规模的视频生成基础模型,取得世界领先水平; 2、进行算法的设计和效果迭代,探索视频生成最优的模型架构和最佳的训练方法,不断提升生成能力上限。 职位要求: 1、有视频生成、图片生成、多模态预训练、视频理解、图片理解,其中一个或者多个领域的研究经验,并对相关工作有深刻的理解; 2、优秀的代码能力,熟练掌握Pytorch,能在较短时间内独立实现论文算法,并且能有针对性地优化; 3、优秀的团队合作能力和持续学习能力,能在团队合作中高效推进项目进展; 4、深入理解Diffusion Models、Image/Video Tokenizers 、Transformer Scaling up经验者优先;开发出相关领域中重要任务 SoTA 模型者优先。
  • 35k-70k·15薪 经验3-5年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    1.负责视频理解、视频编辑处理与创意生成相关算法研发。 2.负责视频技术在美团的全场景落地,助力业务解决视频内容生产、分发、展示等环节的实际问题,包括但不限于:视频多模态内容理解,视频智能创作,视频画质增强。 岗位要求: 1.2年以上工作经验。 2.熟练掌握模式识别和计算机视觉的基础理论和方法,在一个或多个领域有深入研究:视频分类与结构化分析、动作识别、视频跨模态表征、视频质量评价、视频超分等。 3.具备扎实的工程能力,熟悉TensorFlow,PyTorch等主流框架。 4.具有广阔的技术视野,紧跟领域前沿,善于通过创造性的方法解决复杂的实际问题。 5.具有优秀的团队协作和项目推动能力。 具备以下优先: 1.在视频搜索推荐,视频剪辑创作等领域,具有行业应用经验。 2.在业界大规模视频数据集上有过研发经验。 3.在计算机视觉的通用或细分领域的权威竞赛中取得较好名次。 4.在计算机视觉领域内的**会议或权威期刊发表过论文。 岗位亮点: 1.前沿探索与业务落地相结合。以公司业务为依托迭代创新,技术应用场景广泛覆盖本地生活服务与零售电商行业。 2.公司核心计算机视觉算法团队,技术氛围好,成长空间大。
  • 20k-40k 经验3-5年 / 硕士
    电商,硬件 / 上市公司 / 150-500人
    岗位职责: 1、负责图像/视频的分析、诊断、搜索等方面的算法研究,包括图像检测、图像识别、图像分割、目标跟踪、视频语义理解等算法的技术实现; 2、负责图像/视频相关算法在智慧城市、智慧交通、智慧文旅、智慧家庭等项目的落地优化;负责计算机视觉算法前沿技术探索,以及与自然语言处理、计算机图形学等相关技术的联合创新应用。 3、负责相关专利论文的撰写发表; 任职要求: 1、硕士及以上学历,3年以上相关工作经验,计算机、自动化、图像处理、模式识别等相关专业; 2、在智慧城市、城市治理(如 占道经营、沿街晾晒、私搭乱建、道路积水、地面垃圾)等有相关算法研发经验者优先; 3、极佳的工程能力,熟练掌握C/C++、Python等至少一门语言 ,ACM、topcoder等编程比赛获奖者优先; 4、优良的科研能力,有实际成果并发表在ICCV、CVPR、ICML、TPAMI等国际**会议、期刊者优先 ; 5、具有强烈的工作责任心、有良好的沟通能力和团队合作精神、承压能力。
  • 15k-20k·13薪 经验1-3年 / 本科
    工具类产品 / 上市公司 / 2000人以上
    岗位要求: 1. 熟悉计算机视觉(CV)领域的相关技术,熟练掌握Python等至少一种语言; 2.具备计算机视觉领域的项目经验,对项目的方案设计及落地实施有一定的见解; 3.了解图像处理的基本理论知识,熟悉分类、检测、分割、拼接等常见视觉任务模型,熟悉各方案的应用场景和优化方法; 4.掌握常用的算法设计,熟悉常用的算法框架,如Tensorflow、OpenCV等; 5.良好的沟通能力和团队合作能力。 岗位职责: 1.参与计算机视觉相关的项目方案设计,协助项目实施、维护和优化; 2.参与攻坚项目中与计算机视觉相关的难题,编写相应的代码; 3.自行调研计算机视觉领域的新技术,推动新技术在实际项目中的应用; 4.负责训练相关的机器学习(包括深度学习)模型。
  • 30k-50k·15薪 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    - 职位描述: 1. 持续优化微博视频的清晰度; 2. 负责视频编解码算法的优化,为画质提升、带宽降低等提供技术支持; 3. 优化现有编解码器的性能,包括编码速度、压缩效率等。编码算法包括H.264、H.265、AV1等。 4.分析视频编解码过程中的瓶颈,提出解决方案以提高整体系统性能。 职位要求: 1. 本科及以上学历,计算机、通信、电子信息等相关专业熟悉视频编解码算法者优先; 2. 有主流编码器优化经验者优先。 3. 熟悉x265、x264、svt-av1、libaom、ffmpeg等开源库者优先; 4. 要求有较强的沟通表达能力和团队意识;