• 12k-24k 经验3-5年 / 硕士
    数据服务 / 上市公司 / 500-2000人
    1.计算机科学或相关领域的硕士学位; 2.有语音识别的实践经验优先; 3.熟练使用C/C++或Tensor Flow; 4.有能力编写稳定且易于维护的高质量代码; 5.有在Linux环境的使用经验。
  • 4k-6k 经验不限 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    岗位职责: 1. 语音识别,声纹识别方向 需求: 1. 熟悉C++和Python 2. 熟悉机器学习和深度学习算法 3. 熟练使用Pytorch或TensorFlow 4. 有Kaldi,DeepSpeech,ESPNet经验优先 5. 每周实习时间保证4天以上
  • 15k-25k 经验不限 / 本科
    人工智能服务 / A轮 / 50-150人
    蔚蓝由一群希望致力于为社会带来最好的人工智能和机器人科技创新的工程师一手打造,我们希望通过科技创新来让我们的世界变得更加美好。蔚蓝向此目标迈出的第一步是打造面向所有家庭和企业的个人机器人,以加快人工智能和机器人领域的技术革新,这将使我们能够更好的加速世界向可持续创造与生产的转变。 您所选择的蔚蓝团队,是一支以特种作战标准严格要求自己的科技创新创业团队。您将参与的是一项对社会有意义、有价值的伟大事业,您将加入的是一支艰苦努力、不断创新的特种作战团队,您将负责的是一款激动人心的、具有划时代意义的科技创新产品,您将面对巨大的综合性挑战和极速的事业发展机遇。我们要求您兼具卓越的专业能力和不畏艰难、勤奋拼搏的奋斗者品质,在别人都无能为力决定放弃的时候,您坚信办法总比困难多。 我们信奉专业的人才能创造专业的结果,因此,我们只招募专业的人从事专业的事情。在坚定认同我们共同事业的前提下,我们要求您必须能够自我管理、目标驱动、结果导向,必须能够科学、系统、严谨的处理关键工作,必须能够给出有效、高效、长效的解决方案,确保我们总是可以在激烈的市场竞争中克服困难、突破挑战、创造价值。 我们将保障团队的每一位成员能够在此前提下快速成长和发展,保障每一位成员能够多产多得、共创共赢。 职位介绍 您将负责开发语音识别、自然语言处理和语音合成等技术,实现人机交互和语音交互功能,提高用户体验和机器的智能化水平。 职位描述 1.负责机器人语音交互系统开发,包含声纹识别、情绪识别、意图理解、语音交互逻辑等算法研发; 负责语音交互算法的开发和优化,实现高效、准确的语音识别和语音合成; 2.参与系统架构和算法设计,对整个语音交互系统进行优化和改进; 3.参与语音交互产品的规划、设计和开发,与产品经理、硬件工程师等进行协作; 4.负责处理语音数据,如采集、处理、压缩、存储等,确保数据质量和保密性; 5.参与语音交互技术的研究和创新,跟踪最新技术动态,进行技术评估和应用。 职位要求 1.本科及以上学历,计算机、通信、电子等相关专业,2年以上语音处理算法相关经验,扎实的数学基础和算法能力,熟练掌握信号处理、语音识别、语音合成、自然语言处理等相关技术;硕士及以上学历的计算机、通信、电子等相关专业的海内外名校毕业生优先; 2.熟练掌握C++、Python等编程语言,有良好的编码能力和代码风格; 熟悉常用的语音处理工具和库,如Kaldi、WeNet、Whisper等,并能够进行二次开发;熟悉深度学习模型的训练、优化和部署,熟悉常用深度学习框架,如TensorFlow、PyTorch等; 3.熟悉音频编解码技术,如PCM、MP3、AAC等,以及音频采集、处理和压缩等相关技术; 熟悉语音交互技术的发展趋势和应用场景,有一定的项目经验,能够独立完成语音交互模块的开发和优化; 4.熟悉深度学习模型的训练和优化,对语音领域的深度学习模型有深入理解;熟悉自然语言处理(NLP)领域的技术,包括文本预处理、序列标注、语言模型等方面的知识;有语音识别(ASR)和语音合成(TTS)方面的研究经验; 5.有团队协作经验,良好的沟通和组织协调能力,有较强的学习和理解能力; 6.熟悉智能硬件的语音交互技术和应用场景,有智能音箱、智能手机、车载语音系统等相关产品的开发经验者优先;熟悉语音唤醒、说话人识别、情感识别等领域的技术和应用; 熟悉语音识别模型的训练和调优,熟练掌握声学模型、语言模型、发音词典等方面的知识;有大规模语音数据处理和挖掘的经验,熟悉语音数据标注和清洗技术者优先。
  • 15k-22k 经验3-5年 / 本科
    电商平台,内容资讯 / 不需要融资 / 150-500人
    岗位职责: 1、负责机器视觉领域落地算法模型的性能提升,解决技术落地过程中的难点问题, 2、参与AI平台包含的自然语言处理功能开发工作、为其他业务需求中NLP相关功能提供解决方案, 3. 语音领域人工智能算法和模型的研究、开发和性能调优。 任职资格: 1、本科以上学历,计算机、数学、统计学相关专业,2年以上工作经验, 2、基于语义理解,熟练掌握NLP语义理解中的各种算法模型的应用以及调优和上线部署的经历, 3、精通OpenCV,熟练掌握Caffe、Tensorflow、Pytorch、Paddle等开源深度学习框架, 4、有相关语音识别、语音合成、声纹识别、音视频编解码等相关经验优先。
  • 30k-50k 经验3-5年 / 硕士
    汽车丨出行 / 未融资 / 150-500人
    职位描述: 1、参与企业效能协同办公场景下生成式AI的算法研究与产品落地; 2、参与LLM相关数据处理与模型训练的工作,配合产品完成业务相关的需求及指标; 3、跟踪研究业界LLM新算法及技术,并将其应用于效能场景的实际产品中; 4、安全策略优化,多模态构建策略模型; 5、高危场景识别,对特定的高危场景进行自动化识别; 职位要求: 1、具有计算机及相关专业本科以上学历,3年及以上工作经验(优先); 2、熟悉前沿AIGC产品,如Stable Diffusion、MidJourney、ChatGPT等; 3、具有端到端大语言模型研究和落地优化经验,熟悉常用模型/算法,如Transformer、Attention等; 4、熟练掌握PyTorch、TensorFlow等深度学习框架; 5、具有良好的逻辑思维能力,主动性强,注重细节,善于团队合作; 6、在NLP、声纹识别等方面有实际经验优先;
  • 15k-25k·13薪 经验在校/应届 / 本科
    移动互联网,教育 / 上市公司 / 500-2000人
    NLP算法工程师 职位描述: 1、处理与分析大规模数据,从中挖掘有价值的信息,以提升业务产品的用户体验; 2、负责跟踪、复现与优化工业/学术界相关领域前沿的AI大模型算法; 3、将研发的算法模型应用于文本问答、机器翻译、作文批改,对话生成等应用中,优化现有业务流程,提升系统性能,改善用户体验; 4、与产品团队、工程团队和业务团队紧密合作,理解业务需求,并将算法技术转化为实际的产品和解决方案。 职位要求: 1、计算机科学、人工智能、数据科学、数学或相关专业,硕士及以上学历; 2、至少实践过一种自然语言处理任务,包括但不限于文本分类、序列标注、自动摘要、机器翻译、对话生成等; 3、至少熟练掌握PyTorch、TensorFlow等框架中的一种; 4、具备出色的Paper Reading及Coding能力,拥有良好的Python编码习惯,能够快速执行实验、验证想法; 5、具备良好的沟通能力和团队协作能力,对新知识有强烈的学习欲望; 6、有大模型相关项目和研究背景,有NLP/多模态会议论文发表经历者优先。 语音算法工程师(语音合成、生成式方向) 职位描述: 1、参与语音合成、VC相关项目的算法研究和系统开发工作,包括算法模型设计、开发、测试和优化等; 2、根据实际业务需求,结合语音合成、VC算法,进行现有系统算法的优化和系统框架升级; 3、研究语音合成相关领域的前沿技术和发展趋势,不断提高技术水平和创新能力,例如和LLM结合; 4、负责语音合成算法的实现和优化,保证系统的稳定性和性能; 5、与其他部门进行紧密合作,保证项目的顺利进行和交付。 职位要求: 1、计算机相关专业、生成式方向,硕士及以上学历; 2、具有语音合成、或生成式AI方向相关背景,包括文本分析前端、声学模型、声码器等,有多语种、方言TTS经验者优先; 3、熟练使用至少一种语音合成声学模型和声码器算法,比如DelightfulTTS、Vits/Jets、hifigan等; 4、发表过顶会TTS/VC相关论文(icassp、interspeech等)或者在国际比赛拿到靠前名次者优先; 5、踏实认真,对技术研究和落地抱有热情。 语音算法工程师(语音识别方向) 职位描述: 1、参与语音识别相关项目的算法研究和系统开发工作; 2、负责现有语音识别系统的算法优化和系统框架升级; 3、跟踪和研究语音识别技术的发展,提出新的算法和方案,例如和LLM结合; 4、针对实际业务需求,进行语音识别算法的设计、实现、调试和优化; 5、参与语音识别产品的需求分析和产品设计,为产品提供技术支持。 职位要求: 1、计算机相关专业,硕士及以上学历; 2、至少满足以下三项能力要求: 1)具有语音处理相关背景,比如语音识别、语言模型、声纹识别、语音唤醒、VAD等; 2)具有模型调优的经验,并至少熟悉其中一种常用的语音识别算法,比如Conformer、Transformer、CTC/Attention、RNNT等; 3)至少熟悉一种常见的语音识别训练框架,比如whisper、espnet、wenet、kaldi等; 4)熟练使用C++进行系统开发; 3、发表过顶会ASR相关论文(icassp、interspeech等)或者在国际比赛拿到靠前名次者优先; 4、踏实认真,对技术研究和落地抱有热情。 棋类算法工程师 职位描述: 1、参与围棋(国际象棋,中国象棋)算法研究和工程化落地; 2、对围棋,国际象棋规则有一定的了解者优先; 3、了解Katago、AlphaGo的工作原理,对强化学习有一定的了解; 4、追踪算法前沿技术,探索将新技术应用于实际业务。 职位要求: 1、熟悉C++开发,硕士及以上学历; 2、良好的编程基础,熟悉C/C++和Python语言,掌握常用的数据结构和算法; 3、熟悉AlphaGo、AlphaZero、KataGo等相关算法,在AI棋类大赛中取得好成绩者优先(参考:星阵围棋、99围棋、爱棋道); 4、较强的学习能力,良好的沟通能力,有团队合作意识。 视觉-语言跨模态LLM算法工程师 职位描述: 1、负责图像领域(如文字/物体的检测识别分类分割、跟踪、理解、虚拟人生成等)最新算法的研发和落地; 2、负责跨模态图文解析与理解的算法的研发与落地; 3、负责文档问答算法的研究与优化、应用落地探索; 4、参与团队技术讨论和项目管理,保证研发进度和质量; 5、不断学习和掌握最新的技术并应用到实际产品中。 职位要求: 1、硕士及以上学历; 2、动手能力强,精通python/pytorch,有良好的代码习惯; 3、有较丰富的算法研发经验,对相关算法有深入研究和理解; 4、有很强的责任心和主动性,有较强沟通能力。
  • 20k-40k 经验1-3年 / 硕士
    数据服务|咨询 / 不需要融资 / 150-500人
    岗位职责: 1、从事语音合成、声音复刻相关的研发工作; 2、负责语音算法开发及相关项目的工程化落地。 任职要求: 1、计算机、通信、电子、数学等相关专业,硕士及以上学历,2年以上开发经验; 2、熟悉 Kaldi、TensorFlow、Pytorch等计算框架,具有实际项目产品开发经验; 3、良好的工程能力,能独立将算法模型应用于实际产品研发; 4、具备算法模型上线应用能力,能够根据业务需求快速构建模型,针对业务问题快速进行算法应用及开发; 5、熟练掌握 C/C++, Python,计算机基础扎实,有很强的算法实现能力; 6、有语音识别相关经验,如语音合成、声音复刻、语音识别、语种识别、声纹识别等方向; 7、心态较好,有较强的抗压能力。
  • 30k-60k 经验不限 / 硕士
    金融 / 上市公司 / 2000人以上
    部门特色: 同花顺围绕智能投研,智能投资,智能投顾布局了全栈的AI技术,包括:语音,图像,图形,机器翻译,自然语言处理,推荐,常识构建和应用,搜索。 这些AI的技术用于解决投资者方方面面的问题,不限于:用户投资目标设定和达成相关的问题,规避投资风险相关问题,数据获取的问题,投资分析类的问题,交易策略的生产问题和投资心理类的问题,等等。 问财团队主攻智能投顾,综合承载了所有的AI技术,同时全面支持同花顺AI创新团队。AI创新团队已将AI技术拓展到了众多行业,致力于通过先进技术与商业结合,解决社会发展中的实际难题,引领行业趋势,实现用技术力量改变世界! 【NLP算法】 自然语言理解与多轮对话前沿算法研发,支撑B/C两端的业务发展。 在自由对话、double check、自然语言生成等方面有所创新 1、技术上,熟悉预训练模型:bert,electra以及各种变体,能在此基础上做开发; 2、能独立完成模型全流程开发:数据预处理,迭代训练,结果测试,生成工程服务所需文件,搭建上线工程服务代码; 3、熟悉NLP常见子任务及其常见的解决方案; 4、能调研工作相关的学界,工业界最新进展,典型架构,并做实验验证; 【图像算法】 岗位职责:基于业务需求负责图像、视频相关算法研究和开发,包括但不限于图像分类、图像识别、图像检测、图像生成、图像编辑等。 1、博士优先,模式识别、数字图像处理、数字信号处理或计算机相关专业; 2、在相关领域的**会议、期刊发表过论文,或者相关竞赛成绩突出的; 3、熟练使用python、c++、java中任意一种或多种编程语言,工程能力突出; 4、熟悉计算机视觉、机器学习、图像识别与视频处理等相关领域技术,有真实项目实践经验; 5、勇于尝试新方法、新思路,乐于沟通交流,具备优秀的团队协作能力。 【语音算法】 1、参与智能语音各方向技术基础研发工作,包括语音识别、语音合成、声纹识别、情感识别、语言模型、文本分析处理、歌声音乐合成、语音评测、模型推理加速、语音增强、声学信号处理等语音相关技术; 2、 参与前沿语音技术的调研,推动新技术转化应用。 1、具有人工智能、计算机、信号处理等相关专业,博士学历优先; 2、有机器学习/深度学习基础,熟练掌握算法应用实现; 3、熟练掌握python语言,熟悉C++编程,有较好的工程化能力; 4、有较强的自主学习和独立研究能力,能够跟踪业界最新技术进展,有创新意识; 5、具备较好的团队协作能力,主动沟通,推进工作开展。 6、发表过相关论文者优先。
  • 6k-12k 经验在校/应届 / 本科
    移动互联网,企业服务 / 不需要融资 / 50-150人
    职位诱惑: 绩效奖金,幸福下午茶,月度活动 职位描述: 岗位职责: 负责声纹识别、图像分析、人脸识别等研究与开发。 任职资格: 1、有计算机基础知识; 2、至少熟悉使用一门编程语言; 3、有做过一些相关的项目和研究; 4、热爱人工智能,对工作认真细致、积极主动,学习能力强,善于思考和总结; 接受全职实习生,一周实习5天。 公司属于国家高新技术行业,设计能够服务大众的软件系统,基于客户需求来提供解决方案,每一个成功验收的项目都是我们每一个同事自豪的成绩。 我们极力为员工提供和谐的办公环境,快乐的下午茶、愉快的部门活动,各种级别的超牛大神,技术大咖齐聚一堂,就差一个可爱的你! 附加信息: 工作时间:周末双休 上下班时间:09:00-18:30
  • 15k-25k 经验5-10年 / 本科
    硬件,物联网 / 天使轮 / 50-150人
    【特别说明】 1、大小周,工作时间8:30-12:00,13:30-17:30; 2、其他法定节假日正常放假。 【岗位职责】 1、主导专项课题的攻关,包括立项、计划、执行、落地,问题闭环。 2、从事音频领域的技术研究工作,包括语音增强(AEC、ANC、AFC、ANS),智能语音(唤醒、声纹识别)、语音合成、声学系统等的设计和开发,提出创新性思路和设计方案。 3、参与高校或科研院所等的联合研究和技术合作。 4、负责音频领域前瞻性技术研究和探索,识别发展趋势和关键技术方向,支持产品竞争力持续领先。 5、围绕音频领域基础应用,创造**的音频体验。 【任职资格】 1、45岁以下/本科及以上学历,计算机、数学、电子与通信相关专业; 2、三年以上同等岗位/职位经验; 3、基本技能和素质: 1)熟练使用Matlab、C/C++、Python ; 2)掌握语音信号处理相关技术,如回声消除,语音增强,麦克风阵列等; 3)熟悉音频相关质量评估方法; 4)熟悉常用的AI模型如rnnnoise,percepnet,dtln,tensorflow等,具有2年以上深度学习方向工业化经验; 5)具有DSP/ARM/FPGA/CPU等器件平台算法优化经验,熟悉SHARC+平台; 6)有较好的英文功底,能阅读相关英文资料; 7)有声音6A算法经验者优先(AEC、AFC、ANS、ANC、AGC、AM); 4、个性特征:较强的沟通协调能力; 有强烈的责任感,善于团队协作; 【综合待遇】 1、工资:综合工资性收入15-25K; 2、奖金:专项研发奖金; 3、五险一金(3个月试用期转正之后); 4、午餐补贴; 5、全勤奖; 6、团建活动。 【公司介绍】 公司名字:长沙东玛克(成立于2006年的佛山东玛克于2018年迁入长沙)。 公司特点:高新技术企业,研产销一体化。 核心技术:智慧无感扩声技术(国家发明专利)。 公司产品:吊麦扩声系统(教育装备)。 客户群体:教育信息化集成商 用户群体:****、政企单位 标杆客户(高校):清华大学、北京大学、国防科技大学、南京大学、武汉大学、厦门大学。 标杆客户(政企):湖南省政府、湖南省委**、湖北省政府、河南省高级人民法院。 【培训晋升】 1.公司有完善的培训体系,新人入职培训-试用期一对一辅导培训-专业技能培训-管理类培训等; 2.公平公正的晋升通道: (1)管理序列:基层员工-储备干部-部门主管-部门经理-部门总监-副总经理; (2)技术序列:助理工程师-初级工程师-中级工程师-高级工程师-专家工程师。 【企业文化】 企业使命:革新教学音频,造福亿万师生! 企业愿景: 努力打造教学和会议智能音频行业的领导品牌。 企业价值观:诚信为本、责任为基、创新为骨、开放为怀! 管理理念: 以市场为导向 以客户为中心 以奋斗者为根本 以创新为动力 以开放聚资源 以标准化为抓手 【公司地址】 长沙市岳麓区尖山路39号中电软件园总部大楼8楼
  • 5k-6k 经验在校/应届 / 硕士
    电商 / 上市公司 / 2000人以上
    职位描述 岗位职责: 1. 针对语音识别、语音合成、语音增强、语音评测、自然语言处理等业务,参与算法和系统研发,开展相关优化实验; 2. 对实验数据进行处理和分析,发现现有系统和算法的不足,提出改进并推动实现; 3. 追踪算法前沿技术,探索将新技术应用于实际业务,语音评测。 岗位要求: 1. 语音识别/合成、信号处理、模式识别、计算机或相关专业学历,有算法、系统开发经验; 2. 熟悉Linux,python/java和C/C++开发; 3. 有以下领域之一的背景:语音识别 / 语音合成 / 自然语言处理 / 语音增强 / 声纹识别 / 语音唤醒 / 机器学习 / 数据挖掘 / 统计分析 / 图像处理。有深度学习和神经网络模型经验者优先; 4. 良好的主动性、逻辑思维能力、沟通能力和团队合作能力。
  • 14k-20k 经验在校/应届 / 硕士
    智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 工作内容: 1、负责语音合成、情感语音识别、音乐生成、语音增强等相关算法的研究和开发工作; 2、探索语音领域前沿技术,跟进国际前沿研究成果; 岗位要求: 1、硕士以上学历,信号处理、计算机、电气工程或相关专业背景,掌握语音相关算法基础理论知识; 2、一年以上深度学习音频方向相关工作经验; 3、熟悉一种以上深度学习框架(如Tensorflow、PyTorch),至少熟练掌握Python、C/C++、Jave等一门编程语言; 4、在至少一个音频领域有深入研究,例如语音合成、音乐合成、声纹识别、语音增强等; 5、具有团队协作能力,有责任心、沟通能力强者优先。
  • 14k-20k 经验在校/应届 / 硕士
    智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 工作内容: 1、负责语音合成、情感语音识别、音乐生成、语音增强等相关算法的研究和开发工作; 2、探索语音领域前沿技术,跟进国际前沿研究成果; 岗位要求: 1、硕士以上学历,信号处理、计算机、电气工程或相关专业背景,掌握语音相关算法基础理论知识; 2、一年以上深度学习音频方向相关工作经验; 3、熟悉一种以上深度学习框架(如Tensorflow、PyTorch),至少熟练掌握Python、C/C++、Jave等一门编程语言; 4、在至少一个音频领域有深入研究,例如语音合成、音乐合成、声纹识别、语音增强等; 5、具有团队协作能力,有责任心、沟通能力强者优先。
  • 4k-5k 经验在校/应届 / 本科
    移动互联网,硬件 / 天使轮 / 15-50人
    1、与深度学习算法工程师一起工作,对唤醒词、声纹识别等进行模型训练,处理相关数据; 2、协助参与音频处理算法等前沿技术的研发及相关产品实现。 任职要求: 1、本科及以上学历,计算机、电子、通信等相关专业; 2、熟悉Linux、python; 3、熟悉tensorflow或pytorch框架; 4、具有扎实的数学和算法基础; 5、实习时间5-6个月。 拓灵为您提供: 1、与名校海归博士及世界500强高管共事的机会; 2、有竞争力的薪酬待遇 3、各种假期,除国定假日外,还有公司额外假期、员工年假等 4、丰富的员工培训,更多学习机会 5、各类员工团建活动
  • 25k-50k·13薪 经验不限 / 硕士
    企业服务 / 未融资 / 15-50人
    岗位职责: 1)负责语音/声纹识别、语音处理等技术的研发; 2)负责研发和身份认证技术的产品化落地。 岗位要求: 1)研究生以上学历。 2)熟悉语音或声纹识别算法。 3)熟悉Linux下C/C++开发,掌握深度学习算法和工具使用,有一定的软件开发项目经验。 4)有责任心,有团队合作意识。