【Hadoop高级研发工程师招聘】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

Hadoop大数据开发工程师
[北京·石景山区] 1天前发布

13k-16k 经验1-3年 / 本科

易华录集成

其他 / 未融资 / 15-50人

岗位职责： 1.支持Hadoop集群底座的运维故障分析、解决、性能优化；大数据集相关组件主要包括：Yarn、HDFS、ZooKeeper、Storm、Kafka、Hbase、Hive、Spark、Kerberos、Spark、Flink、Flume、MySQL等组件运维； 2.开发数据采集、清洗、分析、挖掘及可视化功能，需熟悉ES、milvus、pgsql等。 3.熟悉国产数据库，包括doris等； 4.配合开展HDFS存储、Hive元数据治理优化，建立并完善存储治理方案； 5.配合开展Hive、Spark作业优化，对业务侧提出优化建议。如：作业小文件问题、数据倾斜治理方案等； 6.提出集群优化建设方案，配合建设和优化大规模分布式集群的自动化运维、监控等工具和管理平台。任职要求： 1.***本科及以上学历，通信/计算机等相关专业，具有良好的学习能力、沟通能力、团队合作能力及一定的抗压能力； 2.熟悉Hadoop、Hive、Hbase、Spark等开源项目，理解组件架构及原理； 3.对大数据运维开发有浓厚兴趣，熟悉Apache Hadoop部署、性能调优； 4.能阅读/理解Hadoop等相关开源组件源码； 5.对HQL、SparkSQL等有较深入的研究，能解决实际业务性能问题； 6.熟练掌握LDAP、Kerberos等安全认证体系； 7.熟练掌握Linux命令与工具进行问题定位，熟悉常规的互联网技术架构； 8.具备一定的Java开发能力； 9.有信控平台开发经验者优先录取。
大数据开发工程师-hadoop
[北京·石景山区] 2025-03-22

13k-16k 经验3-5年 / 本科

易华录集成

其他 / 未融资 / 15-50人

岗位职责： 1.支持Hadoop集群底座的运维故障分析、解决、性能优化；大数据集相关组件主要包括：Yarn、HDFS、ZooKeeper、Storm、Kafka、Hbase、Hive、Spark、Kerberos、Spark、Flink、Flume、MySQL等组件运维； 2.开发数据采集、清洗、分析、挖掘及可视化功能，需熟悉ES、milvus、pgsql等。 3.熟悉国产数据库，包括doris等； 4.配合开展HDFS存储、Hive元数据治理优化，建立并完善存储治理方案； 5.配合开展Hive、Spark作业优化，对业务侧提出优化建议。如：作业小文件问题、数据倾斜治理方案等； 6.提出集群优化建设方案，配合建设和优化大规模分布式集群的自动化运维、监控等工具和管理平台。任职要求： 1.本科及以上学历，通信/计算机等相关专业，具有良好的学习能力、沟通能力、团队合作能力及一定的抗压能力； 2.熟悉Hadoop、Hive、Hbase、Spark等开源项目，理解组件架构及原理； 3.对大数据运维开发有浓厚兴趣，熟悉Apache Hadoop部署、性能调优； 4.能阅读/理解Hadoop等相关开源组件源码； 5.对HQL、SparkSQL等有较深入的研究，能解决实际业务性能问题； 6.熟练掌握LDAP、Kerberos等安全认证体系； 7.熟练掌握Linux命令与工具进行问题定位，熟悉常规的互联网技术架构； 8.具备一定的Java开发能力； 9.有信控平台开发经验者优先录取。
Hadoop平台开发工程师
[南京·雨花台区] 2024-02-20

15k-30k 经验3-5年 / 本科

数据观

企业服务,数据服务 / 上市公司 / 500-2000人

职位描述： 1、基础组件、基础设施的二次开发、L2支撑、交付； 2、围绕大数据组件服务平台开发，围绕组件进行串联部署、功能组合/抽象，给上层数据开发人员提供组件级平台服务 3、对Hadoop、Hbase、Hive、Flink等组件/系统进行持续研究、开发和交付，满足部署、集成、扩展、监控、高可用等生产需求； 4、根据理论与技术研究、产品对标和相关需求，持续产品规划与迭代； 5、根据现场信息搜集，分析、定位和解决现场问题，承担L3支撑职位要求： 1、计算机相关专业，本科及以上学历； 2、3年及以上hadoop生态的基础设施开发经验，熟悉国内主流大数据平台； 3、熟练掌握Java，熟悉Linux开发环境及常用工具； 4、以下优先： (1)985/211（必备条件，不符合请勿投递，谢谢） (2)深入阅读过相关组件内核源代码 (3)深入理解分布式资源调度系统技术及原理 (4)深入理解linux系统能够独立排查及解决操作系统层问题 (5)有数据仓库经验者 (6)有运维经历者 (7)有C/C++开发经验 (8)有论文阅读、理论研究爱好与能力
Hadoop开发工程师（合肥邮储）
[合肥·包河区] 2023-10-25

13k-16k 经验3-5年 / 本科

京北方

IT技术服务｜咨询 / 上市公司 / 2000人以上

1.熟悉Hadoop，有过大数据开发经验 2.熟悉大数据开源技术，对Spark,flink,Hive, Hdfs等分布式计算存储引擎有实战经验 3.**本科，双证齐全
运维研发工程师(K8S&Hadoop方向)
[北京·望京] 2023-04-24

10k-20k·14薪经验1-3年 / 本科

区块节点

移动互联网 / 不需要融资 / 50-150人

岗位职责： 1、负责公司各产品线服务可靠、稳定、高效运行，提供K8S，Hadoop技术支持。 2、负责运维平台建设通过技术手段提升工作效率； 3、负责公司各类基础设施监控、自动化、监控体系的持续建设与完善； 4、参与公司各类产品自动化实现，满足严格的质量与效率要求；岗位要求： 1、***大学本科（计算机专业，获得***书、***书） 2、能熟练编写 Shell或Python脚本，有go/python/shell编程能力者优先熟悉devops理念 3、熟悉自动化运维工具（saltstack/ansible/Jenkins）的原理及使用，有二次开发经验优先 4、具备kubernetes、docker、HDFS、spark、Hive运维经验者优先。 5、具备一定JAVA/GO开发经验优先。 6、具备良好的学习能力，能够快速掌握一门新的技术。
Hadoop（初级）
[合肥·包河区] 2023-02-27

8k-10k 经验1-3年 / 本科

易联达

移动互联网,金融 / 不需要融资 / 150-500人

工作内容： 1.负责hadoop基础技术规划，编制相关规范文档； 2.负责Hadoop数据应用相关的数据存储、查询、计算、元数据管理的架构设计与实现； 3.负责hadoop的实际规划建设，包括环境与框架的规划搭建及部分核心编码工作； 4.负责hadoop相关技术发展方向的预研； 5.独立负责具体功能开发与实现、性能优化，保证系统健壮稳定及临时性数据处理工作的支持； 6.负责数据应用相关的数据存储、查询、计算、元数据管理等方面的架构设计。岗位要求： 1.1年以上大数据开发经验，熟悉分布式的设计与应用。 2.熟悉hadoop大数据平台框架，包括不限于hadoop、hive、hbase等大数据生态平台组件的部署升级与调优。 3.熟悉hadoop、spark、flink、hbease、es等相关计算机存储框架的底层理论，并能应用至实际开发当中。 4.熟悉至少一款ETL工具，例如kettle、logstash等。 5.熟悉关系型及非关系型数据库的使用及优化，包括但不限于Oracle、PG、hive、clickhouse等。 6.熟悉各类大数据处理组件，sqoop、flume、kafka、azkaban等。 7.根据计划完成模块的编码开发工作，保证开发质量。 8.有良好的沟通能力，积极为项目建设提供建设性意见。 9.本科及以上学历，计算机相关专业，有银行工作、财务会计、管理会计业务经验优先。
JAVA（JAVA+hadoop）
[广州·珠江新城] 2023-03-02

11k-15k 经验3-5年 / 大专

法本信息

企业服务,软件开发 / 上市公司 / 2000人以上

1. 熟悉大数据云平台经验，再加Java开发 Java基础扎实，熟练掌握多线程编程，熟悉JVM，以及常规性能优化。 2. 熟悉spring，springboot，springcloud，nacos，mybatis，mybatis-plus等常⻅开源框架。 3. 熟悉redis，RocketMQ等常见中间件。 4. 熟练使用MySQL数据库，良好的数据库设计，SQL编写，索引性能分析能力。 5. 熟练掌握linux系统的使用。 6. 熟练掌握EKL系统的使用。 7. 有良好的逻辑思维能力，沟通能力，有责任心能独立完成需求。 1、本3专4，计算机/互联网/通信相关专业 2.熟悉java开发常用框架组件，能熟练运用到具体项目中 3.配合项目完成研发计划，有独立完成需求的能力
大数据研发工程师-特征工程
[北京·海淀区] 17:22发布

40k-80k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责风控数据链路开发工作，基于公司基础组件搭建风控数据计算平台，参与在线/近线/离线计算能力建设； 2、参与数据治理工作，提升数据易用性及数据质量； 3、理解并合理抽象业务需求，发挥数据价值，与业务团队紧密合作。职位要求： 1、丰富的大数据生态系统开发经验，熟悉Spark、Flink、Clickhouse、Hadoop等技术； 2、4年以上大数据研发经历，计算机相关专业本科及以上学历； 3、精通Go/C++/Java等至少一门编程语言，熟练运用各种常用算法和数据结构，有独立实现能力； 4、具备优秀的逻辑思维能力，对解决挑战性问题充满热情，善于解决问题和分析问题； 5、熟悉流式计算，有大流量系统开发经验者优先。
白盒测试资深工程师(大数据)
[上海·张江] 17:22发布

20k-35k·15薪经验3-5年 / 本科

信也科技

金融 / 上市公司 / 2000人以上

岗位职责 1.数据质量监控:负责监控金融信贷相关业务域数仓数据的准确性、一致性和完整性，确保数据质量符合业务需求。 2.数据质量测试:设计并执行数据质量测试用例，验证数据计算逻辑、数据转换规则和数据存储的正确性 3.数据质量问题跟踪:跟踪测试中发现的数据质量问题，协调研发团队进行问题修复，并验证修复效果. 4.数据质量工具开发:参与数据质量管理平台的功能设计与开发，提升数据质量测试的自动化水平。岗位任职要求 1.学历要求:本科及以上学历，计算机科学、软件工程、数据科学或相关专业。 2.工作经验:3年以上数据测试或数据质量测试经验，有金融信贷行业经验者优先。 3.大厂背景:具有阿里、腾讯、字节跳动、百度等大厂数据测试或数据质量测试经验者优先,。 4.技术能力: a).熟悉大数据技术栈(如Hadoop、Spark、Hive、Flink等)。 b).熟悉数据质量监控工具(如Apache Griffin、Great Expectations等)。 c).具备一定的编程能力(如Python、Java、SaL等),能够编写自动化测试脚本。 d).熟悉数据治理相关工具(如数据血缘、元数据管理等)者优先。 5.业务理解:对金融信贷业务有深入理解，能够根据业务需求设计数据质量测试方案 6.问题解决能力:具备较强的逻辑思维和问题解决能力，能够快速定位数据质量问题的根本原因。 7.沟通协作:具备良好的沟通能力和团队协作精神，能够与研发、业务团队高效协作。加分项 1.有金融信贷行业数据质量测试经验者优先。 2.熟悉金融行业数据标准和监管要求者优先。 3.具备数据治理或数据资产管理经验者优先。
广告算法高级工程师
[北京·海淀区] 17:22发布

30k-45k·14薪经验3-5年 / 硕士

搜狐集团

移动互联网,广告营销 / 上市公司 / 2000人以上

工作职责： 1.负责视频广告系统的算法设计和优化，包括但不限于实时竞价/点击率预估/分配优化等核心算法； 2.以平台收益为目标，优化广告投放策略，提升广告主的 ROI 和用户体验； 3.基于广告领域需求，对预训练大模型进行微调/对齐等优化，持续提升算法效果和平台收益。任职要求： 1.希望3年及以上广告算法/推荐系统/搜索引擎或计算广告相关领域经验； 2.熟悉大规模数据挖掘，机器学习，深度学习等相关技术，熟悉 Hadoop/Spark 等工具； 3.良好的逻辑思维能力和数据敏感度，优秀的分析和解决问题的能力，对挑战性问题充满激情； 4.熟悉大模型微调技术（如SFT、LoRA、DPO等）优先； 5.硕士及以上学历，对计算广告行业有兴趣。
统一存储研发架构师-大数据方向
[杭州·西湖区] 17:22发布

50k-80k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责：团队介绍：集团信息系统部（Corporate Information System）负责字节跳动信息系统建设。通过构建领先的信息系统，助力公司业务和组织的长期高效经营与发展。与此同时，在安全、隐私、合规层面持续治理，为公司的稳健发展保驾护航。字节跳动的员工分布在全球超过120个城市，业务模式复杂，用户规模大。到现在，集团信息系统部已经覆盖人事、财务、法务、采购、审批、职场等多个领域，隐私安全工作同步开展，AIGC创新孵化也在逐步落地实现。 1、负责公司统一数据引擎大数据方向的架构设计和技术研发工作； 2、负责设计安全高效的大数据架构，推动数仓、BI团队搭建高效的数据流程与服务栈； 3、深入了解字节跳动各业务线的数据业务，发现并总结数据研发、数据质量、数据安全等方面数据问题，合理抽象方案，推动相关业务实施落地。职位要求： 1、计算机基础知识扎实，具备良好的工程和算法能力； 2、有大数据体系工作经验，对数仓或BI体系的建设流程和分工有清晰的认识； 3、熟悉大数据相关工具/框架经验者优先，如Hadoop、Hive、Spark、Kafka、Flink、Clickhouse等； 4、有分布式、高性能系统研发经验者优先；对系统稳定性建设有实践经验者优先；熟悉多种存储系统者优先； 5、对技术有热情，具备良好的问题分析和解决能力，喜欢思考问题深层次的原因，并善于归纳和总结。
资深后台开发工程师（营销工程）-JAVA大数据应用-深圳
[深圳·西丽] 17:22发布

30k-50k·15薪经验3-5年 / 本科

SHEIN

电商平台 / C轮 / 2000人以上

岗位职责： 1、建设机器学习/深度学习平台，根据实际业务场景和需求，优化平台能力； 2、建设灵活的AI开发组件，支持业务打造定制化AI平台及业务。岗位要求： 1、计算机及相关专业本科及以上学历，具有扎实的代码功底，熟悉常用的算法和数据结构； 2、精通Java语言，熟悉了解Python语言，具有良好的编程习惯，熟悉多线程编程，内存管理，设计模式和Linux开发环境； 3、熟悉Hadoop/Hive/Spark/Flink等计算框架，熟悉Docker技术及Kubernetes容器调度系统； 4、熟悉业界主流的机器学习平台，有机器学习平台研发经验者优先； 5、有Tensorflow/PyTorch等机器学习框架使用经验者优先； 6、有AutoML、自动特征工程系统设计经验者优先； 7、良好的团队合作和协调沟通能力，学习能力强，自我驱动力强，紧跟机器学习的发展动态。
大数据架构师
[北京·望京] 17:22发布

25k-35k·14薪经验5-10年 / 本科

施耐德电气

IT技术服务｜咨询 / 上市公司 / 2000人以上

职位描述： 1. 从事工业数据的采集、传输、分析、集成等技术研究及开发应用； 2. 负责但不限于生产制造管理主题领域的指标体系、数据模型和治理逻辑设计，从业务应用的视角，构建数据驱动的运营管理平台方案； 3. 作为大数据专家角色，充分与内外部合作，负责项目数据类的方案架构设计和技术规划并确保最终落地， 4. 牵头项目关键架构设计和组织技术难点攻关； 5. 参与工业数据标准制订，并且推动团队应用标准；任职要求 1. 计算机、软件工程及相关专业，本科及以上学历，至少3年以上大数据项目相关工作经验； 2. 掌握Hadoop、HBase、Kafka、Hive、Flink、Spark、datav等组件中至少2项的工作原理，熟悉Hadoop生态系统； 3. 精通Java，Python中的一种或多种语言，熟练掌握海量数据分析的相关模型、算法，有制造行业大数据分析模型经验者优先； 4. 熟悉数据库开发，精通面向对象设计、设计模式，熟练MySQL、Redis等数据库； 5. 有指标系统和数据可视化系统开发经验优先； 7. 具备开发项目管理经验。
高级/资深JAVA开发工程师（推荐应用方向) (MJ008619)
[深圳·西丽] 17:22发布

25k-45k·14薪经验3-5年 / 本科

SHEIN

电商平台 / C轮 / 2000人以上

岗位职责: -电商场景下的策略平台建设 -电商场景下的流量分发体系建设岗位要求： -计算机及相关专业本科及以上学历，具有扎实的代码功底，熟悉常用的算法和数据结构 -精通Java语言和框架，熟悉了解Python语言，具有良好的编程习惯，熟悉Linux开发环境，掌握设计模式 -掌握多线程及高性能的设计编码及性能调优，有高并发应用开发经验，对服务治理体系有充分的理解和应用 -熟悉Hadoop/Hive/HBase/Spark/Flink/ES等计算框架，熟悉Docker技术及Kubernetes容器调度系统 -具备推荐系统、广告系统、搜索系统后台开发经验者优先； -具备一定的架构能力，有大容量、高性能、分布式系统的设计开发经验优先； -有广告或者电商场景下的流量分发策略开发经验优先
广告算法工程师
[北京·海淀区] 17:13发布

20k-40k·14薪经验3-5年 / 本科

搜狐集团

移动互联网,广告营销 / 上市公司 / 2000人以上

工作职责： 1.负责大规模在线广告的精排和粗排模型优化，提升广告CTR/CVR模型的预估精度； 2.参与搜狐广告业务由传统模型向深度学习模型迭代进程； 3.深入进行数据挖掘分析建模，构筑用户画像和行业广告特征体系，落地拿到业务结果； 4.从广告主反馈或者效果评测，发现定位系统和算法不足，和产品运营同学一起落地解决方案，改进相关算法并推动实现； 5.追踪业界前沿技术，结合业务需求特点，探索创新前沿算法并应用于实际业务。任职资格： 1.*****本科及以上学历，计算机或软件工程相关专业，3年及以上算法经验； 2.具备扎实的编程能力，熟悉Linux开发环境，熟练掌握Java/Scala/Python中的一种语言，熟悉Spark/SQL/Hadoop、Redis等常用语言和工具，Java代码能力优秀者优先； 3.具备机器学习和深度学习理论基础和实践经验，熟悉协同过滤/LR/FM等传统广告模型，熟悉Wide&Deep/DSSM/DIN等深度学习模型理论，有将算法应用于实际线上系统和业务的成功经验更佳； 4.具备良好的沟通表达能力和工作主动性，善于发现和解决问题，持续系统的优化能力； 5.有过广告/推荐/搜索相关优化算法工作经验、机器学习/数据挖掘/NLP论文发表或竞赛者优先。