1、Hadoop 技术栈的开发和管理,解决实际业务挑战,e.g. YARN, HDFS, MapReduce, Spark, etc; 2、与开源社区保持交流,发现对业务场景有帮助的特性并引入生产环境,或将经内部验证的特性贡献到社区; 3、承担千台-万台规模 Hadoop YARN 集群的管理工作,与业务一起解决性能优化、容量规划、预算审计等问题,保障集群高效稳定经济运行。
1. 构建分布式大数据服务平台,参与构建公司海量数据存储、实时查询系统; 2. 负责Hadoop集群稳定和推广,为业务应用提供平台级支持和服务; 3. 深入Hadoop源码内核改进优化开源项目,解决各种Hadoop线上问题,参与到开源社区建设和代码贡献
1、研发基础架构服务组件,包括Hadoop、Hive等定制研发;及时跟进社区特性进行集群中间件升级。 2、基于CDH开发满足存储计算集群需求的Hadoop部署和管控治理系统。
1、Hadoop生态子系统的研发、测试与优化工作,解决实际业务需求与性能问题。子系统包括但不限于HDFS,HBASE,YARN,SPARK,KAFKA、FLink、Clickhouse、Druid等。 2、承担数万台规模Hadoop集群的管理工作,解决超大规模Hadoop集群在应用与运行过程中的出现各种问题,保证集群的高效稳定运行。 3、和开源社区保持交流,从社区引入对公司业务场景有帮助的特性与系统,或将内部研发的功能贡献到社区。
1、负责Hadoop生态组件优化管理及二次开发工作,Hadoop生态 组件常见问题能迅速定位,并不断优化,提升性能。 2、负责Hadoop生态组件与东方国信分布式数据库CirroData对接开发工作。 3、负责Hadoop领域相关前沿技术跟踪与研究。
推荐百科
推荐职位