• 25k-45k·16薪 经验3-5年 / 本科
    居住服务 / 上市公司 / 2000人以上
    工作职责: 1.参与房产交易相关数仓建设,构建层次清晰、数据准确、运行稳定的数仓,包括离线和实时数仓; 2.以业务需求承接为导向,对业务过程、数据使用场景等进行抽象,完成模型的设计、开发工作,沉淀高复用、易使用的数据模 翅. 3.与数据产品、业务方密切配合,梳理需求要点,一起充分发挥数据价值; 4.参与数仓相关治理工作,包括但不限于表存储的治理、et任务的优化等; 5.结合大数据行业发展情况,探索新技术或者新的方法在公司内的落地,推动公司数仓开发技术进行升级。 任职要求: 1.计算机相关专业,本科及以上学历; 2.3年以上数据仓库开发经验,具有扎实的数仓建模理论基础,熟练掌握数仓建设方法论,有实际的项目经验; 3.精通hive/spark sql,具备优秀的调优以及问题解决能力,熟悉Hadoop/Flink/Spark等主流大数据技术栈; 4.熟悉至少-个presto、clickhouse、doris等主流olap引擎的使用,了解其适合的使用场景并能进行查询优化等; 5.具有Python/Java/Scala其中之一的开发经验者优先考虑; 6.具有良好的沟通能力和协作能力,能够与业务方、数据产品高效沟通,同时与其他数仓研发协作共建数仓。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责统筹和推进字节跳动财务系统的构建 (建模),搭建财务域的数据分析体系,包括KPI指标、报表、专题分析体系等; 2、推进数据可视化工作,提升财务域数据分析效率和数据价值转化等; 3、负责财务领域相关基础数据建设,包括数据采集、清洗、加工、汇总等,确保数据准确、及时、安全、可信; 4、负责数仓规范、数据治理、数据血缘、数据地图、数据应用等数仓建设工作; 5、负责开发实时数据和离线数据,推动全链路数据线上化和数字化建设; 6、深入理解业务细节,快速响应需求,对数据进行抽象建模,沉淀财务行业数据模型。 职位要求: 1、本科以上学历,数学、统计学、运筹学、计算机科学与技术等专业,具备扎实的计算机科学功底、编程基础和数据结构算法基础,良好的工程素养,高效的问题解决能力; 2、熟练掌握主流的数据分析方法(回归分析、关联分析、聚类分析、时间序列分析等)及数据建模能力,了解常用机器学习方法; 3、掌握主流大数据和流式数据处理技术,如Flink、Storm、ES、HBase等; 4、理解数据仓库模型及思想、维度建模思想; 5、精通SQL语言,具备存储过程与ETL的开发能力,能熟练进行SQL查询优化; 6、有财务领域相关经验积累优先。
  • 12k-20k 经验3-5年 / 本科
    数据服务 / 上市公司 / 500-2000人
    【岗位职责】 1、负责基于hive、spark、flink技术的大数据平台需求分析、设计及开发工作; 2、负责基于datax、HQL、传统ETL 或基于spark、flink的大数据平台数据抽取、清洗、转换、加工等入仓的开发,优化大数据平台跑批作业; 3、负责使用Dolphinscheduler(海豚调度)批量配置跑批调度任务及调度优化工作; 4、负责使用flink采集并加工kafka、binlog等数据源。 【岗位要求】 1、能熟练使用大数据基础组件,不限于hdfs/kudu、hive、impala、yarn、Tez/spark、flink、hbase、sqoop、flume、datax、elasticsearch、kafka等,熟悉相关架构和原理,有一定的组件性能调优能力; 2、有CDH/CDP平台使用经验,熟悉基于Cloudera Manager的平台使用管理; 3、具有airflow/azkaban/xxl-job/Dolphinscheduler等一种基几种调度工具的开发使用经验,有Dolphinscheduler使用经验优先; 4、具备海量数据采集、加工、分析处理、高并发查询等数据平台的开发设计能力,并有具体的构建海量数据存储、离线/实时数仓等项目实施经验; 5、具有金融行业大数据平台实施项目经验; 6、了解常见的大数据产品和技术路线,如:ClickHouse、Doris、GBase、Kylin、Linkis、Flink CDC、Hudi/Iceberg等更优; 7、学习能力强,适应能力好,有强烈的责任心,主动关注数据发现问题并提出解决方案,具备良好的沟通能力及团队合作精神。
  • 25k-40k·13薪 经验5-10年 / 本科
    旅游|出行 / D轮及以上 / 500-2000人
    我们正在寻找一位经验丰富的数据仓库数据分析师,加入我们充满活力的团队,主要负责支持不同业务团队的数仓工作。理想的候选人需具备扎实的数据分析能力、熟悉数据仓库建模方法、掌握数据埋点和上报技术,能够处理 A/B 测试数据,并独立建立和优化基础事实表及维度表,为业务提供稳定的数据支持。 主要职责 1、支持酒店等垂直业务线及客服等功能团队的数据分析需求。 2、构建并维护基础事实表和维度表,为上游数据分析提供稳定的模型基础。 3、与研发和产品团队保持密切沟通,确保数据需求的准确性和实时性。 4、熟练运用 SQL 和 Python 进行数据分析和模型开发。 5、使用 ETL 工具优化数据处理流程并提高数据质量。 6、具备数据产品或运营经验者优先。 7、有 DBT 使用经验者优先。 任职资格 1、熟悉数据仓库建模方法,能独立完成数据建模任务。 2、优秀的沟通技巧与团队协作能力,能够与技术团队和业务团队高效合作。 3、具备独立推动项目和任务的能力,工作积极主动。 4、具备强大的数据分析能力,能从数据中挖掘出有价值的业务洞察。 5、理解数据埋点、上报流程,并熟悉 A/B 测试数据的处理方法。 6、能够独立设计、建立并优化基础事实表和维度表。 7、精通 SQL 和 Python,具有 ETL 工具使用经验。
  • 16k-28k 经验3-5年 / 本科
    人工智能服务,科技金融 / 不需要融资 / 500-2000人
    岗位职责: (1)参与兴业银行大数据平台湖仓一体、存算分离、流批一体等前沿技术的基础架构体系规划与研究,并推动落地实施; (2)负责兴业银行大数据平台运维保障,存储、计算等各类组件性能调优,以提升平台稳定性; (3)协助兴业银行大数据平台信创迁移与相关系统改造、适配等工作; (4)联系上下游业务需求方与应用开发团队,对接协调大数据平台使用、建设、推广相关工作。 岗位要求: (1)熟悉大数据生态体系中分布式存储、缓存、高并发等底层技术协议与原理; (2)具有海量数据计算组件(Hive、Spark),OLAP查询引擎(Clickhouse、Presto、Doris等)故障排查与优化经验,有源码阅读与调试经验优先; (3)熟练掌握Flink等主流大数据组件原理及应用,具有Hudi或Iceberg等流批一体相关组件应用经验; (4)熟悉Docker、K8s等容器化、大数据组件云原生相关技术。 工作地点:上海
  • 19k-28k·15薪 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    岗位职责: 1. 大数据平台组件运维及优化,进行必要的二次开发; 2. 数据湖、数据仓库技术研究及落地; 3. 实时、离线数据产品设计及开发。 任职要求: 1. 本科及以上学历,计算机及相关专业; 2. 3-5年Java/Scala开发经验,熟悉多线程编程; 3. 熟悉大数据生态相关技术,有二次开发经验者优先; 4. 熟悉实时及离线数仓架构及开发流程,有Phoenix/StarRocks使用经验优先; 5. 熟悉常见设计模式,熟悉如Spring/SpringMVC/Mybatis等主流框架; 6. 有较强的学习能力与逻辑思维能力,良好的团队合作精神。
  • 电商平台 / C轮 / 2000人以上
    岗位职责: 1.负责电商流量域数据仓库及模型建设和设计,并根据需求变化和业务发展,持续优化模型; 2.负责电商流量域数据仓库模型代码开发、部署,并对数据质量进行管理和优化; 3.提升电商流量域数据质量和运营效率,参与相关事件应急响应; 4.参与大数据体系的建立以及配套系统平台的建设与运营。 岗位要求: 1.计算机或信息技术相关专业,大学本科及以上学历; 2.4年以上大数据数仓开发相关工作经验; 3.有扎实的数据仓库理论功底和丰富的数据治理实战经验,能够围绕业务和产品特性建模并解决实际问题; 4.熟悉大数据系统组件(如Hive、MapReduce、Spark、HBase等),具备编写、优化复杂SQL的能力; 5.了解实时处理技术相关组件(如Kafka、Flink等); 6.负责过大型数据平台或数据仓库设计优先; 7.熟悉Python/Java/Shell其中一种语言; 8.具备用增、ABT相关经验的加分;
  • 25k-40k·13薪 经验5-10年 / 本科
    旅游|出行 / D轮及以上 / 500-2000人
    岗位职责: 1、负责设计和维护数据仓库架构,支持业务线包括但不限于Things to do、Mobility和酒店业务。 2、深入了解各业务线,通过数据分析支持业务决策和策略制定。构建和优化数据模型,确保数据准确性和可靠性。 3、独立处理和优化复杂的数据集,改进数据质量和处理流程。 4、与业务团队和技术团队紧密合作,确保数据解决方案满足业务需求。编写技术文档和维护数据仓库的数据字典。 职位要求: 1、拥有5年以上数据仓库领域的工作经验。精通SQL和数据库技术,有实际操作大型数据库的经验。 2、具备扎实的数据模型构建经验,能够独立设计和优化复杂的数据模型。 3、对数据质量和底层数据处理具有丰富的经验,能够有效解决数据问题。 4、熟悉dbt的应用,有实际使用经验者优先。具备良好的分析思维和问题解决能力,能够独立完成项目。 5、良好的沟通和团队合作能力,能够与不同背景的团队成员有效沟通。
  • 30k-45k·14薪 经验5-10年 / 本科
    电商平台 / C轮 / 2000人以上
    岗位职责: 1.负责电商流量域数据仓库及模型建设和设计,并根据需求变化和业务发展,持续优化模型; 2.负责电商流量域数据仓库模型代码开发、部署,并对数据质量进行管理和优化; 3.提升电商流量域数据质量和运营效率,参与相关事件应急响应; 4.参与大数据体系的建立以及配套系统平台的建设与运营。 岗位要求: 1.计算机或信息技术相关专业,大学本科及以上学历; 2.4年以上大数据数仓开发相关工作经验; 3.有扎实的数据仓库理论功底和丰富的数据治理实战经验,能够围绕业务和产品特性建模并解决实际问题; 4.熟悉大数据系统组件(如Hive、MapReduce、Spark、HBase等),具备编写、优化复杂SQL的能力; 5.了解实时处理技术相关组件(如Kafka、Flink等); 6.负责过大型数据平台或数据仓库设计优先; 7.熟悉Python/Java/Shell其中一种语言; 8.具备用增、ABT相关经验的加分;
  • 10k-18k 经验3-5年 / 本科
    金融 / 不需要融资 / 2000人以上
    【岗位要求】 1、参与或者负责大数据的采集、存储、处理,通过分布式大数据平台加工数据,数据驱动运营 2、参与或者负责大数据仓库离线和实时设计、开发、维护工作 3、参与或者负责大数据平台的开发、维护工作 4、参与或者负责数据服务和大数据产品的研发 5、对数据有敏感度,发现数据、挖掘数据价值 6、具有良好的沟通表达能力和团队合作精神,具有较强的工作责任心、主动性及抗压能力 【任职要求】 1、有3年及以上研发经验,参与过大型数仓建设、数据分析、数据挖掘、数据平台研发等相关项目,有一定的数据建模,流批处理基础 2、熟悉大数据相关组件,包含但不限于Hive、Flink、Spark 3、熟悉主流数据库技术,包含但不限于Oracle、MySQL、PostreSql 3、熟悉数据研发相关算法,熟练构建和优化数据模型
  • 20k-35k·14薪 经验3-5年 / 本科
    软件服务|咨询 / B轮 / 150-500人
    if (your_passions.includes('BigData')) { switch(your_stacks) { case 'Java': case 'Scala': case 'Python': console.log('Join AfterShip'); break; } } 岗位职责 1、负责 OLAP 引擎(如 ClickHouse、Doris 等)的调研、性能优化、Bug 修复及稳定性保障,推动相关配套工具和系统的建设; 2、深入理解 CDP 和指标平台的数据应用场景,推动客户数据整合、用户画像构建、实时指标计算等核心功能在 OLAP 引擎中的高效落地,确保数据 SLA; 3、负责数据服务应用技术架构的演进,构建统一的查询引擎层和数据服务平台,支持多业务场景的高效数据查询与分析; 4、与数据产品经理、分析师、业务团队紧密合作,理解业务需求并提供技术解决方案,推动数据驱动的业务决策。 岗位要求 1、本科及以上学历,计算机相关专业毕业,三年以上数据开发和数据应用工程架构建设经验,英语读写熟练,有 CDP 或指标平台领域有实际项目经验者优先; 2、深入了解 ClickHouse、Doris、StarRocks 等 OLAP 引擎中的至少一种,具备查询 SQL 调优和源码分析能力,能够解决性能瓶颈和复杂技术问题; 3、具备数据应用工程架构设计与实施经验,能够设计高可用、高性能的数据服务平台,支持客户数据整合、用户画像构建、实时指标计算等核心场景; 4、具备大规模数据应用架构设计经验(如分布式计算、实时数据处理、数据湖仓一体)者优先; 5、熟悉 Apache Calcite、Antlr4 等 SQL 解析与优化框架,有相关实践经验者优先。 加分项 1、对 Headlesss BI / CDP 有一定的了解且有实践应用经验; 2、向社区贡献过 patch 者优先。 为什么加入我们 1、朝阳行业:国际电商 SaaS 服务赛道,国际一线投资机构加持; 2、稳健发展:团队稳健扩张,业务规模及营收每年持续稳健增长; 3、多元文化:团队来自全球 20 多个不同城市,国际化视角、扁平化管理; 4、极客氛围:拥抱开源技术,实践敏捷开发,崇尚通过工具和自动化来解决问题; 5、特色福利:学习基金、 一对一帮带、内部商城、提供 MacBook 及可升降办公桌。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:集团信息系统部(Corporate Information System)负责字节跳动信息系统建设。通过构建领先的信息系统,助力公司业务和组织的长期高效经营与发展。与此同时,在安全、隐私、合规层面持续治理,为公司的稳健发展保驾护航。字节跳动的员工分布在全球超过120个城市,业务模式复杂,用户规模大。到现在,集团信息系统部已经覆盖人事、财务、法务、采购、审批、职场等多个领域,隐私安全工作同步开展,AIGC创新孵化也在逐步落地实现。 1、负责公司统一数据引擎大数据方向的架构设计和技术研发工作; 2、负责设计安全高效的大数据架构,推动数仓、BI团队搭建高效的数据流程与服务栈; 3、深入了解字节跳动各业务线的数据业务,发现并总结数据研发、数据质量、数据安全等方面数据问题,合理抽象方案,推动相关业务实施落地。 职位要求: 1、计算机基础知识扎实,具备良好的工程和算法能力; 2、有大数据体系工作经验,对数仓或BI体系的建设流程和分工有清晰的认识; 3、熟悉大数据相关工具/框架经验者优先,如Hadoop、Hive、Spark、Kafka、Flink、Clickhouse等; 4、有分布式、高性能系统研发经验者优先;对系统稳定性建设有实践经验者优先;熟悉多种存储系统者优先; 5、对技术有热情,具备良好的问题分析和解决能力,喜欢思考问题深层次的原因,并善于归纳和总结。
  • 12k-24k·17薪 经验1-3年 / 本科
    科技金融 / 不需要融资 / 2000人以上
    岗位职责 1)负责招行大数据平台基础数据模型和衍生数据模型的设计和开发,包括逻辑模型、物理模型; 2)负责银行零售、批发相关板块数据的基础模型建设工作,保障数据质量和数据时效,建设招商数据中台。 岗位要求 1)本科及以上学历,计算机相关专业,1年以上数据仓库相关工作经验; 2)熟悉DB2、Oracle、MySQL、Teradata、SQL Server、Gauss、Hadoop 至少一种数据库,熟悉SQL等编程语言,熟悉数据仓库开发流程和相关理论知识; 3)熟悉常用操作系统如 Windows、Linux、AIX 等的日常操作,熟悉基本的shell命令; 4)具备数据仓库相关系统分析、设计和开发经验者优先;有银行业务系统或互联网公司开发经验者优先;有数仓ETL开发和模型设计开发经验者优先; 5)有良好的代码和文档编写能力,工作态度积极,责任心强,有良好的合作精神,沟通能力强。
  • 12k-18k 经验5-10年 / 本科
    信息安全,数据服务 / 未融资 / 15-50人
    岗位职责: 1.负责数据中台的平台及中间件搭建,有效支撑数据采集、数据处理、数据模型设计、数据治理、数据运营过程,确保平台的性能、稳定和安全。 2.维护并持续优化数据中台相关系统,为大数据中台的持续不间断运营提供支撑。 任职要求: 1.5年以上大数据架构设计开发维护直接相关经验。 2.具备丰富的数据中台设计和建设经验,熟悉通用中间件(Hadoop、Flink、Spark等)及数据处理流程和技术栈。 3.了解数据建模和数据分析,能够根据业务需求设计高效的数据模型。 4.具备良好的团队协作能力。
  • 15k-28k·15薪 经验1-3年 / 本科
    金融 / 上市公司 / 2000人以上
    工作内容 职位描述: 1.参与大数据平台数据仓库规划、架构及研发,包括离线、实时的数据模型规划,建设PB级的数据集市和数据平台。 2.参与数据仓库模型的ETL实施,ETL性能优化、技术攻关等。 3.参与平台数据治理相关工作,负责数据质量、数据一致性及稳定性保障等建设。 4.参与平台标签体系、数据产品与应用的数据研发,发掘数据价值,以数据驱动业务不断发展。 岗位要求 任职要求: 1. 本科及以上学历,计算机、软件工程、数据分析或相关专业出身,2-3年工作经验,具备极强的问题解决能力。 2. 精通数据仓库理论体系,对分层设计、维度建模等有深刻的认识和实战经验,熟悉不同建模方法的优劣。 3. 积极主动贴近业务,有良好的沟通协调能力,数据敏感度高,能够快速理解业务模型及数据模型;熟练掌握SQL/HQL/Spark SQL开发及优化技能,快速ETL实施能力,对SLA有较深刻的认识及强烈的责任心。 4. 熟悉大数据生态技术栈,具备较丰富的Hadoop,Hive,Spark,Flink,DataWorks等大数据工具应用和开发经验。 5. 掌握Java, Python等至少一门语言,有MapReduce项目开发经验,熟悉Azkaban等任务调度工具。 6. 熟练使用git,有多人项目合作开发经验。 7. 有数据中台建设经验优先。有数据分析能力、指标体系搭建或BI相关经验优先。有互联网工作经验优先。