• 10k-18k 经验3-5年 / 本科
    金融 / 不需要融资 / 2000人以上
    【岗位要求】 1、参与或者负责大数据的采集、存储、处理,通过分布式大数据平台加工数据,数据驱动运营 2、参与或者负责大数据仓库离线和实时设计、开发、维护工作 3、参与或者负责大数据平台的开发、维护工作 4、参与或者负责数据服务和大数据产品的研发 5、对数据有敏感度,发现数据、挖掘数据价值 6、具有良好的沟通表达能力和团队合作精神,具有较强的工作责任心、主动性及抗压能力 【任职要求】 1、有3年及以上研发经验,参与过大型数仓建设、数据分析、数据挖掘、数据平台研发等相关项目,有一定的数据建模,流批处理基础 2、熟悉大数据相关组件,包含但不限于Hive、Flink、Spark 3、熟悉主流数据库技术,包含但不限于Oracle、MySQL、PostreSql 3、熟悉数据研发相关算法,熟练构建和优化数据模型
  • 40k-60k·15薪 经验10年以上 / 本科
    汽车丨出行 / 未融资 / 2000人以上
    工作职责 1.负责自动驾驶数据平台、仿真平台、标注平台、训练平台及相关工具链的架构设计和研发工作,打造符合前瞻、量产智驾技术研发需要的数据闭环 2.负责大规模、可伸缩计算集群系统的解决方案的设计和搭建,以及核心技术的研究、开发和优化,负责平台长期运维支持和架构优化 3.负责自动驾驶软件系统框架架构设计和开发,与硬件、算法和测试团队合作,持续集成并优化自动驾驶系统 4.负责量产车型的数据驱动影子模式、数据记录等车端功能设计、系统架构和开发 工作要求 1.学历要求:**本科及以上学历,英语CET-4及以上, 2.工作经验:具有6年及以上相关工作经验,特别优秀者可适当放宽 3.其他: ① 计算机科学与技术、软件工程专业、自动化控制专业、人工智能等相关专业优先 ② 满足以下条件之一: 1)熟悉软件开发流程、具备扎实的算法和数据结构、算法、操作系统、网络、数据库等知识 2)熟悉几何、计算机图形学、动态系统建模等理论和方法 3)精通C/C++/Go/Python/nodejs一种或多种编程语言,熟悉HTML/CSS/React/REST 4)熟悉Linux/RTOS环境下开发与调试,有嵌入式操作系统和实时操作系统的内核或驱动开发经验,有多进程多线程、中间件、计算机视觉应用(OpenCV)、CUDA、TensorRT等开发经验优先 5)有丰富的Gin/Pylons/Django Web框架开发经验 6)熟悉PyTorch,TensorFlow,TensorRT等深度学习框架,有模型训练、调优相关经验 7)熟悉Spark/K8S相关技术,有相关开发经验,有过海量数据系统开发经验优先,有过集群系统开发、部署和优化经验优先 8)熟悉软件开发流程以及DevOps完整流程,熟悉DevOps相关系统原理,有相关工具和使用经验、如Jenkins,Argo, K8S,Docker,Kubernetes等 ③ 工作认真负责,具有良好的团队合作能力、沟通协调能力和学习能力 ④ 有Tier 1或主机厂相关工作经验优先
  • 25k-45k·14薪 经验3-5年 / 本科
    电商平台 / C轮 / 2000人以上
    职位描述 1、负责shein的全集团数据服务,为公司运营决策、产品方向、增长策略提供大数据支持; 2、根据业务的需求设计落地新的分析类型数据产品; 3、推动数据化运营,与相关团队协作组织数据技术、产品和数据内容的相关的推广、培训; 职位要求 1、具有深厚的统计学、计算机相关知识,精通SQL等数据查询语言; 2、能够系统思考、自我驱动,对数据可视化、交互设计有深刻的理解; 3、有过完整数据类产品的规划、设计、开发并落地实现成功案例; 4、有数据化运营经验、懂得产品推广、数据驱动用户增长的尤佳。
  • 20k-40k·14薪 经验3-5年 / 本科
    电商平台 / C轮 / 2000人以上
    职位描述 1、负责shein的全集团数据服务,为公司运营决策、产品方向、增长策略提供大数据平台服务的支持; 2、根据业务的需求设计落地新的分析类型数据产品及数据开发类型产品; 3、推动数据化运营,与相关团队协作组织数据技术、产品和数据资产的相关的推广、培训; 职位要求 1、具有深厚的统计学、计算机相关知识,精通SQL等数据查询语言,或者对数据开发分析有相关背景; 2、能够系统思考、自我驱动,对数据可视化、数据应用或者数据研发、交互设计有深刻的理解; 3、有过完整数据类产品的规划、设计、开发并落地实现成功案例; 4、有数据化运营经验、懂得产品推广、数据驱动用户增长的尤佳。
  • 15k-25k 经验5-10年 / 本科
    金融 / 不需要融资 / 2000人以上
    职位描述工作内容:1、负责公司级的通用数据平台,服务全公司的产品线2、负责YARN、Hive、Spark、Flink平台维护及二次开发3、负责公司自研调度系统维护以及接口开发4、负责公司大数据集群、执行引擎、平台的优化和运维工作职位要求:1、熟悉一种以上开源大数据工具框架, 包括担不限于YARN、Mapreduce、Hive、Spark、Flink、Presto等;2、强悍的编码能力,生产环境快速定位问题能力,对新技术有强烈的学习热情;3、三年以上java、大数据维护开发经验,有spark streaming,flink实时任务开发经验者优先考虑。4、做事严谨踏实,责任心强,条理清楚,善于学习总结,有良好的团队合作精神和沟通协调能力。
  • 11k-22k 经验3-5年 / 本科
    企业服务 / 不需要融资 / 2000人以上
    1.两年及以上工作经验 2.熟悉数据仓库各类建模理论、数据仓库分层分域、多维数据模型设计。 3.熟悉数据仓库开发流程,至少熟悉Hive/Hadoop/Spark/Storm/Flink分布式计算框架中的一种。 4.具备大型数据仓库架构设计、数据标准和规范制定、模型设计、数据治理等相关经验优先。 5.对业务有敏锐的洞察能力,可以对复杂业务逻辑快速抽象建模,践行数据驱动。 6.良好的沟通表达和团队协作能力,自我驱动,学习能力强。
  • 14k-28k 经验不限 / 本科
    通讯电子 / 不需要融资 / 2000人以上
    (一)数据采集与整合 1. 设计和开发数据采集系统,从多种数据源(如网页、数据库、文件系统、传感器等)获取数据,确保数据的准确性、完整性和及时性,以满足大模型的训练和优化需求。 2. 针对不同结构(结构化、半结构化和非结构化)的数据制定相应的采集策略,能够处理海量数据的采集任务。 3. 负责将采集到的各类数据进行整合,建立统一的数据存储和管理体系,消除数据孤岛现象,保障数据的一致性。 (二)数据预处理与清洗 1. 对采集到的原始数据进行预处理,包括但不限于数据格式转换、编码处理、数据归一化等操作,以便于后续的数据处理和模型训练。 2. 开发数据清洗程序,识别和处理数据中的噪声、缺失值、异常值等问题,提高数据质量,为大模型提供高质量的输入数据。 3. 建立数据质量监控机制,持续跟踪数据质量指标,及时发现并解决数据质量下降的问题。 (三)数据标注与管理 1. 对于需要人工标注的数据,设计数据标注方案并组织标注工作,确保标注的准确性和一致性。 2. 建立数据标注平台或工具,提高标注效率,同时方便对标注数据进行管理、审核和版本控制。 3. 管理标注数据的存储和分发,与大模型开发团队紧密合作,确保标注数据能够及时、准确地用于模型训练和评估。 (四)数据存储与优化 1. 设计和优化大模型的数据存储架构,根据数据的特点(如数据量、访问频率、数据类型等)选择合适的存储技术(如关系型数据库、非关系型数据库、分布式文件系统等)。 2. 负责数据存储系统的性能优化,包括数据库索引优化、存储容量规划、数据读写性能提升等方面,以满足大模型对数据快速访问的需求。 3. 确保数据存储的安全性和可靠性,制定数据备份、恢复和灾难应对策略,防止数据丢失或损坏。 (五)数据管道构建与维护 1. 构建高效的数据管道(Data Pipeline),实现数据从采集到存储、预处理、标注再到模型训练的自动化流程,提高数据流转效率。 2. 监控数据管道的运行状态,及时处理管道中的故障和堵塞问题,确保数据的稳定流动。 3. 对数据管道进行持续优化,根据业务需求和数据规模的变化,调整管道的架构和参数,提高数据处理的效率和可扩展性。 (六)与团队协作 1. 与大模型算法开发团队、前端开发团队、测试团队等密切合作,理解各方对数据的需求,提供数据支持并协同解决项目中的数据相关问题。 2. 参与数据工程团队内部的技术交流和分享活动,促进团队整体技术水平的提升
  • 15k-23k 经验3-5年 / 大专
    企业服务,工具 / 未融资 / 15-50人
    数据中台开发方向 人员要求: 1. 具备3年及以上相关行业经验,大专及以上学历或具备同等工作能力的优秀人才; 2. 掌握Hadoop、Hive、Spark、Yarn、ElasticSearch等大数据相关技术,具有技术深度和技术激情; 3. 具备丰富的数据模型建设、应用层建设、车载端工程化开发等数据平台开发测试经验; 4. 熟悉MySQL、MongoDB等主流数据库并可熟练运用、优化各类SQL,对Spark、Flink等相关项目有实战经验,精通Scala、Python、Java、Shell、C/C++、Golang等语言中至少一种; 5. 具备汽车领域相关工作经验及较强的逻辑分析和数据处理能力,熟悉数据仓库理论基础。 岗位要求: 1. 负责数据中台数据离线开发、数据实时开发、批量数据开发、数据资产管理、元数据系统设计、ETL服务、算法工程化等模块的开发与迭代升级,并保障系统的稳定性和性能; 2. 参与数据中台关键项目业务需求分析和讨论、系统架构设计、业务功能设计开发、数据模型评审等; 3. 负责数据中台项目系统的测试用例设计、测试计划设计、测试方案设计及测试执行等; 4. 负责大数据平台、数据中台系统运行维护,问题跟踪定位解决;
  • 15k-30k·14薪 经验3-5年 / 本科
    数据服务,人工智能 / 上市公司 / 2000人以上
    1、**本科以上学历,3年以上工作经验; 2、熟悉flink/spark/hadoop/hbase/hive等分布式计算技术,熟悉其运行机制和体系结构; 3、三年以上大型数据仓库架构和建模经验,熟悉大型互联网企业仓库架构解决方案者优先; 4、有一定的数据分析和挖掘能力,能从海量数据提炼核心结果,及时发现和分析其中隐含的变化和问题; 5、能够通过数据化运营发现、分析问题和优化流程,推动数据处理流程自动化,提升团队运转效率; 6、思路清晰,对数据敏感,有良好的沟通表达能力和跨团队协调能力,乐于寻求挑战和突破自我; 工作地址
  • 20k-30k 经验3-5年 / 本科
    IT技术服务|咨询 / 不需要融资 / 15-50人
    岗位职责: 1、参与软件需求相关的评审活动,准确了解业务需求; 2、熟悉业务与技术框架,参与规划数据仓升级、数据建模等工作; 3、负责业务系统中数据清洗、加工、分类相关的开发和交付; 4、负责公司软件产品特定场景的问题,设计和实现具体应用的深度学习模型、策略、算法,改进产品; 4、软件产品算法问题追踪、并跟踪解决问题。 岗位要求: 1、本科及以上学历,计算机、数学等相关专业; 2、3年及以上相关工作经验,使用过Apache SeaTunnel(原名waterdrop)处理工具; 3、有数据建模相关工作经验,掌握主流报表开发工具; 4、具备优秀的逻辑分析、问题定位、数学分析推理能力。
  • 15k-23k 经验3-5年 / 大专
    企业服务,工具 / 未融资 / 15-50人
    大数据可视化开发方向 人员要求: 1. 具备3年及以上相关行业经验,大专及以上学历或具备同等工作能力的优秀人才; 2. 熟悉Hadoop/Hive/Spark等大数据相关技术及Linux等类Unix系统,并具备数据中台、大数据可视化软件相关开发测试经验; 3. 熟悉MySQL、MongoDB等主流数据库及各类SQL,掌握Python、Shell、Java、CSS3、JS、TypeScript等开发语言并可熟练优化项目性能; 4. 熟悉Springboot、SpringMVC、MyBatis、VUE全家桶、HTML5等框架并具备丰富的组件封装经验及底层代码编写能力,至少掌握webpack、rollup、gulp等自动化项目构建工具中的一种; 5. 熟练Git、Jenkins、IDEA、Eclipse、Docker、Photoshop、Postman、Jmeter、Fiddler、LoadRunner、soapUI、禅道等项目开发、代码管理及系统测试工具,具备较强的逻辑分析及问题定位能力; 6. 具备良好面向对象设计能力和优良的编码习惯,重视代码质量等; 岗位要求: 1. 负责大数据可视化平台及其他大数据软件系统的界面设计、前端后端系统功能开发联调、系统测试及维护等; 2. 负责理解和分析产品需求,完成业务逻辑抽象、系统架构设计,可改进优化相关系统技术架构及运行性能; 3. 交付相关开发设计文档、源代码等,交付物需满足委托方相关工作要求,并通过委托方技术评审认可;
  • 15k-23k 经验3-5年 / 大专
    软件服务|咨询,IT技术服务|咨询 / 未融资 / 50-150人
    人员要求: 1. 具备3年及以上相关行业经验,大专及以上学历或具备同等工作能力的优秀人才; 2. 熟悉Hadoop/Hive/Spark等大数据相关技术及Linux等类Unix系统,并具备数据中台、大数据可视化软件相关开发测试经验; 3. 熟悉MySQL、MongoDB等主流数据库及各类SQL,掌握Python、Shell、Java、CSS3、JS、TypeScript等开发语言并可熟练优化项目性能; 4. 熟悉Springboot、SpringMVC、MyBatis、VUE全家桶、HTML5等框架并具备丰富的组件封装经验及底层代码编写能力,至少掌握webpack、rollup、gulp等自动化项目构建工具中的一种; 5. 熟练Git、Jenkins、IDEA、Eclipse、Docker、Photoshop、Postman、Jmeter、Fiddler、LoadRunner、soapUI、禅道等项目开发、代码管理及系统测试工具,具备较强的逻辑分析及问题定位能力; 6. 具备良好面向对象设计能力和优良的编码习惯,重视代码质量等; 岗位要求: 1. 负责大数据可视化平台及其他大数据软件系统的界面设计、前端后端系统功能开发联调、系统测试及维护等; 2. 负责理解和分析产品需求,完成业务逻辑抽象、系统架构设计,可改进优化相关系统技术架构及运行性能; 3. 交付相关开发设计文档、源代码等,交付物需满足委托方相关工作要求,并通过委托方技术评审认可;
  • 专业服务|咨询 / 上市公司 / 2000人以上
    1、负责集团IT新一代企业应用数字模型的交付,建设DevSecOps工具链软件的现有结构化和非结构化数据,探索数据在实际业务中的应用; 2、负责集团IT DevSecOps工具链产品功能设计和开发,负责产品功能的演进和迭代升级; 3、基于公司现有海量数据,建立数据挖掘及数据治理体系; 4、负责数据模型基础平台建设方案的设计和技术选型; 5、基于Hadoop、Spark等平台,实现算法的工程落地及迭代优化; 6、学习能力强,对技术有追求,具备良好的沟通和协作能力; 7、熟悉知识图谱、自然语言处理(NLP)、大数据治理、语义分析、深度学习等知识,有相关领域研发经验者优先;
  • 20k-30k·14薪 经验5-10年 / 本科
    社交平台 / 不需要融资 / 150-500人
    岗位职责: 1. 负责爬虫核心技术的设计和开发; 2. 设计爬取、调度和抽取算法,优化系统; 3. 设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量; 4. 对指定网站、移动端App进行数据抓取工作; 5. 及时解决爬虫抓取过程中出现的问题并不断维护、优化程序。 任职要求: 1. 本科及以上学历,计算机相关专业; 2. 5年以上爬虫开发经验;熟悉MySQL数据库,能协助检查数据入库环节;有多线程开发经验;会处理电商或其他网站反爬问题者优先; 3. 熟悉整个爬虫的设计及实现流程,精通网页抓取原理及技术,精通正则表达式、HTML,JS,AJAX等网页信息抽取技术,从结构化的和非结构化的数据中获取信息; 4. 有海量数据爬取经验者优先,有大数据量、大并发项目经验者优先,有互联网、电商平台、移动端数据爬取技术经验者优先; 5. 有良好的代码编写习惯、沟通、协作能力,有责任心。
  • 10k-18k 经验3-5年 / 本科
    IT技术服务|咨询 / 不需要融资 / 15-50人
    岗位职责】 1、基于对业务的深刻理解,搭建数据分析体系; 2、进行业务调研、快速形成数据业务模型; 3、搭建业务经营监控与异常分析体系,进行日常监控和专项分析,定位问题和原因; 4、根据数据分析结果,与业务沟通确定针对性策略,提供有效的风险评估  3、基于业务的需求掌控,梳理并转化需求,推动底层数据建设  4、对常规分析框架转化需求,不断优化和完善数据体系诊断并不断关键优化建议; 【任职资格】 1、本科及以上学历,数学、统计学、计算机相关专业优先,3年左右相关工作经验; 2、精通SQL、EXCEL,熟练使用1-2种主流BI工具; 3、能够搭建数据模型,具有优秀的数据敏感度,丰富的分析建模和数据建设经验; 4、良好的沟通能力和逻辑思维能力,能够独立解决项目过程中遇到的问题,具备较强的学习能力和文档撰写能力; 5、团队协作,热爱技术,追求卓越,结果导向,自我驱动。