• 1k-2k 经验在校/应届 / 大专
    企业服务 / 上市公司 / 2000人以上
    公司信息(Company Info): 我们透过1百万以上的注释者及语言专家组成的人工智能团体,协助各个企业测试与改善机器学习模型。我们拥有的人工智能培训平台能处理500种以上不同语言各式各样的资料 (如文字、图像、音频、视频和地理数据 。我们的人工智能数据解决方案能突显人工智能系统跨度应用的高端智能产品,得以有更佳的搜索结果、语音识别、 更仿真地人机互动等。 职位概述(Position Open): 我们正在寻找具有强大沟通能力并每天使用互联网的充满活力的人。 这是一个自由职业者,独立承包商职位。您将可以灵活、自由地在自己的家中工作,按自己的时间工作。 人选画像(Ideal Candidate): 我们希望候选人:对于本地信息风俗民情及文化事物, 熟练应用社交软件。 职位要求(Job Requirements): -熟练掌握韩语和英语 -您需要在过去 3 年至今必须居住于中国內地。 通过工作相关准则测验。 -具备对中国过去与现在的商业、媒体、体育、新闻、社交媒体和文化等敏感度。 -需自备高速宽带/Wifi、电脑及基本软件、智能手机,安卓手机系统需在4.1版本及更高版本,IOS手机系统需要在第8版本或更高版本,来完成本任务。 -需在您的只能手机上安装条形二维码扫描应用程序才能完成某些任务。 -需要您是Gmail和其他社交媒体的活跃用户 更多职位描述: 您将审查在线广告以改进其内容、质量和布局。您将需要对搜索引擎结果中的广告提供反馈和分析,并就广告与所用搜索词的相关性进行评级。这个机会的另一个方面将涉及通过检查语法、语气和文化相关性来审查广告中使用的语言。通过这项工作,您将为中国在线广告的质量做出宝贵的贡献。 报酬与亮点(Benefits): 视项目难度及完成度而定,报酬范围为每小时6-7美金(折合人民币约为37-45元)。 工时弹性自行安排 工作与生活平衡的节奏掌握 对环境的正面影响力 The Role – Personalized Internet Ads Assessor Company Info: We help companies test and improve machine learning models via our global AI Community of 1 million+ annotators and linguists. Our proprietary AI training platform handles all data types (text, images, audio, video and geo) across 500+ languages and dialects. Our AI Data Solutions vastly enhance AI systems across a range of applications from advanced smart products, to better search results, to expanded speech recognition, to more human-like bot interactions and so much more. Description and Requirements We are looking for dynamic people who have strong communication skills and use the Internet daily. This is a freelance, independent contractor position. You will have the flexibility and freedom to work from your own home, working your own hours. What are the main requirements for the opportunity? You must be living in China for the last 3 consecutive years. You must have familiarity with current and historical business, media, sport, news, social media and cultural affairs in China. Fluency in English and the Chinese language. Access to and use of a broadband internet connection and associated computer and software to perform the work, all provided at your own expense. Experience in use of web browsers to navigate and interact with a variety of content. Access to and use of an Android (version 4.1 or higher) or IOS Smartphone (version 8 or higher) to complete tasks. A Barcode Scanner application must be installed on your smartphone to complete certain tasks. Active daily user of Gmail and other forms of Social Media Additional Job Description In this job you will be reviewing online advertisements in order to improve their content, quality and layout. You will be required to provide feedback and analysis on advertisements found in search engine results and provide ratings on their relevance to the search terms used. Another aspect of this opportunity will involve reviewing the language used in advertisements by examining grammar, tone and cultural relevance. Through this work you will be making a valuable contribution to the quality of online advertisements in China. Compensation & Benefits: Potential earnings is applicable if contributors reach their productivity level as these are pay per task roles. The potential earnings for this role is 6-7 USD/hourly. Flexible Hours to work around home life Better Work-Life Balance Positive Environmental Impact
  • 20k-40k·14薪 经验3-5年 / 本科
    智能硬件,电商平台 / 上市公司 / 2000人以上
    职位描述: 1、负责小米游戏平台付费用户全生命周期的策略运营和管理工作,通过精细化运营手段提升付费用户规模 2、负责搭建付费用户增长体系,包括提升新用户破冰、老用户付费留存、流失用户召回、沉默用户唤醒等核心指标,洞察用户付费心理,不断优化会员权益的质量及体验; 3、负责制定不同类型会员各流程节点的转化策略,包括新用户获取及增长、老用户复购; 4、整合资源,规划、落地内外部会员活动的策划、执行、效果评估和跟踪等相关工作; 5、与产研人员高效配合,推动需求与策略上线,监控数据效果,实现策略的迭代优化; 6、通过用户行为分析、用户调研、行业对标和特征挖掘等方式探索会员生命周期价值; 职位要求: 1、本科及以上学历,3年以上互联网运营经验; 2、能独当一面,独立完成运营体系建设工作,跟进全项目流程; 3、具有一定的用户思维,对用户的需求心理以及增长策略模型有一定了解; 4、优秀的数据逻辑驱动思维能力、独立思考能力和自我驱动力,有较强的协调能力与项目推动能力; 5、有游戏行业经验、付费增值、用户增长相关背景优先。
  • 40k-60k·15薪 经验10年以上 / 本科
    汽车丨出行 / 未融资 / 2000人以上
    工作职责 1. 负责带领团队进行前瞻自动驾驶视觉感知算法/雷达感知算法/多传感器融合算法/预测算法/标定算法的调研、设计、开发、部署、迭代与测试工作 2. 负责带领团队进行量产自动驾驶视觉感知/雷达感知/多传感器融合/目标筛选及预测/标定软件的需求分析、方案设计、软件实现、移植部署、测试和交付 3. 负责项目供应商管理、相关功能模块对接工作 4. 组织代码、设计、技术文档的评审,确保软件交付质量 5. 负责自动驾驶产品中算法方案的制定与实现 工作要求 1.学历要求:**大学本科及以上学历,英语CET-4及以上 2.工作经验:具有6年及以上自动驾驶视觉感知/雷达感知/融合/预测/标定领域的深度学习或C++开发工作经验,特别优秀者可适当放宽 3.其他: ① 深度学习、机器学习、人工智能、计算机、机器人、软件工程、电子工程、通信工程、车辆工程、自动化、应用数学、测绘遥感等相关专业优先 ② 扎实的工程实践能力,深入掌握数据结构与算法,熟练掌握Linux/docker/shell/git等相关工程基础,熟练掌握Python或C++ ③ 满足以下条件之一: 1)精通使用至少一种深度学习框架(Pytorch/Tensorflow/MXNet/Caffe2),能独立完成CNN、RNN等常见网络结构搭建、训练、测评等,精通基于Transformer/时间序列预测相关模型开发经验 2)精通计算机视觉常用的图像处理、多视图几何算法 3)精通时空同步、目标跟踪、数据关联、信息融合、航迹管理、性能评估等多传感器融合基本技术 4)精通毫米波雷达/摄像头/激光雷达等传感器的工作原理,具有传感器噪声建模经验,具有车辆运动学模型建模经验 5)精通点云处理常用算法、原理和框架,精通处理点云的目标聚类、分割、检测等算法 6)精通毫米波雷达信号处理、数据滤波处理方法,有处理毫米波雷达特殊场景问题相关经验 7)精通超声波雷达泊车库位搜索、障碍物检测等相关技术 ④ 责任心强,有良好的沟通能力和团队合作能力,工作自主驱动,具备良好的问题定位与分析能力 ⑤ 优先条件: 1)有Tier 1或主机厂相关工作经验 2)熟悉线性与非线性化理论、数学建模、KF/EKF/UKF等滤波算法、DS证据理论、决策树/集成学习等机器学习算法 3)有嵌入式开发与部署经验,熟练使用Modern C++,有DSP开发经验优先 4)有车规级感知算法开发落地项目的优先 5)以下至少一种技术主题的研究经历:VAE, GAN, GLOW, RL, IRL, imitation learning, multi-agent learning 6)在深度学习/机器学习学术会议发表过论文,如:CVPR, ICML, NeurIPS, ICCV, ICLR等
  • 18k-25k·14薪 经验3-5年 / 本科
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    一、岗位职责: 1、数据中台相关应用产品(如:智慧城市)的原型设计、需求调研。 2、数据中台相关应用场景PRD编写。 3、数据治理咨询规划,包括:数据标准、数据质量、元数据的梳理,数据成熟度评估等。 3、协助产品市场材料(售前)材料编写。 4、和交付团队合作,协助完成产品开发过程的需求指导。 二、任职要求: 1、从事过数据治理、数据中台产品经理等岗位的工作。 2、熟悉了解行业数据中台建设需求,包括数据采集需求、数据指标、数据治理需求等。 3、熟悉使用Axure RP、墨刀等原型设计工具。 4、能够制作PPT介绍材料; 5、接受出差。
  • 45k-65k·15薪 经验5-10年 / 本科
    物流|运输 / 不需要融资 / 少于15人
    工作职责 1. 负责带领团队进行前瞻自动驾驶视觉感知算法/雷达感知算法/多传感器融合算法/预测算法/标定算法的调研、设计、开发、部署、迭代与测试工作 2. 负责带领团队进行量产自动驾驶视觉感知/雷达感知/多传感器融合/目标筛选及预测/标定软件的需求分析、方案设计、软件实现、移植部署、测试和交付 3. 负责项目供应商管理、相关功能模块对接工作 4. 组织代码、设计、技术文档的评审,确保软件交付质量 5. 负责自动驾驶产品中算法方案的制定与实现 工作要求 1.学历要求:**大学本科及以上学历,英语CET-4及以上 2.工作经验:具有6年及以上自动驾驶视觉感知/雷达感知/融合/预测/标定领域的深度学习或C++开发工作经验,特别优秀者可适当放宽 3.其他: ① 深度学习、机器学习、人工智能、计算机、机器人、软件工程、电子工程、通信工程、车辆工程、自动化、应用数学、测绘遥感等相关专业优先 ② 扎实的工程实践能力,深入掌握数据结构与算法,熟练掌握Linux/docker/shell/git等相关工程基础,熟练掌握Python或C++ ③ 满足以下条件之一: 1)精通使用至少一种深度学习框架(Pytorch/Tensorflow/MXNet/Caffe2),能独立完成CNN、RNN等常见网络结构搭建、训练、测评等,精通基于Transformer/时间序列预测相关模型开发经验 2)精通计算机视觉常用的图像处理、多视图几何算法 3)精通时空同步、目标跟踪、数据关联、信息融合、航迹管理、性能评估等多传感器融合基本技术 4)精通毫米波雷达/摄像头/激光雷达等传感器的工作原理,具有传感器噪声建模经验,具有车辆运动学模型建模经验 5)精通点云处理常用算法、原理和框架,精通处理点云的目标聚类、分割、检测等算法 6)精通毫米波雷达信号处理、数据滤波处理方法,有处理毫米波雷达特殊场景问题相关经验 7)精通超声波雷达泊车库位搜索、障碍物检测等相关技术 ④ 责任心强,有良好的沟通能力和团队合作能力,工作自主驱动,具备良好的问题定位与分析能力 ⑤ 优先条件: 1)有Tier 1或主机厂相关工作经验 2)熟悉线性与非线性化理论、数学建模、KF/EKF/UKF等滤波算法、DS证据理论、决策树/集成学习等机器学习算法 3)有嵌入式开发与部署经验,熟练使用Modern C++,有DSP开发经验优先 4)有车规级感知算法开发落地项目的优先 5)以下至少一种技术主题的研究经历:VAE, GAN, GLOW, RL, IRL, imitation learning, multi-agent learning 6)在深度学习/机器学习学术会议发表过论文,如:CVPR, ICML, NeurIPS, ICCV, ICLR等
  • 电商平台 / C轮 / 2000人以上
    岗位职责: 1、负责存货管理、收款对账等财务子领域的功能落地、产品迭代相关工作; 2、收集用户(业务、上下游产研)需求,评估需求合理性,出具需求分析报告和产品需求文档; 3、按照公司及业务的发展趋势,挖掘潜在业务需求,适时规划和调整系统演进路线并推动落地; 5、跟进研测过程进度、识别过程风险,确保问题可得到有效处理并解决,并及按期交付成果; 6、上线后持续跟进产品的使用情况,分析运营数据,主动自驱挖掘产品的提升改进机会; 任职要求: 1、财务类(会计、工商管理、审计)或计算机相关专业本科及以上学历,财务系统产品设计经验3年及以上; 2、熟悉零售、外贸行业术语和财务领域基本概念,对应收、成本、应付、费用等核算流程有深入理解,有电商、零售行业工作经验尤佳; 3、曾经主导或者完整参与财务中台相关领域的信息系统项目,有成本管理、佣金计费、共享服务等项目经验尤佳; 4、积极主动,善于言表,有较强的逻辑思维表达能力、沟通协调能力; 5、善于挖掘,敢于创新,有较强的分析问题、解决问题能力; 6、严谨仔细,责任心强,有较强的文档编写水平; 7、积极乐观,踏实坚韧,能够承受新环境下的工作压力。
  • 15k-23k·13薪 经验5-10年 / 本科
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    职责描述: 1、在公司战略方向深刻理解的基础上,负责主业周边衍生产品的开发过程中的系统规划设计、技术选型评估,负责流程的讨论和优化、性能调优和稳定性保障,并对技术难点进行攻关; 2、在整个项目生命周期过程中,梳理优化各种流程、规范,并推动落地实施; 3、结合需求设计高扩展性、高性能、安全、稳定、可靠的技术系统,跟踪并研究新技术并应用于平台建设中; 4、对开发工程师、外包团队进行管理和指导,形成良好的研发氛围,提升团队整体技术水平。 任职资格: 1、计算机相关专业本科以上学历,5年及以上相关工作经验,5年以上系统设计和架构经验,有扎实的计算机理论基础; 2、精通JAVA开发技术,精通SpringBoot、hibernate等常用开源技术并理解技术实现原理; 3、精通面向对象分析设计,熟悉设计模式,具备大型系统设计、开发、调优经验; 4、熟练掌握MySQL、Redis等主流数据库,具备一定的SQL调优能力; 5、熟悉容器技术,熟悉微服务架构风格,对主流前端框架(如Vue)有一定了解,有大型项目实践经验者优先; 6、具备良好的逻辑思维,思路清晰,善于沟通,能独立分析和解决问题; 7、对新技术敏感,有良好的学习能力; 8、有运营商业务平台开发经验优先。
  • 30k-50k·15薪 经验3-5年 / 本科
    汽车丨出行 / 未融资 / 2000人以上
    工作职责 1. 负责前瞻自动驾驶视觉感知算法/雷达感知算法/多传感器融合算法/预测算法/标定算法的调研、设计、开发、部署、迭代与测试工作 2. 负责量产自动驾驶视觉感知/雷达感知/多传感器融合/目标筛选及预测/标定软件的需求分析、方案设计、软件实现、移植部署、测试和交付 3. 负责数据资源管理以及性能评估工具、开发调试工具等工具链的开发与维护 4. 负责相关功能模块对接工作 5. 负责相关技术文档的撰写工作 工作要求 1.学历要求:**大学本科及以上学历,英语CET-4及以上 2.工作经验:具有2年及以上自动驾驶视觉感知/雷达感知/融合/预测/标定领域的深度学习或C++开发工作经验,特别优秀者可适当放宽 3.其他: ① 深度学习、机器学习、人工智能、计算机、机器人、软件工程、电子工程、通信工程、车辆工程、自动化、应用数学、测绘遥感等相关专业优先 ② 扎实的工程实践能力,深入掌握数据结构与算法,熟练掌握Linux/docker/shell/git等相关工程基础,熟练掌握Python或C++ ③ 满足以下条件之一: 1)熟悉至少一种深度学习框架(Pytorch/Tensorflow/MXNet/Caffe2),能独立完成CNN、RNN等常见网络结构搭建、训练、测评等 2)熟悉计算机视觉常用的图像处理、多视图几何算法 3)熟悉时空同步、目标跟踪、数据关联、信息融合、航迹管理、性能评估等多传感器融合基本技术 4)熟悉毫米波雷达/摄像头/激光雷达等传感器的工作原理,具有传感器噪声建模经验,具有车辆运动学模型建模经验 5)熟悉3D点云处理常用算法、原理和框架,熟悉处理点云的目标聚类、分割、检测等算法 6)熟悉毫米波雷达信号处理、数据滤波处理方法,有处理毫米波雷达特殊场景问题相关经验 7)熟悉超声波雷达泊车库位搜索、障碍物检测等相关技术 ④ 责任心强,有良好的沟通能力和团队合作能力,工作自主驱动,具备良好的问题定位与分析能力 ⑤ 优先条件: 1)有Tier 1或主机厂相关工作经验 2)熟悉线性与非线性最优化理论、数学建模、KF/EKF/UKF等滤波算法、DS证据理论、决策树/集成学习等机器学习算法 3)有嵌入式开发与部署经验、DSP开发经验优先 4)有车规级感知功能开发落地项目的优先
  • 27k-38k 经验3-5年 / 本科
    医疗丨健康、其他 / 未融资 / 150-500人
    【岗位职责】 1.负责区域内行业客户的开发、维护 2.负责区域内客户融资租赁项目的导入、论证、方案设计、资信评估及风险管理; 3. 负责融资项目立项、信息收集、项目评估论证到签约全过程,确保项目推进合理节奏; 4. 与行业相关设备供应商、代理商等建立广泛联系,整合渠道资源,推进区域业务; 5.积极配合公司业务及职能部门的其他工作; 【岗位要求】 1、学历要求本科及以上  2、银行对公客户经理、租赁同业、保理、其他金融行业及大企业对公营销背景 3、具备融资租赁及相关的金融、贸易、法律、财务等行业背景知识 4、需求分析判断能力和独立解决客户问题能力 5、能够承受压力并进行自我调节和自我激励 6、能适应较多工作日出差工作 7、具有较强的沟通能力和应变能力
  • 20k-25k 经验5-10年 / 本科
    其他 / 未融资 / 50-150人
    一、岗位职责: 1、技术方案和架构设计‌:作为技术骨干,负责产品技术方案和架构的设计;‌ 2、‌软件产品开发‌:负责调研、设计、开发、维护公司的软件产品;‌ 3、‌技术指导和管理‌:负责对技术团队进行技术指导,协助上级对项目进行评估和管理; 4、‌技术难题解决‌:负责主要技术文档、开发规范的制定,解决软件产品各类技术问题。‌ 二、技术要求: 1、两年以上安卓开发经验,熟练掌握Android Studio开发工具‌,熟悉Activity、Fragment、Service、ContentProvider等组件开发‌; 2、3年以上java后端开发经验,熟练使用Spring Boot,熟悉Spring Cloud相关组件;熟练掌握MySQL数据库和Redis; 3、两年以上前端开发经验,熟悉VUE前端框架‌,熟悉uni-app的开发; 三、任职要求: 1、认同奋斗者文化,工作自动自发,内驱力强,善于学习、复盘、迭代; 2、计算机科学、信息技术等相关专业,**本科及以上学历; 3、2年以上团队管理经验,沟通、协作、解决问题能力良好。
  • 20k-35k·14薪 经验5-10年 / 本科
    科技金融,人工智能服务 / 不需要融资 / 150-500人
    职责描述: 1.负责保险业务和客户的数据挖掘及算法研究,包括但不限于自然语言处理、预测与分类模型构建、用户画像、数据分析报告、数据采集和整理。 2.负责业务需求调研,结合理解完成数据分析和数据建模。 3.对数据进行整体质量评估,并提供调整改进建议 4.利用分析参与产品业务策略设计,根据数据提供优化建议。 任职要求: 1、2年以上机器学习、人工智能相关经验,具备NLP或数据图谱应用相关经验 2.掌握常见的机器算法模型及原理,如LR、D/RTreeModel、Boosting、Bagging、PCA,熟悉分类、预测、聚类等常用算法,熟悉工程应用中GBDT、XGBoost关键参数,参与过大规模机器学习、数据挖掘项目,有获奖经历者优先; 3.熟悉Linux系统,熟练掌握Python语言,能够熟练使用Numpy、Pandas、Scikit-Learn独立进行建模实验; 4.熟练掌握SQL语言,熟悉MySQL、图数据库,有大数据处理经验优先; 5.熟练掌握Java语言,有Java/DMP项目开发经验优先; 6.拥有统计/数学/计算机基础,数据敏感,有良好的逻辑思维和定义以及解决问题的能力; 7.具有较强学习能力、自我驱动能力、责任感和团队协作能力。
  • 10k-20k 经验3-5年 / 本科
    科技金融,人工智能服务 / 不需要融资 / 150-500人
    岗位职责: 1. 负责电商系统,保险业务系统的开发管理与日常维护 2. 参与业务部门的需求沟通,引导及细化需求 3. 参与外包项目开发的进度,质量管理,并对系统设计方案进行合理性评估 4. 负责生产环境运维问题的分析与处理,及向外包项目组分派问题,并追踪问题解决的实效 任职要求: 1. 计算机相关专业本科及以上学历,1年以上保险行业软件开发经验 2. 熟练使用JAVA语言编程,熟悉Struts,spring,hibernate等开源框架及MVC模型 3. 熟悉oracle,mysql等常用数据库,熟练使用SQL等数据库编程语言 4. 熟悉tomcat,weblogic等常用中间件的使用,了解Linux常用命令 5. 了解项目管理及软件工程知识,并能在项目过程中把控项目风险 6. 具备较好的沟通与协调能力
  • 15k-30k 经验1-3年 / 本科
    软件开发、人工智能 / 不需要融资 / 2000人以上
    [岗位职责] 1、对华为产品的软件质量进行把关;理解产品设计原理、实现过程; 2、制订测试计划、规划测试方案、编写软件测试工具、执行软件测试、分析测试数据、输出测试报告; 3、提出对产品的进一步改进的建议,并评估改进方案是否合理;对测试结果进行总结与统计分析; 4、与全球的运营商、行业客户沟通对话,以专业的技术,架起华为与客户之间沟通的桥梁。 [岗位要求] 1、计算机、软件相关专业本科及以上学历; 2、熟悉软件测试理论,掌握业界基本的测试设计方法、工具的使用; 3、熟悉linux常用命令的使用; 4、了解数据库基本知识,能使用常用数据库命令; 5、熟悉自动化脚本和工具(python、shell、selenium、 Jmeter、SoapUI等)的使用; 6、熟悉一定的网络数通知识 [加分项] 安全、性能、可靠性等经验,有项目管理经验
  • 16k-30k 经验不限 / 本科
    通讯电子 / 不需要融资 / 2000人以上
    岗位职责 1.编写测试计划、规划详细的测试方案、编写测试用例。 2. 根据测试计划搭建和维护测试环境; 3. 执行测试工作,提交测试报告。包括编写用于测试的自动测试脚本,完整地记录测试结果,编写完整的测试报告等相关的技术文档; 4.对测试中发现的问题进行详细分析和准确定位,与开发人员讨论缺陷解决方案。 5.提出对产品的进一步改进的建议,并评估改进方案是否合理;对测试结果进行总结与统计分析,对测试进行跟踪,并提出反馈意见。 6.为业务部门提供相应技术支持,确保软件质量指标。 岗位要求 1、本科以上学历,计算机相关专业; 2、熟悉常用测试工具,熟悉常用的设计模式; 3、具备良好的学习能力,有钻研精神,热爱互联网; 4、具备良好的编码能力,具有规范化,标准化的代码编写习惯; 5、具备良好的技术文档输出能力; 6、性格开朗,积极进取,善于沟通,抗压能力强,工作细致有责任心。
  • 14k-28k 经验不限 / 本科
    通讯电子 / 不需要融资 / 2000人以上
    (一)数据采集与整合 1. 设计和开发数据采集系统,从多种数据源(如网页、数据库、文件系统、传感器等)获取数据,确保数据的准确性、完整性和及时性,以满足大模型的训练和优化需求。 2. 针对不同结构(结构化、半结构化和非结构化)的数据制定相应的采集策略,能够处理海量数据的采集任务。 3. 负责将采集到的各类数据进行整合,建立统一的数据存储和管理体系,消除数据孤岛现象,保障数据的一致性。 (二)数据预处理与清洗 1. 对采集到的原始数据进行预处理,包括但不限于数据格式转换、编码处理、数据归一化等操作,以便于后续的数据处理和模型训练。 2. 开发数据清洗程序,识别和处理数据中的噪声、缺失值、异常值等问题,提高数据质量,为大模型提供高质量的输入数据。 3. 建立数据质量监控机制,持续跟踪数据质量指标,及时发现并解决数据质量下降的问题。 (三)数据标注与管理 1. 对于需要人工标注的数据,设计数据标注方案并组织标注工作,确保标注的准确性和一致性。 2. 建立数据标注平台或工具,提高标注效率,同时方便对标注数据进行管理、审核和版本控制。 3. 管理标注数据的存储和分发,与大模型开发团队紧密合作,确保标注数据能够及时、准确地用于模型训练和评估。 (四)数据存储与优化 1. 设计和优化大模型的数据存储架构,根据数据的特点(如数据量、访问频率、数据类型等)选择合适的存储技术(如关系型数据库、非关系型数据库、分布式文件系统等)。 2. 负责数据存储系统的性能优化,包括数据库索引优化、存储容量规划、数据读写性能提升等方面,以满足大模型对数据快速访问的需求。 3. 确保数据存储的安全性和可靠性,制定数据备份、恢复和灾难应对策略,防止数据丢失或损坏。 (五)数据管道构建与维护 1. 构建高效的数据管道(Data Pipeline),实现数据从采集到存储、预处理、标注再到模型训练的自动化流程,提高数据流转效率。 2. 监控数据管道的运行状态,及时处理管道中的故障和堵塞问题,确保数据的稳定流动。 3. 对数据管道进行持续优化,根据业务需求和数据规模的变化,调整管道的架构和参数,提高数据处理的效率和可扩展性。 (六)与团队协作 1. 与大模型算法开发团队、前端开发团队、测试团队等密切合作,理解各方对数据的需求,提供数据支持并协同解决项目中的数据相关问题。 2. 参与数据工程团队内部的技术交流和分享活动,促进团队整体技术水平的提升