-
岗位职责: 1、数据收集与预处理:数据收集:负责从各种数据源(如数据库、文件系统、网络等)中收集数据,确保数据的全面性和多样性。数据预处理:对数据进行清洗、整理、转换和归约等操作,以提高数据的质量和可用性。这包括处理缺失值、异常值、重复值等问题,以及将数据转换为适合挖掘的格式。 2、数据挖掘与分析:数据挖掘:运用统计学、机器学习和数据挖掘技术,对预处理后的数据进行深入分析和挖掘,以发现模式和趋势。这包括分类、聚类、关联规则挖掘、回归分析、时间序列分析等多种方法。数据分析:通过数据挖掘技术发现数据中的隐藏模式、关联规则和趋势,提取有用的信息和知识。这些分析结果可以用于业务预测、市场趋势分析、用户行为研究等多个方面。 3、模型构建与优化:模型构建:根据业务需求和数据特点,选择合适的机器学习算法或深度学习模型,构建数据分析模型。这些模型可以用于分类、预测、推荐等多个场景。模型优化:对构建的模型进行评估和优化,提高模型的准确性和性能。这包括调整模型参数、选择更合适的算法、优化特征工程等方面。 4、数据可视化与报告:数据可视化:利用数据可视化工具(如Tableau、Power BI等)将挖掘和分析的结果以直观、易懂的方式呈现出来。这有助于用户更好地理解数据和分析结果,发现数据中的规律和趋势。报告撰写:撰写数据挖掘和分析报告,向决策者和相关人员解释和说明分析结果,并提出相应的建议和决策支持。这些报告可以包括数据摘要、分析结果、模型性能评估等多个部分。 任职要求: 1、教育程度:计算机、数学、统计学相关专业;本科及以上学历。 2、工作经验:具备5年及以上专业工作经验。 3、知识:熟悉常用数据统计、分析和建模方法;熟练掌握各类算法包括分类算法、聚类算法、关联规则挖掘、异常监测等;熟练使用Python、Sql等语言; 熟悉大数据技术栈和工具,如Hadoop、Flink、Kafka等。 4、技能:熟悉数据作业流程,包括指标体系定义、数据清洗ETL、数据分析挖掘、数据可视化与展示;熟悉各种类型的统计方法,比如概率分布、相关性、回归、随机过程等;能够使用机器学习算法建立数学模型;熟悉常用大数据计算引擎flink;熟悉TensorFlow、PyTorch等深度学习框架。 5、核心能力素质:分析判断能力、解决问题能力、执行能力、沟通能力、文字能力、抗压能力、业务知识、工作主动性、责任意识、团队协作、严谨细致、服务意识、敬业精神、正直诚信。
-
工作职责: 1. 负责电力大数据分析,电力数据挖掘与分析、算法设计等领域的研究,从系统和数据中发掘业务需求; 2. 负责数据逻辑梳理,基础数据处理、分析及相应的开发工作; 3. 对海量数据进行处理和分析,梳理业务与数据的相关关系,搭建模型,分析关键因素,优化核心决策。 4. 通过自然语言处理能力对文本分析; 任职资格: 1、研究生及以上学历,数学、统计学、计算机相关专业,1年及以上工作经验或本科985、211类院校毕业,数学、统计学、大数据专业毕业,2年以上工作经验,有电力工作经验者优先; 2、扎实的数据分析和可视化能力,熟练掌握Python、SQL、Excel等数据分析工具的使用,熟练应用numpy、pandas、scipy、Matpltlib等工具; 3、扎实的建模和算法模型落地能力,熟悉聚类、回归、时序异常检测、路径规划或自然语言处理方向;数学建模竞赛经历优先; 4、熟悉linux开发环境,精通Python语言特性,了解Docker容器生态体系; 5、积极主动、勇于承担,有良好的沟通能力、团队合作精神、较强的责任心。
-
岗位职责: 1、参与页面分析挖掘算法的研究与实现,通过算法策略优化页面分类模型、文本分类模型。 2、利用文本挖掘、图像理解等业界先进技术,对多模态内容进行挖掘与理解。 3、工作范围涵盖网页筛选与理解、网页与站点分类和去重、多类型非网页类多模态数据的处理和理解。 岗位基本要求: 1、计算机相关专业本科及以上相关学历,具备优秀的理解力、沟通能力和团队协作能力。 2、熟练掌握 c++/python/Java等编程语言,并且在机器学习,自然语言处理领域有扎实的理论功底和动手能力。具备优秀的逻辑思维能力和数据科学能力,在相关领域比赛中获奖优先。 3、在信息检索、自然语言处理/图像与视频理解等方面有非常扎实的理论功底,以及丰富的解决实际问题的项目经验。有信息检索相关领域工作经验优先。 4、善于学习领域前沿技术并能快速应用到实际工作当中,在自然语言处理,信息检索、计算机视觉等领域有相关学术论著优先。
-
岗位职责: 1.建立面向大语言模型的数据去重、清洗、过滤能力。 2.高效处理海量数据,探索大语言模型的数据混合配比。 3.建立大语言模型的通用和领域评测能力。 4.持续跟进行业最新进展,不断优化提升面向大模型的数据算法能力。 任职资格: 1.计算机、人工智能、自然语言处理或相关领域的硕士或博士,能力突出的本科生。 2.具备良好的编程能力,熟练掌握Python等编程语言,掌握PyTorch等至少一种深度学习框架。 3.具备良好的沟通和团队协作能力,有较强的解决问题能力和动手能力。 4.具备1年以上相关领域的工作经验
-
岗位职责: 1、基于海量数据进行分析和模型搭建,定量识别潜在的风险和业务影响; 2、深入理解微博业务模式,发现潜在作弊风险点,设计合理的数据埋点体系; 3、了解行业动态,找到作弊者的行为特点,快速迭代,持续优化某个业务的风控效果; 4、基于微博生态数据,结合用户使用习惯,持续产出画像标签 5、监控各场景的风险指标,建立预警监控体系和应对措施。 任职要求: 1、本科及以上学历,计算机、统计学、数学等相关专业; 2、有大数据分析或数据挖掘等方向的工作经验,能够提取有效特征并建立模型; 3、熟练使用HiveSQL、Python/R等语言,熟悉常用的数据挖掘、机器学习算法,熟悉linux操作系统,能对海量数据进行高效分析; 4、对业务和数据敏感,能快速发现问题和解决问题; 5、思维开阔,有良好的逻辑思维能力,能够主动开展和推进工作,愿意接受挑战、有一定的承压能力; 6、有画像建设、地图类项目、风控项目经验者优先;有LBS、图数据库、自然语言处理经验者优先。
-
【岗位职责】 1.实现国家重点项目中的数据采集、传输、存储、计算、分析、可视化、数据治理等产品; 2.参与大数据AI系统的数据中台设计和研发工作,为知识图谱、人物建模、搜索推荐提供高质量数据、灵活可扩展的处理流程以及直观易用的数据界面; 3.全球多语言技术数据的抓取/补全; 4.数据正确性/完整性自动化检查; 5.自动抓取入库流程框架开发; 6.数据统计框架开发; 7.数据文档撰写。 【岗位要求】 1.**本科及以上学历,计算机/数学相关方向专业,3-4年工作经验优先; 2.编程能力过硬,熟练掌握python或java编程; 3.会使用数据分析/挖掘常用方法,序列分析,关联分析,异常点挖掘,分类,聚类等,熟练使用数据分析及可视化工具Excel,Tableau等 4.熟悉mysql数据库,能够熟练编写sql语句并优化 5.有知识图谱、数据中台研发经验者优先; 6.有数据清洗、数据处理、数据自动化监测经历优先; 7.熟悉一种或多种主流开源大数据平台组件,如Flume、Kafka、Hadoop、Hive、Spark、Flink优先; 8.良好的团队合作, 较强的沟通能力、学习能力,对解决具有挑战性问题充满激情;
-
【岗位职责】 1.协助进行国家重点项目中的ETL、指标计算、数据治理等的研发工作; 2.协助进行数据中台设计和研发,为知识图谱、人物建模、搜索推荐等提供高质量数据,开发灵活可扩展的处理流程以及直观易用的数据界面; 3.协助进行全球多语言技术数据的抓取/补全; 4.协助进行数据正确性/完整性自动化检查; 5.协助进行自动抓取入库流程框架开发; 6.数据统计框架开发; 7.相关数据文档的撰写。 【岗位要求】 1.硕士,计算机/数学相关方向专业,可确保每周3天实习; 2.熟练掌握python编程,了解常用的数据处理库如pandas等; 3.熟悉mysql数据库,能够熟练编写sql语句并优化; 4.有数据清洗、数据处理、数据自动化监测经历者优先; 5.熟悉一种或多种主流开源大数据平台组件者优先,如Flume、Kafka、Hadoop、Hive、Spark、Flink; 6.了解数据分析/挖掘常用方法者优先,如序列分析、关联分析、异常点挖掘、分类、聚类等; 7.有编程竞赛获奖经历者优先,如 ACM、中国大学生程序设计大赛、蓝桥杯、CCF 相关竞赛或 CCF 等级考试相关、PAT 等级考试; 8.良好的团队合作,较强的沟通能力、学习能力,对解决具有挑战性问题充满激情。
-
工作职责 -研究数据挖掘或统计学习领域的前沿技术,并用于实际问题的解决和优化 -大规模机器学习算法研究及并行化实现,为各种大规模机器学习应用研发核心技术 -通过对数据的敏锐洞察,深入挖掘产品潜在价值和需求,进而提供更有价值的产品和服务,通过技术创新推动产品成长 任职资格 -热爱互联网,对技术研究和应用抱有浓厚的兴趣,有强烈的上进心和求知欲,善于学习和运用新知识 -具有以下一个或多个领域的理论背景和实践经验:机器学习/数据挖掘/深度学习/信息检索/自然语言处理/机制设计/博弈论 -至少精通一门编程语言,熟悉网络编程、多线程、分布式编程技术,对数据结构和算法设计有较为深刻的理解 -良好的逻辑思维能力,对数据敏感,能够发现关键数据、抓住核心问题 -较强的沟通能力和逻辑表达能力,具备良好的团队合作精神和主动沟通意识 具有以下条件者优先: -具有以下一个或多个领域的理论背景和实践经验,包括机器学习/深度学习/强化学习/自然语言处理/推荐系统/信息检索等 -深入理解机器学习常用组件(全连接神经网络,CNN等)的原理,有1年以上机器学习相关项目或研究经验 -熟练掌握常用数据结构及算法 -熟悉JAVA/C++等语言编程,有一定编程经验 -熟练使用至少一门脚本语言,如python,linux shell等 -熟悉linux操作系统,能胜任在linux操作系统上工作 -熟练使用sql语言进行常用的数据库操作 -有强烈的责任心和团队配合意识及能力,并有较强的解决问题能力 -熟悉海量数据处理、最优化算法、分布式计算或高性能并行计算,有相关项目经验
-
数据挖掘工程师 【岗位职责】 1.实现国家重点项目中的数据采集、传输、存储、计算、分析、可视化、数据治理等产品; 2.参与大数据AI系统的数据中台设计和研发工作,为知识图谱、人物建模、搜索推荐提供高质量数据、灵活可扩展的处理流程以及直观易用的数据界面; 3.全球多语言技术数据的抓取/补全; 4.数据正确性/完整性自动化检查; 5.自动抓取入库流程框架开发; 6.数据统计框架开发; 7.数据文档撰写。 【岗位要求】 1.本科及以上学历,计算机/数学相关方向专业,至少3年以上工作经验; 2.编程能力过硬,熟练掌握python或java编程; 3.会使用数据分析/挖掘常用方法,序列分析,关联分析,异常点挖掘,分类,聚类等,熟练使用数据分析及可视化工具Excel,Tableau等 4.熟悉mysql数据库,能够熟练编写sql语句并优化 5.有知识图谱、数据中台研发经验者优先; 6.有数据清洗、数据处理、数据自动化监测经历优先; 7.熟悉一种或多种主流开源大数据平台组件,如Flume、Kafka、Hadoop、Hive、Spark、Flink优先; 8.良好的团队合作, 较强的沟通能力、学习能力,对解决具有挑战性问题充满激情;
-
岗位职责: 1、负责挖掘公司内部数据,包括但不限于:财务、运营、销售、工程服务等业务领域,衍生出对业务目标有预测效果的特征或模型; 2、使用数据挖掘理论及技术,对异构数据建立算法模型,完成统计、分析、预测等任务; 3、负责从业务需求出发,通过数据分析和智能算法设计,设计数据挖掘的解决方案并实施落地,全流程闭环跟进。 岗位要求: 1. ****及以上学历,计算机、数学、统计学等相关专业方向; 2. 5年以上机器学习/数据分析/数据挖掘/人工智能方向工作经验;有2-3个制造行业数据挖掘项目落地经验; 3. 精通数据挖掘领域常用算法,熟悉传统机器学习、深度学习的基础理论和算法,包括但不限于回归分类常见算法、随机森林、GBDT、神经网络等; 4. 熟练掌握Python、SQL;对大数据平台Hive,、Spark、Hadoop 有一定的了解; 5. 具备迅速了解业务场景并识别出机会点的能力,严谨的逻辑思维能力,高水平的沟通能力,有快速学习能力 和丰富的问题解决能力,具备高度个人驱动力和执行力,同时具备良好的团队合作精神。
-
工作职责: 1、利用数据挖掘、机器学习相关知识和算法,根据业务的需求进行建模。 2、从海量数据中发现问题,在数据发生异常时及时感知数据反映的业务问题,从数据中找出问题,挖据数据中的核心商业价值,指导业务决策。 3、参与模型专题的设计、实现、算法调优、模型优化、业务验证、模型投产。 4、参与项目的落地开发,作完成模型应用和模型优化。 岗位要求: 1、重点大学硕士及以上学历,统计学、数学、应用数学等数学类相关专业,具备复合专业背景者优先。具有2年以上数据挖掘、数据分析相关工作经验者优先。 2、熟悉常用机器学习、数挖算法及原理,并具备相关项目经验,有金融,保险,快消的业务背景优先。 3、精通SQL,熟练掌握至少一门数据分析编程语言,如:python,熟悉Hadoop、Hive、Spark等大数据处理平台。 4、具备良好的分析问题能力、沟通能力和团队合作能力,具备很强的学习和钻研能力。
-
工作职责: 1、负责对AIoT设备获取的海量用户健康数据进行深度分析和挖掘工作 2、探索适合智慧医疗领域的模型算法,解决智慧AI诊疗的实际问题 3、对海量医疗数据进行深度分析,构建并使用医疗知识图谱,改进业务产品效果 4、与其他各模块的工程师协同完成系统集成和调试工作 职责要求: 1、熟悉典型机器学习算法并有应用模型解决实际问题的经验 2、熟悉CNN/RNN等深度神经网络结构和主流算法,掌握至少一种深度学习框架(PyTorch/TensorFlow等) 3、具备较好编程能力,熟练掌握Python或Matlab等 4、在时序数据挖掘、计算机视觉等领域有丰富经验优先 5、了解信号处理基础知识(FFT、滤波器等)或雷达系统优先
-
职责描述: 1 研究数据挖掘或统计学习领域的前沿技术,针对海量用户行为或者内容信息,构建和优化用户画像以及用户属性 2 基于对用户理解和大量数据特征,参与风控、精准预测、个性化识别等模型建设和领域研究,提升产品效果 3 根据公司需要寻找和采集相关数据,对离线、实时数据进行清洗、甄别、归类和整合,并实现流程自动化 4 关注前沿技术,并在项目中不断推进架构、性能、业务效果的优化 任职要求: 1 硕士及以上学历,计算机、数学、统计学、电子工程、人工智能等相关专业;机器学习、数据挖掘相关方向硕士优先; 2 熟练掌握Python 、C/C++、Java中的一种或多种,具备良好的编程能力、扎实的数据结构和算法基础;熟悉sql、Hadoop、hive等工具者优先; 3 良好的逻辑思维能力、数据灵敏度,优秀的分析和解决问题的能力,对挑战性问题充满激情; 4 良好的团队合作精神,较强的沟通能力
-
【岗位描述】 1. 利用深度学习和机器学习算法,针对电信业经营、管理场景,进行机器学习、AI因果推理以及模型可解释的模型开发优化; 2. 利用NLP技术,针对意图识别、人机对话、特征提取等场景,在企业经营管理页面上实现智能推荐、智能问答; 3. 规范化机器学习需求的开发流程,针对实际业务需求,基于海量数据结合业务场景,快速完成调研、模型开发与评估; 4. 跟踪业界前沿技术的发展,探索深度学习等前沿技术在企业智能场景下的应用前景。 【岗位要求】 1. 数学类、计算机科学或相关专业的硕士及以上学历,2年以上深度学习以及自然语言处理经验; 2. 扎实的数据结构和编程基础,至少精通一种编程语言,如Python,Java,SCALA等; 3. 熟悉深度学习(如DNN、CNN、RNN、LSTM、Bert等)以及常见机器学习算法(LR、SVM、xgboost、贝叶斯等)的原理与算法,并有相关算法的实践经验; 4. 熟悉TensorFlow、Pytorch、nltk其中一种深度学习框架; 5. 良好的英语阅读能力,有强烈求知欲,关注业界前沿技术和人工智能相关的学术研究动态; 6. 加分项:熟练掌握海量数据处理技术,有使用Hadoop/Hive/Spark分析海量数据的能力和经验
-
【职责描述】 1. 机器学习、运筹学领域的研发工作,包括但不限于数据降维、特征提取、分类聚类、线性/非线性回归,整数规划等; 2. 时间序列数据的分析和预测相关工作; 3. 电力交易的策略研究和回测系统的研发; 4. 参与发电、售电公司的报价交易。 【任职要求】 1. 本科生及以上学历,数学、统计学、计算机等相关专业,年龄不超过28岁; 2. 1年 / 3年以上相关工作经验,熟练使用常用算法和数据结构,熟悉python; 3. 熟练掌握经典机器学习算法,对时间序列预测算法有深入研究者优先; 4. 具有良好的语言表达和沟通能力,富有进取心,能承受一定的工作压力。