-
职位职责: 1、负责机器学习系统资源调度的设计和开发,支持火山方舟大模型平台和机器学习平台的产品业务; 2、负责多机房、多集群环境下的,各种异构计算(GPU、CPU、其他异构硬件)、存储(各种云存储)、网络(VPC、RDMA)等资源的最优化编排调度,在严格的多租隔离环境下,支持各种离线训练、在线推理等负载场景的调度需求,并实现整体资源的合理化、最大化利用。 职位要求: 1、熟练掌握Linux环境下的Go/Java/Python等1-2种语言; 2、具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯; 3、熟悉至少一种主流的机器学习框架(TensorFlow / PyTorch 或其他自研框架); 4、熟悉 Kubernetes 架构和生态,熟悉 Docker/Containerd/Kata 等容器技术,有丰富的云原生机器学习系统实践和开发经验; 5、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护; 6、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分; 7、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动; 8、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。 加分项: 1、有大规模集群在离线资源调度相关工作的实践经验,对K8S/Volcano/Yarn/Mesos等一到多个开源项目的调度实现有源码级的理解,熟悉容器化、轻量级虚拟机等相关技术; 2、熟悉常见调度算法,对多租户Quota治理、抢占、弹性、碎片、潮汐、混部、QoS等一到多个调度问题有深入理解和实践经验,具备较强的解决复杂问题的分析和建模能力,有GPU相关调度经验; 3、有以下某一方向领域的经验:CUDA,RDMA,AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture (GPU, Accelerators, Networking),ML for System,Distributed Storage。
-
职位职责: 1、负责机器学习系统推理架构和产品的设计开发,支持火山方舟大模型平台和机器学习平台的产品业务; 2、负责深度模型推理任务为核心的在线架构设计与优化,充分利用各种异构计算(GPU、CPU、其他异构硬件)、存储(各种云存储)、网络(VPC、RDMA)等资源,构建多租环境下的稳定性、观测体系,实现高并发、高吞吐的大规模在线系统; 3、负责推理系统的产品化落地,打造稳定、可观测、体验一流的公有云推理平台。 职位要求: 1、熟练掌握Linux环境下的Go/Java/Python等1-2种语言; 2、具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯; 3、熟悉至少一种主流的机器学习框架(TensorFlow / PyTorch 或其他自研框架); 4、熟悉 Kubernetes 架构和生态,有丰富的云原生机器学习系统实践和开发经验,对在线服务治理、 部署架构有深入理解和落地经验; 5、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护; 6、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分; 7、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动; 8、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。 加分项: 1、有在线GPU推理系统的工程架构落地经验,熟悉常见的在线推理优化手段(Batch、量化、分布式推理等),熟悉GPU、大模型相关软硬件技术栈; 2、熟悉公有云推理产品架构,对该领域用户画像和用户故事有深入理解,有打造***产品的热情; 3、有以下某一方向领域的经验:CUDA,RDMA,AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture (GPU, Accelerators, Networking),ML for System,Distributed Storage。
-
职位介绍: 系统工程师(数据方向)将负责搭建和维护数仓及集群,根据需求提供产品和技术服务, 为上海迪士尼度假区提供各种系统及业务支持。您将管理日志管理平台和系统大数据平台,负责准实时和非实时的报表开发和数据分析。 工作内容: 1、负责数据仓库相关业务的数据统计分析; 2、负责数据仓库应用产品设计、开发、维护工作; 3、负责大数据集群资源管理、性能优化和故障处理和监控. 我们希望您: 1、有本科及以上学历,3年以上数仓相关工作经验,计算机及相关专业优先; 2、对 Flink,Spark,Kafka等流、批式计算框架有深入理解,在 Flink实时计算方向有项目经验优先; 3、熟悉各种大数据组件,如Hadoop、Hive、HDFS、Hbase、Kafka、Hudi,愿意从事大数据平台开发工作和维护; 4、熟悉分布式、高并发、高稳定性、海量数据的系统特点和技术方案; 5、熟悉Sql语法,有扎实的编程基础,至少熟悉python或java一种编程语言; 6、对于新技术、新应用有浓烈的兴趣,敢于承接挑战并有较强的责任心。 关于上海迪士尼度假区: 作为全球家庭娱乐业的领军企业之一,上海迪士尼度假区为我们的游客带来独具一格的服务和珍藏一生的记忆。加入我们,在这个充满奇幻、想像、创意和探险的全新世界里,为每年数以百万的度假区游客创造欢乐。无论您的迪士尼旅程走向台前还是幕后,您都拥有无限机遇。 * 我们致力于提供平等的就业机会,欢迎残障人士申请职位。 * 具体的福利基于职位有所不同,可能根据公司政策进行调整。 * 上海迪士尼度假区不会委托任何人或第三方机构向求职者收取费用。候选人请务必通过度假区官方招聘渠道获取度假区招聘的相关资讯。
-
职位描述 1.学习并掌握复杂系统的功能、逻辑及物理域建模方法; 2.配合领域专家,完成复杂系统的架构和详细设计; 3.软件代码编写、修改与调试; 4. 配合产品部门,完成系统设计中的需求分析和测试工作。 职位要求 1.理工科本科及以上学历,****(本科)为985/211院校,应用数学、自动化、飞行器设计专业优先; 2. 至少精通一门编程语言(C、C++ 或 Javascript); 3.有 SysML 及 Modelica 经验者优先; 4.高效的学习能力,有志成为最**的系统工程师,优秀者可放宽经验要求。
-
if (your_passions.includes(‘data’)) { switch(your_stacks) { case ‘Python’: case ‘Spark’: case ‘Natural Language Processing’: console.log(‘Join AfterShip’); break; } } 岗位职责 1、负责海外物流相关数据的挖掘; 2、负责海外物流时效预测(Estimated Delivery Date) 相关的算法研发; 3、及时跟踪业界 AIGC 的研究进展,包括但不限于大语言模型、AI Agent 框架、语义理解和检索、多模态理解等技术,探索 AI Agent 方向的算法应用落地和系统研发工作。 岗位要求 1、本科及以上学历,4 年或以上算法工作经验,数学、 统计学、计算机、数据挖掘、机器学习等相关专业优先; 2、具备扎实的机器学习/深度学习和自然语言处理的基础理论能力,熟悉 Transformer、BERT 等常用算法,了解大语言模型和 AI Agent 相关的理论基础和常见框架; 3、熟练掌握 Python/ Scala/Java 等至少一种编程语言,熟悉 Hadoop、Spark 等实时和离线数据处理工具,熟练掌握 Tensorflow/Pytorch 等至少一种深度学习框架; 4、有丰富的算法落地经验,具有较强的 AI 应用整体方案设计能力; 5、具备较好的数据敏锐度,具有缜密的逻辑思维能力、业务洞察能力、沟通表达和抗压能力。 加分项 1、有英语听说能力,以及海外电商、物流、SaaS 服务工作经验优先; 2、具备开发能力,有使用 Docker、Kubernetes、AWS 或 GCP 云计算经验; 3、有写 Blog 的习惯,活跃技术社区,参与开源项目等; 4、有代码洁癖,对代码精益求精,对技术有极客热情。 为什么加入我们 1、朝阳行业:国际电商 SaaS 服务赛道,国际一线投资机构加持; 2、稳健发展:团队稳健扩张,业务规模及营收每年持续稳健增长; 3、多元文化:团队来自全球 20 多个不同城市,国际化视角、扁平化管理; 4、极客氛围:拥抱开源技术,实践敏捷开发,崇尚通过工具和自动化来解决问题; 5、特色福利:学习基金、 一对一帮带、内部商城、提供 MacBook 及可升降办公桌。
-
岗位职责: -结合电商的业务特性,进行模型和算法创新,打造业行领先的机器学习/深度学习算法平台能力。 -超大规模的机器学习模型优化,包括但不限于深度学习、强化学习、表征学习等,最大效率地提升电商流量效率。 岗位要求: -计算机及相关专业,具有扎实的算法和数据结构,优秀的问题理解能力和编码能力。 -扎实的机器学习理论基础,具有行业常用的机器学习算法实践经验。 -熟悉业界主流的机器学习平台,有大规模机器学习平台的研发经验者优先,有Tensorflow/PyTorch等机器学习框架使用经验者优先。 -具有电商相关业务的算法实践经验者优先,包括但不限于推荐、广告、搜索等。 -良好的团队合作和协调沟通能力,学习能力强,自我驱动力强。
-
岗位职责: 1、结合电商的业务特性,进行模型和算法创新,打造业行领先的机器学习/深度学习算法平台能力。 2、超大规模的机器学习模型优化,包括但不限于深度学习、强化学习、表征学习等,最大效率地提升电商流量效率。 岗位要求: 1、计算机及相关专业,具有扎实的算法和数据结构,优秀的问题理解能力和编码能力。 2、扎实的机器学习理论基础,具有行业常用的机器学习算法实践经验。 3、熟悉业界主流的机器学习平台,有大规模机器学习平台的研发经验者优先,有Tensorflow/PyTorch等机器学习框架使用经验者优先。 4、具有电商相关业务的算法实践经验者优先,包括但不限于推荐、广告、搜索等。 5、良好的团队合作和协调沟通能力,学习能力强,自我驱动力强。
-
职位描述 1、负责贝壳一站式机器学习平台的设计研发与迭代改进,为业务提供稳定易用、高性能、高性价比的解决方案; 2、业内机器学习系统与平台前沿技术进展跟进与调研、落地; 3、参与模型训练,模型服务,模型管理,资源调度等机器学习相关问题的开发。 任职要求 1、计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种; 2、参与过大规模分布式系统的开发和维护; 3、良好的沟通能力和团队协作精神,严谨的工作态度与高质量意识 ; 4、善于学习新的知识,动手能力强,有进取心。 加分项: 1、有CUDA C/C++编程经验,有GPU并行计算编程基础(NCCL)经验优先; 2、了解分布式系统、容器相关领域技术,熟悉Kubernetes/docker等优先; 3、熟悉机器学习框架(Tensorflow/Pytorch/Jax)优先。
-
岗位职责 "1、负责公有云应用架构的规划及设计; 2、负责公有云SaaS服务的技术调研、选型及推广应用; 3、负责公有云IAM账号权限设计和分配管理; 4、负责公有云成本管理、资源管理、成本化化; 5、负责公有云各SaaS服务的监控、告警及日志等; 6、配合业务工程师完成业务上云、资源分配、账号分配等工作; 7、参与日常项目工作,负责业务上云前期规划、选型和配合工作;" 任职要求 "1、具有AWS、GCP、Azure等公有云应用经验(非简单EC2应用); 2、能熟练使用Terrform、AWS CloudFormation、Ansible等工具,并有应用经验; 3、熟悉公有云网络,有规划VPC、VGW、NAT网关、VPN、对等连接等相关经验,有混合云连接经验; 4、熟悉公有云Container服务,如AWS EKS、GCP GKE等,能快速跟据需求调度集群; 5、熟悉公有云负载均衡服务,如AWS ELB、GCP CLB等,能够基于业务需求快速配置相应实例; 6、熟悉AWS Route 53、GCP Cloud DNS等服务; 7、熟悉常用的CDN服务,如CloudFront、Cloud CDN、Cloudflare、Akamai等; 8、具有将日常工作工程化的能力优先; 9、主动学习能力强、较好的问题分析与解决能力、抗压性强,良好的沟通协调能力和团队合作精神。"
-
工作职责: 1. 负责贝壳经纪核心业务方向的开发和优化; 2. 负责关键模块的技术选型、开发和改进; 3. 负责移动端的性能优化、技术攻关、疑难问题解决等; 4. 负责新技术探索、业务落地,如Flutter、鸿蒙应用开发等。 任职资格: 1. 2年以上Android/iOS开发经验,有一定源码阅读经验,熟悉Framework以及底层原理和关键细节; 2. 熟悉Android/iOS UI开发,对UI架构有理解; 3. 具有一定的架构设计能力,能够很好的进行模块设计; 4. 有激情,有情怀,学习能力强,有强烈的责任心和团队精神,善于沟通和合作; 5. 有中大型项目架构设计或者重构经验者优先; 6. 熟悉鸿蒙、Flutter等跨平台技术开发者优先; 7. 有稳定性、流畅度、包Size、内存、网络调优等性能优化经验者优先。
-
1、负责国家域名平台各类系统软硬件的建设升级与维护; 2、云计算平台建设管理与维护; 3、运维监控和系统管理工具的研发和改进; 4、域名平台的7x24小时监控管理。
-
工作职责 : 1. 运用机器学习相关技术,对海量数据进行处理和分析,挖掘相关信息,分析关键因素,进行标签体系建立、模型开发、模型优化、算法评估等工作,以提升业务智能化为目标,助力保险业数字化转型; 2. 负责决策相关模型的设计、开发与上线效果分析等,包括但不限于理赔模型、风险模型、用户增长模型等; 3. 负责对模型相关的数据进行分析,包括数据清洗、数据挖掘、特征工程、数据建模等,以提高业务智能化的准确性与效率; 4. 通过对数据的敏锐洞察,深入挖掘业务场景的潜在价值和业务需求,通过技术创新推动业务智能化的提升; 5. 跟进机器学习相关技术的业界发展,并合理运用到实际业务场景中; 任职资格 : 1. 计算机、数学、统计学及电子信息相关专业硕士及以上学历,3年及以上工作经验; 2. 在经典机器学习、深度学习、自然语言处理或运筹优化等一个或多个领域有扎实理论基础或丰富研发经验,曾在广告推荐、营销转化、用户增长等某一领域有相关工作经验者优先; 3. 熟悉Java/Python/C++中的一种或多种编程语言,熟悉大数据处理技术(Hadoop/Spark/Hive),善于学习和应用业界领先数据架构和技术处理实际策略类问题; 4. 良好的逻辑思维能力,在复杂业务场景下能够分解和抽象问题,提供优秀、完整、可行的解决方案; 5. 对解决具体挑战性问题充满激情,较强的责任心和主动性,良好的沟通协作和抗压能力。
-
工作职责: 工作职责 参与公司招聘平台的NLP文本数据及用户行为数据的挖掘工作,包括知识图谱、query理解、用户画像、智能问答、文本分类等方向的算法研发;并且持续探索大模型技术在产业应用中的落地 1. 参与招聘领域知识图谱的算法策略研发,包括海量数据挖掘、实体和实体关系抽取、新词发现等,构建招聘领域行业化标签体系、知识图谱等,支撑业务策略衍化及产品迭代; 2. 参与招聘领域文本分类、岗位识别等基础NLP算法的研发工作,提升平台信息内容的结构化水平,辅助平台生态建设 3. 参与平台内用户画像的构建研发,基于海量的用户行为数据,对用户进行建模,优化画像模型效果,精准刻画用户偏好 4. 参与平台内搜索体系的优化构建,负责搜索引擎的文本语义分析和内容理解处理工作,包括但不限于query的解析、联想、纠错等。 5. 紧跟大模型技术的发展步伐,探索招聘领域中大模型的应用落地,承担大模型预训练和调优等工作,如prompt设计、fine-tuning、模型蒸馏等,实现标题/亮点自动提取生成、职位自动生成、简历文本组织优化等技术,并应用于招聘业务实现部分环节的智能化,提高业务效率。 任职资格: 任职资格 1. 计算机、数学等相关专业本科以上学历; 2. 两年以上自然语言处理相关方向研发经验; 3. 对自然语言处理技术体系和应用场景有深刻的理解,熟悉自然语言处理、深度学习领域开源的算法和工具包; 4. 熟悉主流的文本生成算法的原理,有结合业务的探索经验以及常见的大模型落地实践经验的优先; 5. 熟练掌握TensorFlow、pytorch等深度学习框架、有较强的算法复现能力;熟悉Linux平台编程环境,精通Java/C/C++/Python/Scala语言中的一种,具备Hadoop、Spark、Hive等实际工作经验优先 6. 具有优秀的分析和解决实际问题的能力和态度,有创业的激情。
-
plan1956-大规模分布式机器学习系统工程师
[北京·北下关] 2023-07-1770k-80k 经验在校/应届 / 硕士人工智能服务,IT技术服务|咨询 / D轮及以上 / 500-2000人工作职责: 1.设计并实现创新的机器学习解决方案,并将其应用到大规模分布式机器学习系统中。 2.适配最新的机器学习算法与架构,深入主流的机器学习框架,对框架进行调整、改进和优化。 3.研究核心技术突破点,在模型并行、数据-计算结合等方面打造机器学习系统性能与易用性优势。 4.对服务整体稳定性负责,分析并深入发现系统风险点,提高系统服务在各种风险下的容错能力。 任职要求: 1.有比较扎实的计算机理论基础,熟练使用C/C++编程,对数据结构和算法有较为深刻的理解。 2.具有快速学习的能力,有灵活应用开源项目的经验。 3.具备英文文档阅读分析能力,良好的沟通能力和团队协作能力。 4.对技术有执着的追求和热爱,并对新技术持有敏感性并愿意致力于新技术的探索和研究,对解决具有挑战性问题充满激情。 加分项: 1.深入了解业界主流机器学习框架如Pytorch/Tensorflow/Mxnet等中至少一种,社区核心贡献者优先。 2.在异构计算或并行计算系统开发方面有丰富经验,如CUDA,OpenCL,OpenMP,MPI等,并能有效利用这些技术进行高效计算优化。 3.有成熟的大规模分布式机器学习系统设计与实施经验,例如对Megatron-Deepspeed、Colossal-ai等有深入理解和实践。 4.在OSDI/SOSP等**会议或期刊上发表过相关领域的论文。 5.对分布式系统中的容错、一致性、并发性和安全性等问题有深入的理解,并能应用如ZooKeeper、Etcd等工具进行处理。 6.深入了解 YARN、Kubernetes、Hadoop、Spark、Flink、Horovod等系统和生态,在社区有过相关代码贡献者优先。 工作地点:北京、上海、深圳、新加坡; -
工作职责 1.参与主流机器学习框架与摩尔线程软硬件栈的对接,模型优化和部署; 2.参与机器学习单GPU以及分布式训练技术的研究与实现,如各种并行与异构计算技术的设计、开发以及与性能优化; 3.参与研究并实现适合摩尔线程自研GPU的模型优化和压缩方法。 任职资格 1.熟悉Linux开发环境,精通C++和Python,具备良好扎实的算法基础、良好的编程风格和系统设计能力; 2.深入理解典型的深度学习算法(如CV和NLP模型),主流深度框架(如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等)开发或优化经验; 3.或有深度学习编译器(如XLA、TVM、Glow、NGraph)等软件栈的开发经验; 4.精通分布式训练技术,有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑; 5.有机器学习模型性能调优和模型压缩(量化、剪枝、蒸馏、NAS等)经验者可优先考虑; 6.精通并行计算通信库(如MPI),有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑; 7.有强烈的工作责任心,较好的学习能力、沟通能力和自驱力。