-
岗位职责: (1)负责兴业银行分布式应用开发平台的设计和研发,牵头制定行内相关平台的规范指引; (2)深度参与兴业银行超大型分布式应用的建设。 岗位要求: (1)具备5年以上分布式微服务技术相关工作经验; (2)曾负责或者以骨干身份参与分布式应用开发平台研发建设,并具有超大型分布式系统建设经验; (3)研究过SpringCloud、Dubbo、Sofa等分布式开发框架,有源码重构经验优先; (4)熟悉超大型分布式应用建设时所需的关键技术,如单元化、双活/多活、灰度发布、分布式事务、分布式批量调度等; (5)熟悉超大型分布式系统建设时所需的缓存、注册中心、配置中心、日志、全链路监控等组件; (6)具有大型系统应用上云相关经验; (7)具有大型互联网技术中台的研发和架构经验或者银行分布式核心系统建设经验者优先。 工作地点:上海、福州、成都
-
职位职责: 1、负责机器学习系统推理架构和产品的设计开发,支持火山方舟大模型平台和机器学习平台的产品业务; 2、负责深度模型推理任务为核心的在线架构设计与优化,充分利用各种异构计算(GPU、CPU、其他异构硬件)、存储(各种云存储)、网络(VPC、RDMA)等资源,构建多租环境下的稳定性、观测体系,实现高并发、高吞吐的大规模在线系统; 3、负责推理系统的产品化落地,打造稳定、可观测、体验一流的公有云推理平台。 职位要求: 1、熟练掌握Linux环境下的Go/Java/Python等1-2种语言; 2、具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯; 3、熟悉至少一种主流的机器学习框架(TensorFlow / PyTorch 或其他自研框架); 4、熟悉 Kubernetes 架构和生态,有丰富的云原生机器学习系统实践和开发经验,对在线服务治理、 部署架构有深入理解和落地经验; 5、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护; 6、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分; 7、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动; 8、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。 加分项: 1、有在线GPU推理系统的工程架构落地经验,熟悉常见的在线推理优化手段(Batch、量化、分布式推理等),熟悉GPU、大模型相关软硬件技术栈; 2、熟悉公有云推理产品架构,对该领域用户画像和用户故事有深入理解,有打造***产品的热情; 3、有以下某一方向领域的经验:CUDA,RDMA,AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture (GPU, Accelerators, Networking),ML for System,Distributed Storage。
-
职位职责: 1、参与面向企业服务的大规模分布式存储产品的设计和开发,打造业界先进的标准化产品; 2、持续优化系统稳定性、性能、成本、可用性、可扩展性、可维护性等; 3、深入理解业务场景的存储需求,针对性的为不同业务场景提供最合适的存储方案。 职位要求: 1、熟悉分布式存储系统的实现原理,具有相关工作经验; 2、熟悉C/C++/Go/Python中至少一种,对工程质量有很高的自我要求; 3、对分布式存储的一致性、可靠性、高性能、成本优化等方向有深入理解; 4、熟悉对象存储、块存储、文件存储中的一种或多种者优先; 5、对技术有强烈的进取心,具有良好的沟通能力和团队合作精神、优秀的分析问题和解决问题的能力优先。
-
【岗位职责】 1、负责大规模服务发现集群设计和开发,满足服务发现核心分布式组件设计、研发、维护,要求在高可靠、高可用、高性能低延时上追求极致; 2、负责多az多活部署方案的实现,提高集群整体的高可用性,提高容灾能力; 3、负责跟进相关技术领域的发展,推动软件架构的相应演进升级。 【岗位要求】 1、3年以上大型分布式注册中心系统设计与开发经验,5年以上大型分布式系统架构设计和开发经验; 2、熟悉etcd和consul,并有二次开发能力; 3、有丰富的大规模分布式系统架构设计与开发经验,熟悉CAP理论、Paxos/Raft算法等; 4、具备优秀的沟通能力和团队协作精神。
-
岗位职责: (1)负责兴业银行分布式应用开发平台的设计、研发、维护工作,参与兴业银行研发规范制定、故障排查、平台安全加固等工作; (2)参与兴业银行重要系统、关键技术能力的建设。 岗位要求: (1)3年以上丰富的工程实践经验;深入理解常见系统架构模型,具备大规模分布式系统建设经验; (2)熟悉SpringCloud、SOFA、ServiceComb、Dubbo等分布式开发框架,具备源码项目实践经验; (3)深入研究过Netty、JVM内部运行机制,具备丰富的故障定位能力; (4)具备应用网关、分布式事务、批量作业、分布式锁、分库分表、分布式id、服务编排等分布式关键技术解决方案设计和实现能力; (5)了解大规模分布式系统关键技术能力,如系统单元化、双活/多活、全链路灰度发布等; (6)在复杂系统架构和功能实现场景中,具备技术抽象能力,能够提取通用技术组件并不断持续优化。 符合以下一项或多项条件者优先: (1)曾负责或深度参与大中型金融或互联网企业的开发平台建设者; (2)曾负责或深度参与大中型金融核心系统相关建设者; (3)对ServiceMesh落地、云原生相关技术、Go语言熟练使用相关经验者; (4)具有大型互联网技术及中台的研发和架构经验优先; (5)对技术有追求,对知名开源组件有重要贡献或在开源社区有相关优秀作品者。 工作地点:上海、福州、成都
-
职位介绍: 系统工程师(数据方向)将负责搭建和维护数仓及集群,根据需求提供产品和技术服务, 为上海迪士尼度假区提供各种系统及业务支持。您将管理日志管理平台和系统大数据平台,负责准实时和非实时的报表开发和数据分析。 工作内容: 1、负责数据仓库相关业务的数据统计分析; 2、负责数据仓库应用产品设计、开发、维护工作; 3、负责大数据集群资源管理、性能优化和故障处理和监控. 我们希望您: 1、有本科及以上学历,3年以上数仓相关工作经验,计算机及相关专业优先; 2、对 Flink,Spark,Kafka等流、批式计算框架有深入理解,在 Flink实时计算方向有项目经验优先; 3、熟悉各种大数据组件,如Hadoop、Hive、HDFS、Hbase、Kafka、Hudi,愿意从事大数据平台开发工作和维护; 4、熟悉分布式、高并发、高稳定性、海量数据的系统特点和技术方案; 5、熟悉Sql语法,有扎实的编程基础,至少熟悉python或java一种编程语言; 6、对于新技术、新应用有浓烈的兴趣,敢于承接挑战并有较强的责任心。 关于上海迪士尼度假区: 作为全球家庭娱乐业的领军企业之一,上海迪士尼度假区为我们的游客带来独具一格的服务和珍藏一生的记忆。加入我们,在这个充满奇幻、想像、创意和探险的全新世界里,为每年数以百万的度假区游客创造欢乐。无论您的迪士尼旅程走向台前还是幕后,您都拥有无限机遇。 * 我们致力于提供平等的就业机会,欢迎残障人士申请职位。 * 具体的福利基于职位有所不同,可能根据公司政策进行调整。 * 上海迪士尼度假区不会委托任何人或第三方机构向求职者收取费用。候选人请务必通过度假区官方招聘渠道获取度假区招聘的相关资讯。
-
工作职责 1、参与平安云分布式存储建设工作,保证生产系统稳定运行; 2、熟悉常见的云存储产品功能、特点,参与云存储产品规划,思考并提出建议; 3、参与云存储系统核心功能的设计、开发工作; 4、保证云存储生产运行中的系统稳定运行,了解其运行情况,对问题及时进行诊断及解决; 5、与关联系统团队保持良好沟通及协作,保证各项工作稳定开展。 任职要求 1、熟悉Linux环境编程, 具有3年以上的后台开发经验 ; 2、掌握基础网络协议(TCP、HTTP等)知识,熟悉网络编程和网络服务框架等; 3、具有扎实的编程基础,熟练掌握至少一门语言c/c++/python/go/java,如无go语言经验,愿意转go; 4、追求高品质代码,对工程质量有深刻认识, 注重模块化、单元测试、异常测试; 5、熟练掌握常用数据结构和算法,熟悉多线程编程技术,熟悉分布式协议(如Paxos/Raft/Zab等) ; 6、有较强的学习能力,有强烈的求知欲和进取心,能及时关注和学习业界最新技术。 满足以下条件者优先: 1、有大规模对象、文件、块存储或数据库等项目相关经验; 2、有Ceph开发运维经验; 3、熟悉以下任一开源存储系统源码:beegfs、ZFS、TiKV,Redis、HDFS、LevelDB、RocksDB、Mysql、MongoDB等; 4、熟悉Linux下 I/O协议栈; 5、具有内核,操作系统相关开发经验。
-
工作职责 1.与工厂及总部IT部门沟通协调,共同治理标准化农务数据; 2. 根据农务的需求,与总部IT共同准备BI数据,并负责相关农务报表的开发; 3.参与农务数转项目的规划与实施; 4.参与总部IT对农务数转项目的落地; 5.参与农务系统的需求分析、调研、开发、测试、部署; 6.组织协调相关部门协商制定应用软件培训计划,并组织实施培训; 7.维护农务系统的各类业务; 8.根据农务的各类需求,对生态服务系统提供各类技术支持或协助宣导工作; 9.收集了解并评估糖业、涉农的先进技术、系统、方案,并推动引入成熟优秀的技术方案; 10.及时完成上级领导交办的其它工作任务。 任职资格 1、本科及以上学历;计算机类专业。 2、二年以上相关工作经验。 工作地址:崇左市扶绥县、江州区、宁明县
-
工作职责: 1. 负责贝壳经纪核心业务方向的开发和优化; 2. 负责关键模块的技术选型、开发和改进; 3. 负责移动端的性能优化、技术攻关、疑难问题解决等; 4. 负责新技术探索、业务落地,如Flutter、鸿蒙应用开发等。 任职资格: 1. 2年以上Android/iOS开发经验,有一定源码阅读经验,熟悉Framework以及底层原理和关键细节; 2. 熟悉Android/iOS UI开发,对UI架构有理解; 3. 具有一定的架构设计能力,能够很好的进行模块设计; 4. 有激情,有情怀,学习能力强,有强烈的责任心和团队精神,善于沟通和合作; 5. 有中大型项目架构设计或者重构经验者优先; 6. 熟悉鸿蒙、Flutter等跨平台技术开发者优先; 7. 有稳定性、流畅度、包Size、内存、网络调优等性能优化经验者优先。
-
岗位职责 "1、负责公有云应用架构的规划及设计; 2、负责公有云SaaS服务的技术调研、选型及推广应用; 3、负责公有云IAM账号权限设计和分配管理; 4、负责公有云成本管理、资源管理、成本化化; 5、负责公有云各SaaS服务的监控、告警及日志等; 6、配合业务工程师完成业务上云、资源分配、账号分配等工作; 7、参与日常项目工作,负责业务上云前期规划、选型和配合工作;" 任职要求 "1、具有AWS、GCP、Azure等公有云应用经验(非简单EC2应用); 2、能熟练使用Terrform、AWS CloudFormation、Ansible等工具,并有应用经验; 3、熟悉公有云网络,有规划VPC、VGW、NAT网关、VPN、对等连接等相关经验,有混合云连接经验; 4、熟悉公有云Container服务,如AWS EKS、GCP GKE等,能快速跟据需求调度集群; 5、熟悉公有云负载均衡服务,如AWS ELB、GCP CLB等,能够基于业务需求快速配置相应实例; 6、熟悉AWS Route 53、GCP Cloud DNS等服务; 7、熟悉常用的CDN服务,如CloudFront、Cloud CDN、Cloudflare、Akamai等; 8、具有将日常工作工程化的能力优先; 9、主动学习能力强、较好的问题分析与解决能力、抗压性强,良好的沟通协调能力和团队合作精神。"
-
工作职责: 1. 负责贝壳经纪核心业务方向的开发和优化; 2. 负责关键模块的技术选型、开发和改进; 3. 负责移动端的性能优化、技术攻关、疑难问题解决等; 4. 负责新技术探索、业务落地,如Flutter、鸿蒙应用开发等。 任职资格: 1. 2年以上Android/iOS开发经验,有一定源码阅读经验,熟悉Framework以及底层原理和关键细节; 2. 熟悉Android/iOS UI开发,对UI架构有理解; 3. 具有一定的架构设计能力,能够很好的进行模块设计; 4. 有激情,有情怀,学习能力强,有强烈的责任心和团队精神,善于沟通和合作; 5. 有中大型项目架构设计或者重构经验者优先; 6. 熟悉鸿蒙、Flutter等跨平台技术开发者优先; 7. 有稳定性、流畅度、包Size、内存、网络调优等性能优化经验者优先。
-
注意:1月份招聘初级、中级工程师各一位,请注明应聘职位。未注明应聘职位级别概不回复,见谅 岗位优势: 1、只要踏实、肯学、肯干,在我们这里工作两年学到的知识,比红帽认证工程师RHCE+网络认证工程师学到的知识更系统、更有实战经验! 2、能独立保质保量地完成工作任务时,可以不坐班,远程在家支持,甚至可以不长期在北京。欢迎各地(尤其是省会城市)的小伙伴投递简历 工作内容: 1、通过微信和受理客户的售后技术问题,按指导手册为客户解决问题; 2、在公司完成业务系统的预安装和打包发货工作; 3、出差至现场安装、或在影城配合下远程安装、配置相关的业务系统; 4、为客户进行远程业务系统使用培训; 5、完成主管交办的其他工作; 薪资待遇: 1、基本工资:初级工程师4K、中级工程师6K、高级工程师8K; 2、每月补贴:转正员工每月有500元餐补和1500元租房补贴,随当月工资发放; 3、季度业绩奖:月工资*15%考核分数(百分制)/100,每个季度最后一个月随工资发放; 4、有五险一金; 任职要求 符合以下条件的优先录取: 1、了解Redhat/CentOS的常用操作命令,有实际工作经验的优先录取; 2、能接受出差、能接受熬夜(部分项目需要等影城放映结束后才能干)是必要条件。非项目实施周期的技术支持相对轻松 3、具备一定的交换、路由的基础知识,有网络抓包和分析经验的优先录取! 4、具备良好的团队合作精神,有较强的沟通、协调能力和学习能力,为人正直,学习能力强,肯吃苦,能熬夜! 5、有影城放映管理工作者、有电工证的小伙伴优先录取;
-
一、缓存方向: 【岗位职责】 1.负责设计和实现分布式通用KV系统,满足SHEIN场景的大并发、低延迟和低成本要求。技术上在高并发,低延迟和高可用上追求极致; 2.参与电商系统的架构设计,提出合理的缓存方案和应用策略并落地; 3.负责双机房互为主备,多机房单元化等不同部署方案的实现,提高集群整体的高可用性,提高容灾能力; 4.负责跟进新硬件和相关技术领域的发展,推动软件架构的相应演进升级。 【岗位要求】 1.3年以上大型分布式系统或高性能缓存服务的设计与研发经验; 2.熟悉redis/memcached/levelDB/rocksDB的一项或多项,并有二次开发能力; 3.有丰富的大规模分布式集群开发经验,熟悉CAP理论、Paxos/Raft算法等; 具备优秀的沟通能力和团队协作精神。 二、检索服务方向: 【岗位描述】 1.负责电商搜索数据库架构设计,打造高性能、高可用、可扩展的架构,支撑业务快速发展; 2.负责高并发搜索引擎的全链路架构,优化搜索引擎的计算和存储性能; 3.负责系统规划和建设,并推动在搜索、核心业务复杂搜索场景落地。 【岗位要求】 1. 熟练掌握Java/C++等开发语言,有系统级性能调优经验; 2. 熟悉Redis/HBase/MongoDB/ElasticSearch/Spark/Flink等,具有任一框架优化经验者更佳; 3. 有良好的可靠性意识,包括不限于监控、容灾等。 4. 加分项: 对搜索业务/ 推荐业务/电商业务有深入了解。 三、消息方向: 【岗位描述】 1.负责SHEIN中间件消息队列产品的系统建设,架构设计,方案规划和需求落地工作; 2.根据业务要求,完成中间件消息队列产品的迭代实施和产品优化工作; 3.指导消息队列中间件产品在业务场景下的技术落地和落地实施工作; 【岗位要求】 1.熟悉开源消息队列Kafka/Pulsar/RocketMQ/RabbitMQ等,有相关开发经验者优先; 2.熟悉CAP理论、Paxos/Raft算法、高可用架构、分布式事务等,有一定实践经验者优先; 3.有MQ开源社区相关贡献或工作经验者优先; 4.了解或熟悉一种分布式流计算框架的应用场景和关键技术,例如Spark/Flink/Kafka Streams/Apache Samza等,有相关研发经验者优先; 5.有技术热情和较强的学习能力,有良好的分析解决问题和技术攻关能力。
-
岗位职责: 1.负责组织和规划公司内部IT系统。 2.负责组织IT系统的日常管理和维护,事件响应和处理,制定并执行相应的解决方案和实施计划。 3.负责组织公司IT系统相关虚拟化操作系统安装、配置、调优及故障排查。 4.负责IT系统的备份和恢复策略的制定和执行,确保数据的可靠性和完整性。 5.负责公司IT系统相关标准化建设,推进自动化运维及监控工具的使用。 任职要求: 1. 具有良好的职业道德及品行操守,诚实守信,无违法违纪违规行为和不良信用记录。 2. 本科及以上学历,计算机相关专业,3年以上系统运维经验。 3. 熟悉Windows、Linux系统配置、维护和相关常用工具。 4. 熟悉开源监控软件(Prometheus、Zabbix、Nagios等)搭建和使用,有私有云平台运维经验。 5. 熟悉Shell、Python等编程语言,具有脚本编写能力。 6. 熟悉常用中间的配置和维护,例如Nginx、Redis、Kafka、RocketMQ等。 7. 了解常用数据库(Oracle、Mysql、SQL Server等)的配置和维护。 8. 具有信创系统维护经验者优先考虑。
-
plan1956-大规模分布式机器学习系统工程师
[北京·北下关] 2023-07-1770k-80k 经验在校/应届 / 硕士人工智能服务,IT技术服务|咨询 / D轮及以上 / 500-2000人工作职责: 1.设计并实现创新的机器学习解决方案,并将其应用到大规模分布式机器学习系统中。 2.适配最新的机器学习算法与架构,深入主流的机器学习框架,对框架进行调整、改进和优化。 3.研究核心技术突破点,在模型并行、数据-计算结合等方面打造机器学习系统性能与易用性优势。 4.对服务整体稳定性负责,分析并深入发现系统风险点,提高系统服务在各种风险下的容错能力。 任职要求: 1.有比较扎实的计算机理论基础,熟练使用C/C++编程,对数据结构和算法有较为深刻的理解。 2.具有快速学习的能力,有灵活应用开源项目的经验。 3.具备英文文档阅读分析能力,良好的沟通能力和团队协作能力。 4.对技术有执着的追求和热爱,并对新技术持有敏感性并愿意致力于新技术的探索和研究,对解决具有挑战性问题充满激情。 加分项: 1.深入了解业界主流机器学习框架如Pytorch/Tensorflow/Mxnet等中至少一种,社区核心贡献者优先。 2.在异构计算或并行计算系统开发方面有丰富经验,如CUDA,OpenCL,OpenMP,MPI等,并能有效利用这些技术进行高效计算优化。 3.有成熟的大规模分布式机器学习系统设计与实施经验,例如对Megatron-Deepspeed、Colossal-ai等有深入理解和实践。 4.在OSDI/SOSP等**会议或期刊上发表过相关领域的论文。 5.对分布式系统中的容错、一致性、并发性和安全性等问题有深入的理解,并能应用如ZooKeeper、Etcd等工具进行处理。 6.深入了解 YARN、Kubernetes、Hadoop、Spark、Flink、Horovod等系统和生态,在社区有过相关代码贡献者优先。 工作地点:北京、上海、深圳、新加坡;