-
团队介绍: 构建基于 Kubernetes 的机器学习平台 OpenBayes 提供从数据标注到模型部署的全流程服务。致力于不断降低机器学习体系的使用门槛,加速从原始数据到最终应用的转化。 职位介绍: 针对机器学习场景,围绕 Kubernetes 生态构建支撑组件,应用场景包括线上 JupyterLab 的编排 CRD、线上服务 CRD、跨节点机器学习任务 CRD 等。 职位职责: 1.平台已有的 CRD / Controller / Operator 的维护; 2.对 Kubernetes 的组件做扩展,实现特定的调度策略,支持不同硬件的调度流程; 3.按照业务需求构建 extended resource 实现异构计算资源的调度; 4.其他组件构建与维护。 职位要求: 1.本科及以上学历; 2.熟练应用 Go/Python/Java 等编程语言之一或多个,Go 语言最佳; 3.有一定的 Kubernetes 开发经验,了解其底层原理; 4.计算机基础扎实,有基本的算法和数据结构基础知识; 5.自主学习能力强,有意愿接受新技术并进入新领域,有良好的沟通能力和团队协作能力。 加分项: 1.了解并使用过基于 k8s 的机器学习训练框架 kubeflow 或其他; 2.对分布式系统管理有实践经验,对该领域有很大的热情; 3.了解云原生体系,对其生态有所了解。
-
50k-70k·14薪 经验5-10年 / 本科电商平台 / C轮 / 2000人以上岗位职责: 1、为集群的资源利用率负责,设计并实现高效的Kubernetes资源管理策略,确保集群资源的最优利用。 2、协调跨部门团队(包括开发、运维和产品团队)合作,确保资源优化策略的顺利实施。 3、持续评估新兴的容器技术和工具,以进一步提升集群的性能和资源利用率。 4、编制开发与操作文档,提供技术指导和培训,帮助团队成员掌握资源优化的最佳实践。 岗位要求: 1、计算机科学或相关专业的本科及以上学位。 2、至少5年以上使用Kubernetes的生产环境经验。 3、深入理解Kubernetes架构、配置和管理,以及在大规模环境中进行故障排除的经验。 4、精通HPA、CA等Kubernetes资源管理组件。 5、有使用服务画像及相关监控工具(如Prometheus、Grafana等)的实践经验。 6、熟悉云服务平台(AWS、Google Cloud Platform、Azure等)的运作。 7、对容器化和微服务架构有深刻理解,并有相关的优化经验。 8、具备优秀的跨团队沟通能力和项目管理能力。 9、具备自我驱动、学习能力,并能适应快节奏的环境。
-
岗位职责: 1. 负责基于公有云的大数据架构、开发、优化工作; 2. 负责Kubernetes operator,cluster autoscaler等基础组件开发和优化工作; 任职要求: 1. 熟悉Java或者GO,2年以上经验; 2. 具备大数据 on Kubernetes 落地实践经验,熟悉 Docker/Kubernetes 相关生态; 3. 具备 Kubernetes 集群扩缩开发优化经验,具备Operator开发经验; 4. 熟悉公有云大数据产品、大数据生态开源工具和开源引擎,具备二次开发经验的优先 5. 有强烈责任感,具备较强的团队沟通和协作能力,较强的自我驱动能力,具备良好的学习能力;
-
工作职责: 1. 负责AI训练平台k8s底座部署,升级及日常的维护 2. 负责研发侧cicd持续交付和效率提升 3. 负责多云平台集群管理中心和配置中心研发和维护 4. 关注平台易用性、可扩展性以及前瞻性,跟踪业界趋势与技术选型,持续推进算法平台的规划与演进。 任职资格: 1.本科及以上学历,计算机相关专业。 2.熟练掌握Golang语言。掌握Python语言是plus。 3.熟悉容器技术,熟练掌握kubernetes编排服务框架,熟悉kubernetes底层工作原理。 4、了解kubernetes的nvidia生态,了解nvidia-device-plugin,nvidia-container-runtime等工作原理。 5、有kubernetes平台研发相关项目经验。 6、 较强的责任感与自我驱动能力,较强的学习能力。 【加分项】 1.对深度学习框架tensorflow、Pytorch等其中一种有一定的了解或开发经验者 2.有大规模分布式系统研发,多云技术、云计算平台研发经验者 3.熟悉GPU相关技术或Linux内核者。
-
Kubernetes 研发工程师(实习)
[北京·三元桥] 2023-09-284k-8k 经验在校/应届 / 本科移动互联网,企业服务 / B轮 / 15-50人职位职责: 1. 平台已有的 CRD / Controller / Operator 的维护; 2. 对 Kubernetes 的组件做扩展,实现特定的调度策略,支持不同硬件的调度流程; 3. 按照业务需求构建 extended resource 实现异构计算资源的调度; 4. 其他组件构建与维护。 职位要求: 1. 本科及以上学历; 2. 熟练应用 Go/Python/Java 等编程语言之一或多个,Go 语言最佳; 3. 有一定的 Kubernetes 开发经验,了解其底层原理; 4. 计算机基础扎实,有基本的算法和数据结构基础知识; 5. 自主学习能力强,有意愿接受新技术并进入新领域,有良好的沟通能力和团队协作能力; 6. 实习时间至少三个月,每周至少三天。 加分项: 1. 了解并使用过基于 k8s 的机器学习训练框架 kubeflow 或其他; 2. 对分布式系统管理有实践经验,对该领域有很大的热情; 3. 了解云原生体系,对其生态有所了解。 实习期间表现良好有正式入职机会。 -
岗位职责: 1、参与公司容器云平台的技术架构、技术预研,应用推广及落地等; 2、参与容器云平台核心技术问题的攻关,系统优化,协助解决产品/项目开发过程中的技术难题; 3、结合公司业务实际应用,对相关容器平台开源组件进行扩展开发和优化; 4、与团队成员分享经验和新技术,帮助团队不断成长。 任职资格: 1、2-5年软件开发经验,有大型云计算平台架构研发经验优先,有大型云计算产品公司3年以上工作经验者优先; 2、对Docker等容器运行时技术和Linux内核技术(命名空间、文件系统,网络,cgroups等)有一定的理解,有Linux内核开发和调试经验的优先; 3、具备开源容器调度K8S的使用经验和系统集成经验(如监控、日志等系统),具备混合云、多云平台使用经验者优先; 4、熟悉k8s各组件工作原理,具备K8S的Controller、Operator扩展机制的实际开发经验,熟悉K8S源码者优先; 5、了解K8S CSI/CNI/CRI的工作原理,至少进行过其中一种的使用及开发; 6、熟悉使用其中一种语言开发如: Go / Python / C++,精通Go语言优先; 6、较强的团队沟通和协作能力,较强的自我驱动能力。 7、有云原生社区开发贡献者的优先;
-
25k-40k·14薪 经验5-10年 / 不限营销服务|咨询,数据服务|咨询 / 上市公司 / 500-2000人岗位职责: 配合产品开发团队,保障FreeWheel数据平台的关键服务和重要基础设施的稳定、可靠地运行; 工作内容: 1. 深入理解业务,持续提升业务SLO/SLA; 2. 通过持续的全方位数据运营(包括可用性指标.历史事故.资源利用率等),找到系统容量、可用性、稳定性方面的薄弱点,并推进落地改进项目; 3. 参与建设运维工具.平台,推进运维自动化,量化数据,使用代码解决线上问题; 4. 参与故障应急响应处理,持续打磨监控系统,提升报警准确率,缩短故障定位时长; 5. 积累运维最佳实践,为业务及基础设施架构设计与资源选型提供指导,输出标准运维流程文档; 岗位要求: 1. 5年及以上相关工作经验,计算机科学或相关专业(通信、电子、信息、自动化等)优先; 2. 熟悉主流云厂商及服务,如AWS/GCP/Azure/AliCloud等; 3. 云环境管理与优化经验,包括成本管理,安全管理,运维管理,应用架构优化; 4. 熟悉业内流行的大数据或消息队列等分布式系统平台:Aerospike, Kafka, Hadoop,Yarn,HDFS,Hbase,Druid或其他NoSQL系统等; 5. 积极拥抱 “Infrastructure as Code”思想并有较丰富的实践经验,熟悉相关厂商及开源解决方案,如CloudFormation/Terraform等; 6. 运维平台设计与使用经验,如设计或参与开发过运维管理平台:资源管理,K8s管理,配置管理等; 7. 对多种云计算基础服务有较丰富的实践操作经验,包括但不限于: VPC, Subnets, Security Group, EC2, S3, IAM, Route 53, Security Hub etc; 8. 深入理解Linux操作系统,并掌握多种开源解决方案及相应技能:Kubernetes/Container/Nginx/Ansible/Prometheus/Grafana/ELK; 9. 熟悉Golang开发语言为优; 10. 工作积极主动,有强烈的责任心,执行能力强;善于思考总结,有很强的学习、问题分析和推进解决能力; 11. 基本的英文听说能力,较强的读写能力,能够快速融入英文工作环境。
-
岗位职责: 负责在 Kubernetes 环境中进行应用程序的部署、管理和维护。 设计、开发和维护 Kubernetes 集群的自动化部署和管理工具。 与团队合作,制定和实施 Kubernetes 的最佳实践。 分析、故障排除和解决 Kubernetes 集群的问题。 监控和调优 Kubernetes 集群的性能、可用性和容量。 参与容器化应用程序的设计和开发,并将其部署到 Kubernetes 集群中。 执行容器化技术和 Kubernetes 相关的安全性、合规性和最佳实践的审计。 任职要求: 对 Kubernetes 生态系统有深入的理解,熟悉 Kubernetes 的架构和核心概念。 熟悉使用 Kubernetes 进行应用程序的部署、管理和调度。 具备使用容器编排工具(如 Docker、Kubernetes)进行开发和部署的经验。 熟悉使用云原生技术栈,如容器编排、服务发现、负载均衡等。 熟悉 Linux 系统和命令行工具,具备良好的脚本编写能力。 具备良好的分布式系统和网络知识,能够故障排除和优化 Kubernetes 集群。 具备使用编程语言(如 Python、Go)开发和维护 Kubernetes 工具的经验。 熟悉容器和镜像技术,如 Docker、OCI 标准等。 具备与团队合作和沟通的能力,能够快速学习和适应新技术。
-
Data Engineer for KUBERNETES
[广州·黄埔区] 2024-04-1320k-30k 经验1-3年 / 不限IT技术服务|咨询,网络通信 / 不需要融资 / 2000人以上Has large scale system setup/deployment experience, Familiar with Shell/Python scripts. -
岗位职责: (1)负责兴业银行容器平台及中间件PaaS平台设计、研发、建设及维护工作; (2)负责容器云及中间件相关技术研究、技术标准制定、故障排查处置、安全加固等工作; (3)负责对使用容器云平台和接入各类PaaS服务系统提供技术支持。 岗位要求: (1)熟悉Docker容器技术,深度掌握相关技术原理细节; (2)深度掌握Kubernetes,深度了解各资源对象、技术组件运作原理,有实际项目经验; (3)对应用容器化设计、改造有深度认识以及实践经验; (4)熟悉Linux,熟悉Python、Shell中一种脚本语言,深度理解网络原理、存储原理、虚拟化、软件定义网络SDN等; (5)熟悉Tomcat、Kafka、RocketMQ、Redis、Nginx等中间件中一项或者多项,具有丰富的调优、高可用架构设计、故障排查、安全加固、监控经验。 符合以下一项或多项条件者优先: (1)曾负责或深度参与互联网或大中型金融企业的容器平台或中间件PaaS平台建设者; (2)具有2年以上容器平台或PaaS平台管理运维经验者; (3)对Docker、Kubernetes有源码级掌握者; (4)对云原生社区有贡献或者熟悉源码者; (5)具备Kubernetes Operator开发经验者; (6)具有Kubernetes相关认证者; (7)具备Redis、RocketMQ、Kafka、Zookeeper、Elastic等中间件二次开发经历者。 工作地点:上海、成都
-
岗位职责: 1、负责分布式云平台需求分析,关键方案选型和系统技术架构设计,把控关键技术预研,消除技术风险; 2、负责相关领域的技术架构看护和演进,确保整体技术架构规范,流程和关键业务设计落地; 3、负责相关技术领域的技术洞察和规划,构建商业产品的技术竞争力; 4、负责云平台的系统架构设计和优化,包括但不限于系统架构设计、系统性能优化、系统容量规划和系统故障排查等方面。 岗位要求: 1、本科及以上学历,8年以上云计算相关工作经验,熟悉云计算基础架构和技术; 2、有实际的云平台落地研发经历,熟练掌握至少两种云计算平台,如AWS、Azure、OpenStack等; 3、具备系统架构设计和优化方面的专业知识和实践经验,熟悉系统架构设计、系统性能优化、系统容量规划和系统故障排查等方面的技术和工具; 4、熟悉分布式系统、微服务架构、大数据处理等相关技术,具备相关实践经验;熟悉容器化技术,如Docker、Kubernetes等; 5、熟悉并且实际运用过常用的数据库和中间件平台设计落地产品,比如mysql,redis,kafka等; 6、具备良好的沟通能力和团队合作精神,能够与不同部门的人员进行有效的沟通和协作; 7、具备较强的学习能力和解决问题的能力,能够快速适应新的技术和环境; 加分项(非必须):具备云安全方面的专业知识和实践经验,熟悉网络安全、数据安全、身份认证和访问控制等方面的技术和标准。
-
1、基础设施运维,包括KVM、Vmware、Kubernetes等技术方向 2、运维体系建设,包括标准化、可观测性、故障诊断等运维能力 3、运维平台建设,规划并设计自动化方案,持续提升运维效率,控制运维风险 任职要求 1、计算机相关专业,大学本科及以上学历,5年以上运维经验 2、熟悉Linux内核原理,熟悉CPU、Memory、I/O、Network性能问题的诊断 3、熟悉TCP/IP原理,熟悉SDN虚拟化原理、Calico/Flannel等容器网络原理 4、熟悉Kubernetes原理,具备KVM/Vmware虚拟化运维经验优先 5、有ITIL/SRE等实践经验优先,熟悉云平台IaaS架构优先,有大规模主机/集群运维经验优先 6、责任心强、良好的沟通能力、团队协作能力
-
岗位职责: 1. 参与搜狐容器平台编排、调度等核心系统设计,开发工作; 2. 参与Kubernetes,Docker等开源组件的研究与定制开发。 岗位要求: 1. 扎实的计算机专业基本功,1-3年工作经验,校招不受限; 2. 熟练掌握Java/Go语言,拥有良好的编码习惯; 3. 掌握Kubernetes,Docker等开源组件,有二次开发经验者优先; 4. 熟练掌握Linux系统下的常用软件,熟悉网络存储系统等维护工作; 5. 有良好的沟通能力,注重团队协作,善于主动思考和行动。
-
职位描述 1、负责AI算法的工程化落地,搭建从离线训练到在线服务的整个闭环服务平台; 2、根据需求完成实时推荐系统、实时特征计算、离线训练平台等系统的架构设计、工程实现及迭代优化; 3、能够根据不同的业务需求,灵活快速地完成具有挑战性的项目; 职位要求 1、计算机及相关专业本科及以上学历,具备2年及以上服务端开发经验; 2、扎实的计算机系统知识,掌握Golang编程语言,同时熟悉Python编程语言者优先; 3、熟练应用MySQL等关系数据库技术,熟练应用Redis缓存技术;熟悉Linux系统环境,能熟练使用Linux命令完成日常工作; 4、具有高性能、高可用的复杂业务系统开发经验,熟悉分布式、缓存、消息等机制优先; 5、具有Docker、Kubernetes、Istio等相关深度使用和开发经验者优先; 6、了解Kafka/Hive/Spark/Flink等大数据生态圈技术,具有相关大数据开发经验优先;有机器学习(tensorflow serving) 相关知识优先; 7、具备优秀的逻辑思维能力,对解决挑战性问题充满热情,有强烈的求知欲,善于学习新事物; 8、具有良好的沟通能力、团队合作精神和执行力,重视生产效率,研发质量。
-
酷我音乐基础服务Golang开发工程师
[北京·东城区] 09:53发布25k-50k 经验5-10年 / 本科工具类产品,内容社区,音频|视频媒体 / 上市公司 / 2000人以上岗位职责: 1. 负责后端服务持续迭代优化; 2. 负责音乐平台相关服务的研发工作,推动技术的升级和优化; 3. 深入理解后端服务的相关中间件,结合业务需要进行设计,及后端服务的容灾; 4. 对产品需求进行技术评估和解决方案输出,参与技术方案评审与设计; 5. 新技术方向的调研与实现。 岗位要求: 1、大学本科或以上学历,计算机或相关专业毕业; 2、熟悉linux操作系统及开发环境,拥有极强的排查、解决问题(trouble shooting)的能力; 3、至少3年以上golang/C++开发经验,golang基础扎实,熟悉gin/beego等web框架,有线上调优经验加分; 4、熟练掌握 kubernetes 编排服务框架,熟练掌握 Docker 容器技术; 5. 熟悉 MySQL/MongoDB/PostgreSQL/Elasticsearch 等数据库的使用和原理,了解索引原理,熟悉 Redis/Pika 等NoSQL使用; 6、能熟练使用python、shell写一些统计脚本; 7、思维缜密,责任心强,具有较强的沟通能力及团队合作精神。
热门职位