-
平时可以阅读英文的计算机API文档,并且需要有一定的Java基础。对爬虫抓网页的工作内容感兴趣,如果不符合以上条件,请勿投递,谢谢。 工作职责: 1、IOS, Andriod APPs以及网站的逆向分析及漏洞挖掘,并对逆向数据进行采集抓取; 2、爬虫策略和防屏蔽规则,提升网页抓取的效率和质量; 3、有过Akamai,Perimeterx经验的优先; 任职需求: 1、应届毕业生,熟练掌握Java语言; 2、熟悉IDA、 JEB 、LLDB、JADX等常用逆向分析工具,具备逆向分析能力; 3、熟悉各种通用加解密算法,有一定的脱壳反混淆,反调试经验; 4、熟悉常见的Xposed hook技术,注入技术,常见安全产品绕过等技术; 5、做事有责任感,具有良好的逻辑思维,很强的执行力和自我驱动力。 【福利政策】 1、混合办公模式,根据工作年限每月可申请居家办公2-8天。 2、10天- 25天带薪年休假; 3、13薪及每年全员调薪,根据入职时间、工作表现和企业经营状况; 4、补充医疗保险及每年健康体检; 5、旅游补贴及公司团建; 6、每周供应2次免费午餐; 7、节假日礼品卡福利及节日下午茶供应。
-
职位职责: 1、为字节跳动抖音、电商等业务线的反爬效果和指标负责,解决业务痛点问题; 2、提升业务风险感知能力,结合具体场景,数据指标,主动发现问题并提出解决方案,对业务风控效果负责; 3、推动智能化产品落地,不断提升平台化能力,提高风控效率; 4、研究新的产品动向和前瞻探索,借鉴业界的新思路持续优化产品策略,使反爬处于行业领先水平。 职位要求: 1、本科及以上学历,责任心强,思维逻辑严谨,对数据敏感; 2、有互联网风控策略制定经验,从事过反爬虫、流量反作弊方向工作; 3、有互联网安全策略管理经验,包括但不限于风险发现、制定模型或策略、推动方案落地; 4、1年以上策略产品或数据分析工作经验;熟练掌握大数据分析工具使用,不限于SQL/PySpark/Flink等; 5、具备攻防思维,熟练掌握常见的反爬虫技术和数据安全风险。
-
岗位职责: 1、负责设计、开发、维护爬虫系统; 2、参与多平台信息的抓取和分析; 3、建立完整的数据获取、解析、入库和监控流程,并不断优化迭代完善; 4、设计爬虫反屏蔽规则,提升网页抓取的效率和质量; 5、利用主流的大数据相关技术,对抓取后的网页数据进行清洗、存储等;并持续优化平台,以便满足各种爬取业务需求。 任职资格: 1、熟悉RUST语言,熟练掌握js反混淆,有实操经验优先; 2、实操过akamai,datadom,cloudflare等国外cdn供应商防护优先; 3、熟悉linux开发环境,熟练掌握java或python编程语言,熟悉js语言; 4、熟悉 web/app 常见的反爬机制,精通各种反爬破解,包括但不限于:Js防护、混淆、逆向分析、App防破解、防逆向、加固技术等技能; 5、有电商类网站爬虫经验优先,有高频爬虫工作经验者优先。
-
岗位职责: 1.负责网络爬虫系统平台的架构设计与开发(如抓取调度,多样化抓取,页面解析和结构化抽取),技术选型; 2.研究爬虫策略和防屏蔽规则,解决封账号,封IP,验证码,混淆加密,页面跳转等难点攻克,提升网页抓取效率和质量。 任职要求: 1.熟练掌握Python语言,有良好的编码习惯。 2.熟悉HTML,JavaScript,xpath,css selector,熟悉HTTP协议;熟悉WebDriver,phantomjs等工具; 3.掌握网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;有解决封账号、封IP、网页抓取、信息抽取等问题的经验 4.熟悉mysql,redis,mongodb,ES等数据库,以及对应数据的抽取入库等; 5.熟悉正则表达式、Xpath等数据提取技术。 6.了解常见的爬虫对抗技巧 7.了解抓包工具、如Fiddler、Charles、Mitmproxy 8.熟悉python web后端框架Django、flask、fastapi其中的一种优先 9.熟悉Linux常用命令、docker容器技术和git技术者优先; 有API对接经验优先 10.能对目前主流网站、APP数据进行抓取,有外贸跨境商城,抖音,小红书爬虫经验者优先。 11.有RPA、手机端自动化、浏览器自动化、PC自动化开发经验的优先 薪资待遇: 8K-13K;****。 上班时间: 上午 : 9:30-12:00;下午 13:30-19:00;
-
岗位职责: 1、负责公司 AI产品研发。 2、负责相关业务逻辑的后台实现。 3、与前端工程师沟通与协作,高效完成功能开发。 4、根据产品需求,写出良好的解决方案,有编写开发文档习惯。 任职要求: 1、本科及以上学历,2~5 年以上 NodeJS 实际工作经验,有 Typescript 实际开发经验优先,扎实的Javascript基本功。 2、熟悉 Koa、express 后端框架。 3、熟悉 Mysql、MongoDB 等数据库。 4、了解 Web前端基础知识(HTML/CSS/JavaScript)和常见开发技术(webpack/React等)。 5、对AI有强烈兴趣,熟悉使用大模型,有prompt调试、利用AI处理文字和图片等经验者优先。 6、具有较强的沟通能力与团队合作精神,具有良好的分析问题、解决问题的能力以及较强的学习能力。 7、责任心强,有较强的抗压能力。 备注 01: 该岗位专为我们的海外 AI 工具产品配置,该产品是基于 ChatGPT 的 SaaS 工具。目前公司绝大部分的资源和精力都投入在这块,全力 ALL IN AI! 还有较多的 AI 工具正在排期计划中。我们非常看好这块,这是一场工业革命!优秀的你不参与一下吗? 产品从去年5月份上线至今,已经完成0到1的验证,目前网站月独立访问达到2.5M,我们非常欢迎技术研发高手来给我们产品再添一把火。我们 AI 产品 HIX.AI 从去年5月份上线至今,已经完成0到1的验证,入围 a16z 全球Top 100 AI 产品流量榜第38名。现在需要再招聘技术研发高手来给我们进一步完善产品,扩大市场占有率,完成从10到100的突破! 备注 02: 我们公司成立以来5年多一直都是做海外 SaaS 工具,产品经验丰富,Google SEO 自然流量获取能力非常强,曾经做过月独立访客过300万的网站1个,月独立访客过100万的网站3个。且公司在没有融资的情况下,也一直活的很好,而且在扩大规模,这个在国内是比较少见的。目前我们 AI 产品颇有成效,所以诚邀各位技术研发高手来给我们产品再添一把火。 我们其中一个主网站:https://hix.ai/ 【关于公司】 1. 上班时间:上午时间9:00-12:00,下午时间13:30-18:00,中间12:00-13:30休息,周末双休; 2. 互联网企业,90后年轻团队,人际关系工作氛围佳; 3. 具有竞争力的薪酬,每年有1-2次调薪机会和年终奖; 4. 入职后购买五险一金; 5. 享有国家法定假期如年假、婚假、产假、陪产假、法定假日等; 6. 节日礼品和红包等; 7. 年会、每周羽毛球、篮球、跑步等丰富多彩的文体活动; 8. 坐标深圳宝安中心,海景办公室,甲级写字楼,上班环境轻松舒适高大上。 9. 员工年度体检;
-
负责为海外音乐项目搜索采集数据,为团队的海外运营提供决策支持(自有项目,非乙方)。 岗位职责∣Responsibilities: 1、熟练掌握Python,熟悉Linux开发环境; 2、负责设计和开发爬虫,精通海外网页(Youtube、Spotify、Google...)抓取原理及技术,从各种web页面、APP中获取目标信息; 3、解决技术疑难问题,包括各种反爬、压力控制等;提升网页抓取的效率和质量。有能力解决封账号、封IP、验证码识别、图像识别等问题,有能力解决复杂的反爬限制; 4、大规模爬虫系统的设计、数据REST API的设计、开发、维护、调优,第三方数据源的对接、预处理、入库; 5、分析结构化和非结构化数据,并对数据抓取、信息提取、去重、清洗;不限于使用代码规则类进行数据清理; 6、开发代码的维护更新,Linux服务器的维护,文档维护; 7、支持部门数据需求,包括但不限于搜索数据来源、数据清洗、数据挖掘、为团队提供决策支持; 履职要求∣Requirements: 1、大学本科及以上学历,计算机相关专业,基本的英语阅读能力; 2、耐心、细心,有较强的逻辑思考能力和良好的工作习惯,态度认真负责; 3、有三年及以上的爬虫、数据处理、数据分析经验,有大数据爬虫经验尤佳;有音乐行业经验优先; 4、熟练掌握Python,HTML,JS/CSS等技术;熟悉scrapy,feapder等爬虫框架,有分布式爬虫经验;熟悉正则、xpath等提取方法; 5、熟悉常见的反爬虫技术如文本混淆、验证码、加密破解,api限制等;精通网页抓取原理及技术,熟悉MySQL、Redis、Postgrep等;熟悉Internet基本协议 (如TCP/IP、HTTP等) ; 6、熟悉Linux环境,使用脚本开发维护Linux服务器; 7、具有良好的表达能力,团队合作能力;具有很强的责任心,乐于挑战,有较强的深入学习理解业务的意愿;
-
【岗位职责】: 1、负责设计和开发网络爬虫系统,完成关键信息的数据抽取、清洗、去重、分析等: 2、负责爬虫相关技术的研究和实现工作,比如APP破解、小程序破解、分布式爬虫、验证码破解、JS逆向反爬机制的研究等: 3、负责公司爬虫的核心算法以及策略优化,熟悉采集系统的调度策略: 4、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量: 5、实时监控爬虫的进度和警报反馈,提升爬虫系统稳定性、可扩展性; 6、有良好的编码能力,逻辑思维缜密,能独立分析解决问题。 【任职要求】 1、本科及以上学历,计算机相关专业: 2、至少3年及以上爬虫经验: 3、精通Python语言,具有扎实的计算机基础和编程能力,熟悉常见的算法与数据结构,具有优秀的逻辑思维能力; 4、熟悉Mysql,redis,有过数据库调优和海量数据存储经验优先; 5、熟悉常见的反爬机制,并对反爬具有一定的应对措施策略且有一定研究: 6、熟悉APP逆向、JS逆向、验证码破解、图像识别等技术; 7、熟悉常用网络协议、数据存储和数据处理技术。 8、熟悉linux系统环境、命令,shell、python脚本编写; 9、熟悉常见爬虫框架(如Scrapy),有大规模爬虫系统开发经验; 10、有机票行业从业经验优先。
-
【任职要求】 1、熟悉html/css/xpath/ajax/xml等技术,熟悉HTTP传输协议,精通网页抓取原理和整合技术,熟悉正则表达式; 2、熟悉基于COOKIE等网站登录原理,JS逆向; 3、精通Python,熟悉django框架 4、熟悉MySQL 5、熟悉linux系统环境、命令,shell、python脚本编写 6、熟悉fiddler抓包工具的使用 7、熟悉Git版本管理工具 【教育背景及从业经验】 1、计算机相关专业,大学专科及以上; 2、一年以上python开发经验,三个以上爬虫项目经验 【加分项】 善于以用户场景视角,理解功能需求。 【公司项目介绍】 自主研发车险管理ToB SaaS平台,商用10年,在车险垂直领域市场占有率高。 新人入职,一对一技术培训。 【福利】 国家规定的所有带薪假期;社保五险;零食;年度旅游;地铁口; 【上班时间】 早9晚6,双休
-
工作内容: 1、通过编写新的爬虫脚本、通过修复已有爬虫脚本对网站数据进行爬取采集 2、对爬取的速度、质量负责。 3、对爬取回来的数据进行清洗(去重、缺失值、空值、乱码异常值等处理),并且进行数据存储 工作要求: 1、会使用爬虫、能独立编写爬虫脚本爬取数据 2、能够解决爬取数据过程中的反爬机制(JS逆向、验证码、封IP等) 3、能够处理千万级以上数据,保证处理存储的有效性(速度+质量) 4、能接受应届生、勤奋好学、吃苦耐劳
-
负责为海外音乐项目搜索采集数据,为团队的海外运营提供决策支持(自有项目,非乙方)。 岗位职责∣Responsibilities: 1、熟练掌握Python,熟悉Linux开发环境; 2、负责设计和开发爬虫,精通海外网页(Youtube、Spotify、Google...)抓取原理及技术,从各种web页面、APP中获取目标信息; 3、负责爬虫团队的日常工作安排及管理。 4、解决技术疑难问题,包括各种反爬、压力控制等,提升网页抓取的效率和质量。有能力解决封账号、封IP、验证码识别、图像识别等问题,有能力解决复杂的反爬限制; 5、大规模爬虫系统的设计、数据REST API的设计、开发、维护、调优,第三方数据源的对接、预处理、入库; 6、分析结构化和非结构化数据,并对数据抓取、信息提取、去重、清洗;不限于使用代码规则类进行数据清理; 7、开发代码的维护更新,Linux服务器的维护,文档维护; 8、支持部门数据需求,包括但不限于搜索数据来源、数据清洗、数据挖掘、为团队提供决策支持; 履职要求∣Requirements: 1、大学本科及以上学历,计算机相关专业; 2、耐心、细心,有较强的逻辑思考能力,和良好的工作习惯。 3、有5-10年的爬虫、数据处理、数据分析经验; 有团队管理经验;有音乐行业经验优先; 4、掌握HTML,JS,及熟悉JS反扒破解;熟悉常见的反爬虫技术如文本混淆反爬虫、验证码等; 5、熟练掌握Python数据结构与常用算法;熟悉scrapy等爬虫框架,有scrapy-redis分布式爬虫经验;熟悉正则、xpath等提取方法; 6、了解pandas、numpy掌握网络爬虫开发原理,熟悉互联网各种类型数据交互模式; 7、熟悉MySQL部署、开发与维护; 8、熟悉Linux环境,使用脚本开发维护Linux服务器; 9、具有良好的表达能力,团队合作能力;具有很强的责任心,乐于挑战,有较强的深入学习理解业务的意愿。
-
工作职责: 1.使用爬虫技术采集指定的互联网数据 2.对采集的数据进行清洗治理 3.根据项目需求导指定的项目数据 4.维护采集框架平台,维护采集脚本 5.根据公司内部的需求编写一些数据处理小工具 任职要求: 1.本科以上学历,3年以上相关工作经验; 2.计算机相关专业 3.精通Python语言,熟练掌握主流爬虫框架中的一种;熟悉常用的库requests/gevent等; 4.了解各种加密算法,能够独立解决js反爬和模拟登陆问题; 5.熟练掌握正则表达式、XPath、CSS等网页信息抽取技术; 6. 熟悉常见反爬机制,验证码识别,IP代理池、应用Ip池、headers认证和cookie等; 7. 熟练使用应用Selenium实施动态抓取; 8.熟悉熟练使用charles、fiddler等抓包工具者优先; 9. 熟悉数据清洗,能够用numpy、pandas、jieba等工具对数据进行处理者优先; 10.熟练使用sqlserver、mysql、mongodb、redis; 11.熟悉掌握rabbitMQ、kafka、spark 优先; 12.具有DBA工作经验者优先; 13.具有团队精神、积极的工作态度和对工作的责任心,有一定的稳定性。
-
base南京或苏州 职位描述: 1、负责爬虫功能的维护,各类爬虫脚本及组件的维护及升级 2、负责各类业务数据的清洗、统计、分析等相关工作 3、负责平台数据运营及数据质量的控,并配合业务人员进行数据提取、分析与验证 任职资格: 1、***本科以上学历,计算机及相关专业; 2、熟练掌握Python语言,熟练掌握JS语言、有APP数据采集经验者优先; 3、精通数据采集技术,熟悉各类反爬措施及应对策略,熟悉HTTP底层协议; 4、对数据敏感、熟悉数据分类,能结合业务目标独立对数据进行分析处理; 5、良好的数据处理能力,熟练使用pandas、numpy,有数据分析、数据挖掘经验者优先; 6、良好的编码能力,工作认真细致踏实,逻辑思维缜密,善于分析问题,具备良好的沟通交流能力。
-
网络信息安全,爬虫,攻防,全栈技术工程师
-
工作职责: 1、打造国内/外全域的短视频数据抓取和实时监控能力; 2、设计和优化分布式爬虫集群系统,高效的内容发现、解析和存储方案; 3、模拟真实用户行为,采用手机群控等创新技术突破爬取难题; 4、与其他团队紧密协作,集成爬虫输出,支持不同业务诉求。 任职要求: 1、大规模分布式系统和网络爬虫开发经验; 2、精通Python、Go等编程语言,熟悉爬虫相关框架和工具; 3、深入了解平台反爬虫策略及对应的防护和绕行方法; 4、熟悉手机群控、Root手机等移动端爬虫前沿技术; 5、优秀的系统架构设计和性能优化能力; 6、数据质量管理意识,重视隐私、版权保护。
-
一、 岗位职责 1、负责爬虫和数据采集系统的维护与开发,包括内外大型电商平台信息爬取和页面内容的提取分析; 2、负责定期爬取指定网站的数据,完成关键信息的数据抽取、清洗、去重、分析,并转换成业务需求所需要的格式; 3、负责爬虫相关技术的研究和实现工作,比如APP破解、小程序破解、分布式爬虫、验证码破解、JS逆向反爬机制的研究等; 4、负责公司爬虫的核心算法以及策略优化,熟悉数据采集系统的调度策略; 5、设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量; 6、负责现有部分爬虫的完善、维护工作,实时监控爬虫的进度和警报反馈,提升爬虫系统稳定性、可扩展性、实用性。 二、岗位要求 1、 有3年以上大型平台及海量数据的爬取经验,例如* 聘、*宝、*东、易贝、亚马逊等,能独立完成爬虫任务; 2、 精通Mysql,Redis,常见的算法与数据结构,具有优秀的逻辑思维能力和扎实的计算机基础和编程能力,有过数据库调优和海量数据存储经验优先; 3、本科及以上学历,计算机或相关专业; 4、熟悉HTTP、HTTPS原理,理解Cookie机制,能够进行请求抓包; 5、熟悉常见的反爬机制,并对反爬具有一定的应对措施策略且有一定研究; 6、熟悉APP逆向、JS逆向、验证码破解、图像识别等技术;熟悉常用网络协议、数据存储和数据处理技术; 7、熟悉linux系统环境、命令,shell、python脚本编写。