IT人力外包人才简历库

返回列表

数据采集与爬虫开发工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:1次 发布时间:近期

技能标签

Python开发 数据采集 分布式爬虫 数据库管理 验证码识别 网络协议分析 反爬策略 JS逆向分析 并发处理 爬虫框架 数据清洗 代理服务器 加密算法 浏览器指纹 动态网页解析

专业技能

精通Python编程语言,擅长数据采集与清洗技术,具备动态网页爬取能力,熟练掌握MySQL/Redis/MongoDB等多类型数据库存储方案。精通验证码识别与破解技术(MD5/BASE64/SHA1/DES/AES/RSA等加密算法),具备模拟登录与代理服务器配置经验。熟练运用多线程/多进程并发处理技术,掌握Scrapy/PySpider等主流爬虫框架,具备分布式爬虫系统架构设计能力。精通JS逆向分析与浏览器指纹伪装技术,熟悉网络协议与反爬策略应对方案。

工作履历(脱敏处理)

专注于数据采集系统开发与优化,主导设计并实现多个平台的数据采集方案。熟练运用Scrapy/PySpider等框架构建高并发爬虫系统,采用多线程/多进程技术提升数据采集效率。精通动态网页解析技术,成功应对动态渲染页面及反爬机制,通过JS逆向分析与浏览器指纹伪装技术突破反爬限制。具备分布式爬虫系统架构设计能力,使用Scrapy-Redis实现任务分发与负载均衡。擅长数据清洗与存储方案设计,能够根据业务需求选择合适数据库类型并优化存储结构。

项目经验(脱敏处理)

某平台数据采集项目:设计并实现基于协程的高效数据采集系统,通过Selenium处理动态渲染页面,结合OCR技术完成验证码识别。采用分布式爬虫框架Scrapy-Redis实现任务分发,通过代理服务器轮换策略应对反爬机制,最终实现日均百万级数据采集。二手房平台数据采集项目:构建分布式爬虫系统采集房源信息,使用正则表达式与XPath进行数据解析,通过Redis缓存处理重复采集请求。设计数据清洗流程将采集数据存入MySQL数据库,建立索引优化查询性能,为后续数据分析提供高质量数据源。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接