IT人力外包人才简历库

返回列表

Python爬虫开发工程师

驻场外包人员
工作年限:3年 意向城市:杭州 浏览:3次 发布时间:近期

技能标签

Python 爬虫开发 反爬策略 正则表达式 数据采集 Selenium 分布式爬虫 数据清洗 API接口 日志分析

专业技能

精通Python编程语言,熟悉数据类型、正则表达式及第三方库应用;掌握网络请求协议及爬虫框架(urllib、requests、bs4、scrapy、pyspider);熟悉分布式爬虫架构设计;擅长处理反爬策略(IP代理、验证码识别、请求头伪装);具备Selenium自动化测试能力;熟悉数据清洗与存储技术(MySQL、MongoDB);掌握日志分析与异常监控体系

工作履历(脱敏处理)

专注于Python爬虫开发领域,累计完成20+数据采集项目。主导设计分布式爬虫架构,实现日均百万级数据采集,系统稳定性达99.9%。开发反爬策略模块,成功突破50+网站反爬机制,包括IP代理池构建、验证码识别算法优化等。搭建自动化测试框架,实现爬虫系统全链路监控,故障响应时间缩短60%。主导开发Selenium自动化脚本,完成动态页面数据采集,支持定时任务与异常重试机制。持续优化数据清洗流程,提升数据质量合格率至98%以上。

项目经验(脱敏处理)

1. 某地市场数据采集系统:基于Scrapy框架构建分布式爬虫架构,日均采集10万条商品数据,采用IP代理池和请求头伪装技术突破反爬机制,系统稳定运行6个月。

2. 图片资源采集平台:使用Selenium处理动态加载图片,开发定时任务模块实现每日自动登录和数据采集,成功采集50万+壁纸资源。

3. 在线教育平台数据采集:通过正则表达式提取课程信息,结合MongoDB存储结构化数据,日均处理20万条教学资源,数据准确率99.5%。

4. 电商平台价格监控系统:开发反反爬策略模块,采用分布式任务调度实现多线程并发采集,成功采集300+电商平台实时价格数据。

5. 健康打卡自动化系统:基于Selenium实现网页自动登录和打卡功能,支持多账号管理与异常重试机制,日均处理500+用户打卡任务。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接