IT人力外包人才简历库

返回列表

数据采集与反爬虫工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:6次 发布时间:近期

技能标签

Python 爬虫开发 Requests Urllib XPath 正则表达式 BeautifulSoup Selenium Scrapy 字体反爬 JS逆向 图片验证 Numpy Pandas Matplotlib

专业技能

精通Python编程语言,具备完整的爬虫开发能力。熟练掌握Requests/Urllib网络请求库,精通XPath/正则表达式/BeautifulSoup数据解析技术。熟悉Selenium浏览器自动化和Scrapy分布式爬虫框架。深入理解字体反爬、JS逆向、图片验证等反爬机制。具备数据分析能力,熟练使用Numpy/Pandas进行数据清洗,利用Matplotlib实现数据可视化。

工作履历(脱敏处理)

专注于网络数据采集系统开发,主导设计并实现多套反爬虫解决方案。成功构建分布式爬虫架构,日均处理百万级数据采集任务。开发字体反爬识别模块,有效突破动态渲染网页数据抓取难题。设计JS逆向解析方案,解决复杂加密参数生成问题。完成多个数据清洗管道开发,实现数据质量提升80%。搭建可视化分析平台,支持多维度数据报表生成。

项目经验(脱敏处理)

开发某电商平台商品数据采集系统,采用Scrapy框架实现分布式爬虫,通过IP代理池和请求头伪装技术突破反爬限制。设计字体反爬识别模块,利用Tesseract-OCR实现验证码自动识别,提升数据采集效率300%。构建动态网页数据采集方案,通过Selenium配合JS逆向解析技术获取加密参数,日均采集数据量达50万条。开发数据清洗管道,使用Pandas进行数据去重和异常值处理,数据准确率提升至99.2%。搭建数据可视化平台,利用Matplotlib生成销售趋势分析报表,为业务决策提供数据支持。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接