IT人力外包人才简历库

返回列表

网络爬虫开发工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python编程 网络爬虫开发 Requests库 lxml与XPath解析 数据清洗 结构化处理 反爬虫策略 静态网页解析 动态页面处理 二进制流存储 数据采集 数据存储方案

专业技能

精通Python编程语言,掌握Requests库实现HTTP请求及反爬虫策略应对方案,熟练运用lxml与XPath进行网页数据解析,具备图片二进制流存储技术,擅长非结构化数据清洗与结构化处理,可处理静态网页及简单动态页面数据采集,熟悉海量数据采集与存储方案

工作履历(脱敏处理)

专注网络数据采集领域开发,主导基于Requests库的爬虫系统构建,成功应对多类反爬虫策略,实现网页数据结构化处理。开发lxml与XPath解析模块,提升数据提取效率30%。设计图片二进制流存储方案,确保数据完整性。搭建数据清洗管道,实现非结构化数据到JSON/CSV格式的转换。优化采集流程,支持日均百万级数据处理,保障系统稳定性。

项目经验(脱敏处理)

基于Requests库开发网络爬虫系统,通过设置User-Agent/Referer等请求头应对反爬虫策略,采用lxml结合XPath实现网页元素精准定位,构建图片二进制流存储方案确保资源完整性。设计数据清洗模块,实现非结构化文本与图片数据到结构化JSON/CSV格式的转换,处理静态网页及简单动态页面数据采集,优化采集流程提升数据处理效率,支持日均百万级数据采集与存储。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接