IT人力外包人才简历库

返回列表

数据采集开发工程师

驻场外包人员
工作年限:2年 意向城市:杭州 浏览:4次 发布时间:近期

技能标签

数据采集 反爬虫技术 加密解密 RPC框架 多线程处理 Selenium自动化 正则表达式 XPath解析 Pyquery AES加密 DES加密 Cookie管理 JavaScript逆向 Ajax数据采集 网络协议分析

专业技能

精通数据采集与反爬虫技术,擅长使用Beautiful Soup、Pyquery、XPath等工具进行网页解析,掌握正则表达式与JavaScript逆向分析。熟悉AES/DES加密算法破解及非对称加密处理,具备Cookie管理与反爬虫策略制定能力。精通Selenium自动化模拟登录技术,熟练使用多线程/进程池提升采集效率。掌握RPC远程调用框架(Golang/自研),具备分布式爬虫系统设计经验。熟悉网络协议分析与抓包工具使用,能够通过Charles抓包进行API接口逆向分析。

工作履历(脱敏处理)

专注于数据采集系统开发与反爬虫技术研究,主导设计并实现多线程分布式爬虫架构,提升数据采集效率300%。成功破解多个平台加密接口,完成登录系统自动化改造,降低人工干预成本。开发自研RPC框架实现服务间高效数据交互,支撑日均百万级数据采集任务。持续优化反爬虫策略,有效应对动态验证码、IP封禁等防护机制,保障采集系统稳定运行。

项目经验(脱敏处理)

1. 基于自研RPC框架实现某招聘平台加密数据解析与采集,通过AES/DES算法逆向分析实现接口数据解密,日均采集数据量达50万条。

2. 开发头条热点资讯采集系统,运用Pyquery+XPath实现复杂页面结构解析,成功突破动态加载反爬机制。

3. 设计升学网登录接口破解方案,通过逆向分析实现Cookie管理与动态参数生成,完成模拟登录系统开发。

4. 构建建筑市场监管平台数据采集系统,采用多线程+进程池架构提升采集效率,实现关键数据字段自动提取与清洗。

5. 开发微博热点话题评论采集工具,通过Charles抓包分析JS加密参数,实现Ajax动态数据实时采集。

6. 设计知乎x-zse-96参数生成算法,结合JavaScript逆向分析实现评论区数据采集,突破动态参数验证机制。

7. 搭建分布式爬虫监控平台,集成Selenium自动化测试模块,实现采集任务异常自动修复与日志分析功能。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

2年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接