技能标签
专业技能
精通数据采集与反爬虫技术,擅长使用Beautiful Soup、Pyquery、XPath等工具进行网页解析,掌握正则表达式与JavaScript逆向分析。熟悉AES/DES加密算法破解及非对称加密处理,具备Cookie管理与反爬虫策略制定能力。精通Selenium自动化模拟登录技术,熟练使用多线程/进程池提升采集效率。掌握RPC远程调用框架(Golang/自研),具备分布式爬虫系统设计经验。熟悉网络协议分析与抓包工具使用,能够通过Charles抓包进行API接口逆向分析。
工作履历(脱敏处理)
专注于数据采集系统开发与反爬虫技术研究,主导设计并实现多线程分布式爬虫架构,提升数据采集效率300%。成功破解多个平台加密接口,完成登录系统自动化改造,降低人工干预成本。开发自研RPC框架实现服务间高效数据交互,支撑日均百万级数据采集任务。持续优化反爬虫策略,有效应对动态验证码、IP封禁等防护机制,保障采集系统稳定运行。
项目经验(脱敏处理)
1. 基于自研RPC框架实现某招聘平台加密数据解析与采集,通过AES/DES算法逆向分析实现接口数据解密,日均采集数据量达50万条。
2. 开发头条热点资讯采集系统,运用Pyquery+XPath实现复杂页面结构解析,成功突破动态加载反爬机制。
3. 设计升学网登录接口破解方案,通过逆向分析实现Cookie管理与动态参数生成,完成模拟登录系统开发。
4. 构建建筑市场监管平台数据采集系统,采用多线程+进程池架构提升采集效率,实现关键数据字段自动提取与清洗。
5. 开发微博热点话题评论采集工具,通过Charles抓包分析JS加密参数,实现Ajax动态数据实时采集。
6. 设计知乎x-zse-96参数生成算法,结合JavaScript逆向分析实现评论区数据采集,突破动态参数验证机制。
7. 搭建分布式爬虫监控平台,集成Selenium自动化测试模块,实现采集任务异常自动修复与日志分析功能。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
2年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接