IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python Scrapy Selenium Playwright 分布式爬虫 异步协程 Redis 反反爬策略 数据清洗 可视化分析 MySQL MongoDB 多线程 数据结构化处理 爬虫架构设计

专业技能

精通Python爬虫全栈开发,熟练掌握Scrapy、Requests、BeautifulSoup等主流框架,具备静态/动态网页数据采集能力。深入理解异步协程(aiohttp/asyncio)与分布式爬虫架构设计,可实现高并发、大规模数据采集。熟练运用Selenium/Playwright处理JavaScript渲染页面,熟悉MySQL/MongoDB数据库存储优化及Redis增量爬取技术。具备反反爬策略设计能力,包括IP代理池管理、User-Agent伪装、请求频率控制等。掌握数据清洗、结构化处理及可视化分析技术,可将原始数据转化为业务洞察。

工作履历(脱敏处理)

主要负责电商平台商品数据采集系统的开发与优化,主导分布式爬虫架构设计,实现日均百万级数据采集。通过Scrapy-Redis实现任务分发与结果聚合,采用异步协程技术提升采集效率30%。设计反反爬策略,包括IP代理池管理、请求频率控制及User-Agent伪装,有效应对目标网站的反爬机制。开发动态页面处理模块,集成Selenium与Playwright技术,成功采集JavaScript渲染内容。构建数据清洗与结构化处理流程,使用Pandas进行数据标准化处理,并通过Tableau实现数据可视化分析,为业务决策提供数据支持。

项目经验(脱敏处理)

电商平台商品数据采集与分析项目:主导分布式爬虫系统开发,采用Scrapy-Redis实现任务分发与结果聚合,通过异步协程技术提升采集效率30%。设计反反爬策略,包括IP代理池管理、请求频率控制及User-Agent伪装,成功应对目标网站的动态验证码及IP封锁机制。开发动态页面处理模块,集成Selenium与Playwright技术,实现JavaScript渲染内容的完整采集。构建数据清洗与结构化处理流程,使用Pandas进行数据标准化处理,并通过Tableau实现数据可视化分析,最终形成商品价格波动分析报告,为平台运营决策提供数据支持。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接