IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:2年 意向城市:杭州 浏览:5次 发布时间:近期

技能标签

Python开发 爬虫框架 数据清洗 反爬策略 分布式部署 网络协议分析 数据可视化 接口调试 Linux运维 数据库管理

专业技能

精通Python编程语言,熟练掌握Scrapy、Django等主流开发框架。具备完整的爬虫开发能力,包括请求调度、数据解析、反爬策略制定及分布式部署。熟悉网络协议分析(Wireshark)、接口调试(Postman)及数据可视化工具(Matplotlib)。掌握数据清洗(Pandas)、存储(MySQL/Redis)及多线程并发处理(ThreadPoolExecutor)技术。熟悉Linux环境开发(Xshell)、数据库管理(Navicat)及接口测试工具(Charles)。

工作履历(脱敏处理)

专注于构建高并发数据采集系统,主导开发电商及社交平台数据抓取方案。设计并实现多线程爬虫架构,通过ThreadPoolExecutor提升采集效率300%。制定反爬策略,采用动态代理、请求头随机化及速率控制技术突破平台限制。开发数据清洗模块,利用Pandas实现数据标准化处理。构建数据可视化系统,通过Matplotlib生成词云图及趋势分析图表。完成数据存储方案设计,支持MySQL与Redis混合存储架构。

项目经验(脱敏处理)

电商数据采集系统:开发覆盖当当、苏宁、淘宝等平台的爬虫系统,采用Scrapy框架实现分布式采集,日均处理数据量达50万条。设计动态请求头生成模块,结合IP代理池实现反爬策略,成功突破平台限制。开发数据清洗管道,通过Pandas实现数据去重及结构化处理,输出标准化数据格式。社交平台数据采集:构建小红书、微博、抖音等多平台采集系统,采用异步请求优化技术提升采集效率。开发URL解析模块,通过正则表达式提取目标数据,结合线程池实现并发处理。设计数据存储方案,支持Excel、MySQL及Redis多数据源同步,生成可视化分析报告。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

2年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接