IT人力外包人才简历库

返回列表

Python爬虫开发工程师

驻场外包人员
工作年限:3年 意向城市:杭州 浏览:4次 发布时间:近期

技能标签

Python Scrapy Flask Selenium PCA SVM 异步编程 多线程 数据可视化 自动化测试 分布式爬虫 反爬策略 数据降维 机器学习 HTTP协议 正则表达式

专业技能

精通Python编程语言,熟练使用Scrapy框架进行分布式爬虫开发,掌握Requests库实现HTTP请求与数据解析。熟悉Flask Web框架开发,具备自动化测试能力(Selenium)。掌握机器学习算法(PCA数据降维、SVM支持向量机),具备数据可视化能力。熟悉异步编程与多线程技术,能够优化爬虫性能并处理反爬策略。

工作履历(脱敏处理)

主导多个数据采集项目,包括电商商品数据爬取、股票数据可视化分析、音乐影视资源解析等。设计并实现分布式爬虫架构,通过异步多线程技术提升数据采集效率300%。开发人脸识别系统,基于OpenCV与PCA算法实现图像特征降维与比对。构建自动化测试框架,使用Selenium完成Web端功能测试。优化数据存储方案,采用CSV/数据库多格式存储,提升数据处理效率。持续跟进反爬技术演进,通过IP代理、请求头伪装等策略突破网站防护。

项目经验(脱敏处理)

电商数据采集系统:基于Scrapy框架开发分布式爬虫,采用异步多线程技术实现淘宝天猫商品数据批量采集,通过IP代理和请求头伪装突破反爬机制,日均采集数据量达50万条。图像识别项目:使用OpenCV和PCA算法实现人脸识别,完成图像预处理、特征提取与比对,准确率达95%。股票数据可视化:整合爬虫与机器学习技术,通过SVM算法对股票数据进行分类预测,生成可视化分析报告。多线程爬虫优化:采用requests库结合线程池实现小说章节批量采集,通过CPU调度算法提升爬取效率,降低服务器负载。数据清洗与存储:设计自动化数据处理流程,使用正则表达式提取关键信息,构建标准化数据仓库,提升数据可用性。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接