苏州高级大数据开发工程师（实时数据处理方向） - 外包人才简历详情

高级大数据开发工程师（实时数据处理方向）

驻场外包人员

工作年限：3年意向城市：杭州浏览：2次发布时间：近期

技能标签

Java Scala Hadoop Spark Kafka Hive HBase MySQL Linux Shell SQL优化分布式系统数据清洗数仓架构流式计算 ETL开发日志分析

专业技能

精通Java/Scala全栈开发，具备大数据平台架构设计能力。熟练掌握Hadoop生态体系（HDFS/YARN/Zookeeper/Oozie/Flume），深入理解Spark全栈技术（Core/SQL/Streaming）及调优策略。熟悉Kafka分布式消息队列原理与流式计算集成。精通MySQL/Redis/HBase/Hive等多类型数据存储系统，具备SQL性能优化经验。熟悉Linux系统运维及Shell脚本开发，具备分布式系统日志分析与监控能力。

工作履历（脱敏处理）

主导大数据平台架构设计与开发，完成从数据采集、清洗、存储到分析的全链路系统建设。设计并实现基于Hadoop的数仓分层架构，优化ADS层查询性能提升30%。开发分布式日志分析系统，通过Kafka+Spark Streaming实现实时数据处理，支持百万级日志秒级分析。搭建ETL数据清洗框架，统一数据标准并提升数据质量，降低业务方查询耗时50%。持续优化Hive/Spark作业性能，通过参数调优和资源分配策略提升集群利用率。

项目经验（脱敏处理）

项目一：用户行为分析平台开发

构建基于Hadoop生态的数仓分层架构（ODS/DWD/DWS/ADS），实现日均10亿+行为日志的清洗与分析。设计分布式ETL流水线，采用MapReduce+Hive实现数据标准化处理，通过分区策略优化查询性能。开发ADS层动态报表系统，采用列式存储与缓存机制提升查询响应速度。建立数据质量监控体系，实现脏数据自动识别与告警功能。

项目二：新闻资讯分布式爬虫系统

基于Hadoop搭建分布式爬虫框架，采用Python实现多机并行的高并发采集。设计Kafka消息队列实现任务分发与结果聚合，通过Spark Streaming实时处理爬虫数据。优化采集策略提升页面下载效率，实现日均百万级新闻内容的存储与检索。开发数据分片算法提升系统横向扩展能力，支持业务量增长5倍的弹性扩容。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求，欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

扫描二维码添加商务对接

立即申请人才对接

IT人力外包人才简历库