IT人力外包人才简历库

返回列表

高级大数据开发工程师(实时数据处理方向)

驻场外包人员
工作年限:3年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Java Scala Hadoop Spark Kafka Hive HBase MySQL Linux Shell SQL优化 分布式系统 数据清洗 数仓架构 流式计算 ETL开发 日志分析

专业技能

精通Java/Scala全栈开发,具备大数据平台架构设计能力。熟练掌握Hadoop生态体系(HDFS/YARN/Zookeeper/Oozie/Flume),深入理解Spark全栈技术(Core/SQL/Streaming)及调优策略。熟悉Kafka分布式消息队列原理与流式计算集成。精通MySQL/Redis/HBase/Hive等多类型数据存储系统,具备SQL性能优化经验。熟悉Linux系统运维及Shell脚本开发,具备分布式系统日志分析与监控能力。

工作履历(脱敏处理)

主导大数据平台架构设计与开发,完成从数据采集、清洗、存储到分析的全链路系统建设。设计并实现基于Hadoop的数仓分层架构,优化ADS层查询性能提升30%。开发分布式日志分析系统,通过Kafka+Spark Streaming实现实时数据处理,支持百万级日志秒级分析。搭建ETL数据清洗框架,统一数据标准并提升数据质量,降低业务方查询耗时50%。持续优化Hive/Spark作业性能,通过参数调优和资源分配策略提升集群利用率。

项目经验(脱敏处理)

项目一:用户行为分析平台开发

构建基于Hadoop生态的数仓分层架构(ODS/DWD/DWS/ADS),实现日均10亿+行为日志的清洗与分析。设计分布式ETL流水线,采用MapReduce+Hive实现数据标准化处理,通过分区策略优化查询性能。开发ADS层动态报表系统,采用列式存储与缓存机制提升查询响应速度。建立数据质量监控体系,实现脏数据自动识别与告警功能。

项目二:新闻资讯分布式爬虫系统

基于Hadoop搭建分布式爬虫框架,采用Python实现多机并行的高并发采集。设计Kafka消息队列实现任务分发与结果聚合,通过Spark Streaming实时处理爬虫数据。优化采集策略提升页面下载效率,实现日均百万级新闻内容的存储与检索。开发数据分片算法提升系统横向扩展能力,支持业务量增长5倍的弹性扩容。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接