IT人力外包人才简历库

返回列表

大数据开发工程师

驻场外包人员
工作年限:5年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

SQL优化 Python数据分析 Flink实时计算 Spark批处理 数据仓库建模 ETL开发 BI可视化 数据治理 消息队列 数据脱敏

专业技能

精通SQL(查询优化/窗口函数/存储过程/复杂关联查询)、Python(Pandas/NumPy/PySpark)、Shell/Bash自动化脚本开发。熟悉Java/Scala在Spark/Flink开发中的应用。掌握MySQL/PostgreSQL/Oracle/TiDB等关系型数据库,ClickHouse/Greenplum列式数据库,MongoDB/Redis/HBase等NoSQL技术。具备Hive/Doris/StarRocks数据仓库建模能力。擅长DataX/Sqoop/Kettle等ETL工具,熟悉Airflow/DolphinScheduler调度体系。精通Flink/Spark Streaming实时计算框架,掌握Tableau/Power BI/FineReport等BI工具。熟悉数据清洗/标准化/脱敏/加密等数据治理技术。

工作履历(脱敏处理)

主导某连锁摄影品牌数据中台建设,设计四层数据仓库架构,完成30+主题域建模。开发实时营销触达系统,实现订单/支付/会员行为秒级统计。优化Flink任务内存配置,解决数据倾斜问题,处理延迟从30秒降至3秒。搭建ClickHouse分析平台,通过分区键/排序键优化使查询性能提升10倍。开发30+核心报表及管理层看板,建立自助取数平台,业务人员数据获取时间缩短至10分钟。构建数据质量监控体系,确保数据准确性达99.9%。

项目经验(脱敏处理)

某连锁摄影品牌数据中台建设:

技术架构:

- 数据采集层:采用Canal实现MySQL binlog实时采集,DataX进行离线全量/增量同步

- 消息队列:搭建Kafka集群处理实时数据流,日均处理消息量5000万+

- 实时计算:基于Flink构建实时统计系统,实现订单/支付/会员行为秒级分析

- 离线计算:使用Spark完成T+1离线数仓建模和指标计算

- 存储层:TiDB作为OLTP主库,ClickHouse作为OLAP分析库

- 数据应用:基于Superset和FineReport构建可视化报表体系

核心成果:

1. 设计四层数据仓库架构,建立30+主题域数据模型,实现拉链表管理会员画像历史变化,存储空间节省40%

2. 开发实时营销触达系统,识别高价值客户行为并实时推送优惠券,构建实时门店销售大屏,5秒内更新全国门店实时GMV

3. 优化Flink任务内存配置,解决数据倾斜问题,处理延迟从30秒降至3秒

4. 开发100+ ETL任务,通过分区裁剪/索引优化使核心报表查询性能提升60%

5. 设计增量更新策略,将每日全量同步改为增量同步,数据处理时间从4小时缩短至1小时

6. 实现ClickHouse冷热数据分离存储,降低存储成本35%

7. 开发30+核心报表及管理层看板,建立自助取数平台,业务人员数据获取时间从2天缩短至10分钟

8. 通过数据驱动运营,实现会员复购率提升25%,营销ROI提升40%

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

5年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接