技能标签
专业技能
精通SQL(查询优化/窗口函数/存储过程/复杂关联查询)、Python(Pandas/NumPy/PySpark)、Shell/Bash自动化脚本开发。熟悉Java/Scala在Spark/Flink开发中的应用。掌握MySQL/PostgreSQL/Oracle/TiDB等关系型数据库,ClickHouse/Greenplum列式数据库,MongoDB/Redis/HBase等NoSQL技术。具备Hive/Doris/StarRocks数据仓库建模能力。擅长DataX/Sqoop/Kettle等ETL工具,熟悉Airflow/DolphinScheduler调度体系。精通Flink/Spark Streaming实时计算框架,掌握Tableau/Power BI/FineReport等BI工具。熟悉数据清洗/标准化/脱敏/加密等数据治理技术。
工作履历(脱敏处理)
主导某连锁摄影品牌数据中台建设,设计四层数据仓库架构,完成30+主题域建模。开发实时营销触达系统,实现订单/支付/会员行为秒级统计。优化Flink任务内存配置,解决数据倾斜问题,处理延迟从30秒降至3秒。搭建ClickHouse分析平台,通过分区键/排序键优化使查询性能提升10倍。开发30+核心报表及管理层看板,建立自助取数平台,业务人员数据获取时间缩短至10分钟。构建数据质量监控体系,确保数据准确性达99.9%。
项目经验(脱敏处理)
某连锁摄影品牌数据中台建设:
技术架构:
- 数据采集层:采用Canal实现MySQL binlog实时采集,DataX进行离线全量/增量同步
- 消息队列:搭建Kafka集群处理实时数据流,日均处理消息量5000万+
- 实时计算:基于Flink构建实时统计系统,实现订单/支付/会员行为秒级分析
- 离线计算:使用Spark完成T+1离线数仓建模和指标计算
- 存储层:TiDB作为OLTP主库,ClickHouse作为OLAP分析库
- 数据应用:基于Superset和FineReport构建可视化报表体系
核心成果:
1. 设计四层数据仓库架构,建立30+主题域数据模型,实现拉链表管理会员画像历史变化,存储空间节省40%
2. 开发实时营销触达系统,识别高价值客户行为并实时推送优惠券,构建实时门店销售大屏,5秒内更新全国门店实时GMV
3. 优化Flink任务内存配置,解决数据倾斜问题,处理延迟从30秒降至3秒
4. 开发100+ ETL任务,通过分区裁剪/索引优化使核心报表查询性能提升60%
5. 设计增量更新策略,将每日全量同步改为增量同步,数据处理时间从4小时缩短至1小时
6. 实现ClickHouse冷热数据分离存储,降低存储成本35%
7. 开发30+核心报表及管理层看板,建立自助取数平台,业务人员数据获取时间从2天缩短至10分钟
8. 通过数据驱动运营,实现会员复购率提升25%,营销ROI提升40%
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
5年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接