王明 | 高级数据挖掘工程师 | 5年经验
📱
(+86) 189-xxxx-xxxx | 📧
wangming@email.com | 📍
深圳市
💻
GitHub | 👔
LinkedIn
💼 工作经历
科技前沿集团 | 高级数据挖掘工程师
📅
2021.06 - 至今
核心贡献:
- 主导建立公司AI中台,整合10+业务线数据资源,支撑日均5亿+数据处理
- 研发自适应特征工程框架,特征生成效率提升3倍,减少人工特征工程工作量70%
- 设计模型健康监测系统,关键业务模型异常响应时间缩短至<15分钟
智能未来科技 | 数据挖掘工程师
📅
2018.09 - 2021.05
核心贡献:
- 构建电商实时推荐系统,CTR提升25%,年度GMV增长¥2800万
- 开发用户流失预警模型,准确率92%,年挽留高价值用户38,000+
- 搭建AB测试平台,支持全公司200+团队实验需求,决策效率提升60%
🚀 核心项目经历
金融风控智能决策系统 | 技术负责人
🔧
Python/Scala/XGBoost/Spark/Flink/Graph Neural Networks
📅
2022.03 - 2023.01
业务挑战:传统风控模型覆盖不全,坏账率持续攀升
解决方案:
- 融合交易、行为、关系网络数据构建三层防御体系
- 创新应用时间滑动窗口特征提取算法,捕捉动态风险模式
- 开发基于异构图的关联风险挖掘模块,识别团伙欺诈
技术成果:
▶️ KS值0.46,坏账率降低32%
▶️ 日均处理60万+请求,自动化审批率提升至85%
▶️ 年节约风控成本¥3000万+,获公司年度最佳项目奖
医疗AI影像诊断平台 | 算法负责人
🔧
PyTorch/TensorRT/Docker/Kubernetes/Medical Image Processing
📅
2021.08 - 2022.09
业务挑战:医疗影像诊断效率低,三甲医院平均阅片时间>20分钟
解决方案:
- 设计多尺度特征融合CNN架构,增强微小病灶识别能力
- 开发数据增强流水线,解决医疗数据稀缺问题
- 实现模型蒸馏压缩技术,推理速度提升5倍
技术成果:
▶️ 肺部CT结节检测召回率96.5%,假阳性率降低40%
▶️ 系统响应时间<3秒,日均处理量1.2万+影像
▶️ 在8家三甲医院应用,诊断效率提升200%
智慧零售需求预测系统 | 核心架构师
🔧
Prophet/LSTM/Transformer/AWS SageMaker/Airflow
📅
2020.03 - 2021.02
业务挑战:零售商品预测准确率仅65%,库存周转效率低下
解决方案:
- 融合多源数据(天气、促销、社交媒体)构建时空预测模型
- 开发分层预测框架,实现SKU-门店粒度的精准预测
- 搭建自适应权重调整模块,应对突发事件影响
技术成果:
▶️ 预测准确率提升至92%,库存周转率提高40%
▶️ 覆盖3万+SKU,减少滞销损失¥1500万/年
▶️ 预测计算时间从小时级缩短至分钟级
🎓 教育背景
南京大学 | 计算机科学与技术 | 硕士
📅
2015.09 - 2018.06 | GPA 3.7/4.0
东南大学 | 数学与应用数学 | 学士
📅
2011.09 - 2015.06 | GPA 3.6/4.0
🛠️ 技术栈
算法建模
▶ 精通:XGBoost/LightGBM, CNN/Transformer, GNN, 集成学习
▶ 熟练:概率图模型, 时间序列分析, 异常检测, 强化学习
工程架构
▶ 大数据:Spark(调优专家), Flink, Kafka, Hive
▶ 云平台:AWS(SageMaker, EMR), 阿里云(MaxCompute, PAI)
▶ MLOps:MLflow, Kubeflow, Airflow, Docker/K8s
数据工程
▶ 特征工程:Feature Store设计, 自动化特征生成
▶ 模型部署:TensorFlow Serving, ONNX, 模型蒸馏优化
▶ 可视化:Tableau, Streamlit, Plotly
🏆 专业成就
专利技术
▶ 多模态数据融合分析系统(专利号:ZL20201012345.6)
▶ 实时特征计算引擎架构(专利号:ZL20211098765.4)
竞赛荣誉
▶ Kaggle:贷款风险预测金牌(Top 0.8%)、住房估价大赛银牌(Top 1.2%)
▶ 天池:医疗AI诊断竞赛全国亚军、电商销量预测季军
技术认证
▶ AWS机器学习专家认证 | Google云数据工程师 | TensorFlow开发者认证
✨ 自我评价
五年深耕商业智能领域的数据挖掘专家,专注解决高复杂度业务场景中的数据挑战。核心优势:
- 全链路能力:从数据探索→算法研发→系统部署的全流程落地经验
- 工程化思维:注重方案可扩展性,主导构建3个日均亿级处理量的数据系统
- 业务敏感度:善于将业务需求转化为技术方案,累计创造商业价值超¥6000万
- 技术创新:持有2项专利技术,8次获得公司级技术突破奖
📌 其他
- 技术布道:在QCon、AICon等技术大会做主题分享5次
- 开源贡献:维护PySpark优化工具集(GitHub 600+ stars)
- 专业写作:技术专栏「工业级AI实战」作者,读者超3万人
- 语言能力:英语流利(TOEIC 950),可全英文技术沟通