技能标签
专业技能
精通Python/Shell/C语言,熟悉Kaldi、ESPnet、Wenet等语音识别平台,掌握PyTorch框架及DNN、RNN、Transformer、Conformer、BERT等深度学习模型。具备数据预处理、特征提取、语言模型构建、声学模型开发及模型解码测试能力。熟悉BERT等预训练模型在实体识别、分类及机器翻译中的应用,擅长大数据处理、数据爬取、统计分析及分类算法(如K-means、EM)。
工作履历(脱敏处理)
主导小语种语音识别系统开发,完成数据预处理、特征提取、声学模型训练及语言模型优化。设计基于Transformer的标点符号恢复模型,实现F1分数提升。构建多语言ASR测试集,完成7.5万条文本生成及100小时语音数据合成。开发端到端语音识别系统,集成CTC、Attention等算法,实现模型性能提升。优化BERT预训练模型,提升语义理解能力。完成模型转换(PyTorch→ONNX)及性能评估,支持实际业务场景部署。
项目经验(脱敏处理)
小语种语音识别标点符号恢复:构建基于Transformer的分类模型,采用BPE算法训练子词模型,实现F1分数优化。开发BERT预训练模型微调方案,提升语义理解能力。小语种语音识别系统:完成4.5GB文本数据处理,构建6.5GB训练集及5小时测试集。开发声学模型(Conformer)及语言模型(4-gram),实现困惑度190及OOV率优化。多任务学习语音识别系统:对比GMM/DNN-HMM与端到端模型性能,验证语言模型对解码效果的提升。端到端语音识别系统:完成数据预处理、特征提取、模型训练及性能评估,实现模型转换与部署。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
1年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接