job.title - job.companyName

大模型语音算法工程师

Didi

北京

L Lab

方向：

技术

发布日期：

2025-11-29

初次查询：

2025-11-29

最新刷新：

2025-11-29

状态：

开放中

职位描述

1. 参与语音大模型应用研发与落地 2. 参与语音全双工语音交互、包含打断、拒识、判停 3. 参与语音理解、语音生成、语音端到端等大模型效果优化

任职要求

1、熟悉主流语音合成框架（如 CoSyVoice、F5、Bert-VITS、GPT-SoVITS 等），并具备实际调优经验。 2、熟悉常见音频表征模型（hubert / best-rq 、wav2bert2.0）、有小语种方言落地经验优先、 3、具备大规模语音预训练、后训练（Post-training）经验，熟悉数据增强、模型微调等技术。 4、在语音合成（TTS）、语音识别（ASR）、端到端语音大模型、语音唤醒、前端信号、VAD 至少一个方向有落地经历 5、在 ICASSP、Interspeech、NeurIPS 等顶会发表过相关论文，或参与过开源语音项目贡献优先。

立即投递