职位描述
1、代码全链路训练:包括pretrain、midtrain、SFT、RL等环节,持续提升模型在代码生成、代码理解、代码修复等方向的能力边界。
2、高质量数据建设:构建高质量Coding数据生产、数据配比与数据质量评估体系,覆盖软件工程任务、仓库级代码生成、终端任务、Web开发等方向,推动模型能力持续演进。
3、Coding 强化学习:构建面向 Coding 场景的大规模 RL 训练体系,研究 Reward Design、Self-Improvement 等关键技术,提升模型在真实任务中的稳定性与泛化能力。
4、长上下文与 Repo-Level 建模:研究超长上下文代码建模、多文件关联理解、仓库级知识记忆与代码结构建模能力,提升模型对复杂大型项目的理解和生成能力。