大模型评估与环境工程师-Commercial AI

ByteDance

北京

方向：

算法, 研发

发布日期：

2026-01-13

初次查询：

2026-01-14

最新刷新：

2026-01-14

状态：

开放中

职位描述

1、将电商、广告、本地生活等业务流程抽象为可交互环境（State/Action/Reward），构建评估用业务沙箱； 2、设计并实现大模型/Agent 自动评测流水线：任务编排、模型调用、日志采集、打分与报表； 3、工程化落地LLM-As-A-Judge、自动Red-Teaming（攻防评估）、风险检测等组件，保证稳定性、成本与吞吐； 4、对接推荐/广告平台/商家后台/风控等内部系统，将评估纳入模型研发与上线流程； 5、与算法研究员、其他算法团队及业务团队协作，共同优化评估覆盖度、效率与可解释性。

任职要求

1、计算机相关专业或同等工程经验，2年以上工程 / 算法工程经验（后端/数据/算法均可）； 2、熟练使用Python，有构建服务/平台/Pipeline经验； 3、有使用大语言模型/Agent构建应用的经验，不强制年限，但至少有1–2个完整落地项目（公司、个人或开源均可）； 4、具备良好的系统设计与代码质量意识，重视可观测性（日志、监控、告警）； 5、有推荐/广告/电商/交易等业务经验者优先，有安全/Red-Teaming/风控经验优先，在LLM/Agent上有突出项目或开源成果优先。

立即投递