LongCat - 大模型推理 AI 工程师(多方向)

美团
北京市, 上海市
核心本地商业-基础研发平台
方向:
算法
发布日期:
2026-05-29
首次查询:
2026-05-29
最新刷新:
2026-05-29
状态:
开放中
职位描述
1.负责大模型推理引擎的研发和优化,包括推理系统优化、模型量化压缩和模型部署; 2.负责开发和维护基于大规模数据的推理引擎; 3.参与解决推理过程中的技术难题,提升推理算法的性能和效果; 4.开展相关领域的技术研究,提出创新性的解决方案。
任职要求
1.大学本科及以上学历,计算机相关专业优先; 2.至少3年以上软件开发经验,有推理引擎开发经验者优先考虑; 3. 熟练掌握C++、CUDA编程,熟悉常见的数据结构和算法; 4. 熟悉机器学习和深度学习理论,具备扎实的编程能力,熟悉Transformer结构优化者优先; 5. 熟悉常用的深度学习框架,如TensorFlow、PyTorch等,熟悉以下推理框架者优先sglang/vllm、FasterTransformer、DeepSpeed FastGen、TensorRT-LLM等; 6. 具备良好的团队合作精神和沟通能力,能够承担一定的工程管理职责。