招大模型算法工程师(微调方向)

没实战经验也没关系,让我们看到你的热情和好奇心,比如玩过 unsloth 等等。 我们自己的算力中心的 B200 嗷嗷待哺等着训练任务,欢迎来聊

公司背景:公司是一家能源企业,包含风力光伏发电、抽水蓄能和生物质发电等发电形式。在此基础之上,以投资和研发人工智能基础设施为主,也有自己的算力中心。AI 团队主要来自大模型公司以及阿里字节腾讯等互联网企业,所以对于大部分互联网行业的小伙伴,不用担心企业风格不适。 工作地点:北京-东城 薪资:请面聊前先沟通清楚,以免浪费候选人时间。 工作时长:公司除了 AI 部门之外是早九晚五制,但 AI 部门目前为止没有晚于过 19:30 ,对于加班情况请面聊前先沟通清楚,以免浪费候选人时间。 简历投递: huangrenxun2000@outlook.com

岗位职责: 1 、负责能源和算力领域大模型的微调、优化,提升模型在具体任务上的性能和泛化能力。 2 、参与训练的数据构建及质量评估方案设计,确保训练数据的有效性。 3 、参与模型评估指标和方案设计,分析模型表现和设计改进方法。 4 、研究并应用主流的模型微调技术及强化学习方法(如 PPO 、DPO 等)进行模型创新性改进; 5 、熟悉模型 infra 基础知识,与相关团队紧密协作,共同推动模型训练能力提升和推理加速。

任职要求: 1 、本科及以上学历,人工智能、计算机科学等相关专业; 2 、扎实掌握深度学习理论基础,熟悉大模型的底层原理; 3 、熟练掌握至少一种深度学习框架,具备一些模型训练与调优经验; 4 、良好的编程能力和工程实现能力,熟练使用 Python ,有良好的代码规范; 5 、熟悉常见的大模型微调技术以及强化学习相关算法; 6 、熟悉数据预处理流程,包括数据清洗、标注、格式转换、语料构建等; 7 、熟悉模型基础架构设计和具备相关优化经验者优先; 8 、有开源项目贡献经历或大型模型训练调优实战经验者优先;

来源:https://v2ex.com/t/1143918