[北京/上海] llm/语音算法/多模态/推理/训练
一线大厂:字节、阿里、腾讯、快手、小红书等
大模型创业公司:百川、零一、月之暗面、minimax 等
地点:北京/上海
微信&电话:15210750729
邮箱: jxiao@hiringby.com
大模型算法专家
岗位职责
1.负责基于海量数据的 NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。
2.深入调研和关注大模型/多模态等方向的前沿技术
职位要求
1.参与或者领导过大规模预训练模型落地项目。
2.对预训练大模型充满热情,信仰 AGI 。
3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。
对齐算法工程师
1.负责大模型对齐算法相关技术研究,不断提升模型逻辑推理、数学、指令跟随、代码、Planning 、多轮对话等能力;
2.持续跟进业界最新的大模型对齐算法,参与大模型对齐算法的设计、训练、调优工作;
职位要求
1.硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上 NLP 相关经验;
2.熟练使用 pytorch/tensorflow 深度学习框架,熟练掌握 Transformer 框架;
3.对 LLM 有深入理解和实践,有 SFT 、RLHF 相关经验者优先;
4.较强的工程实现能力,熟练掌握 C/C++, JAVA,Python 等至少一种语言;
多模态算法工程师
职位描述
1.深入研究并探索视觉语言模型( VLM )、多模态大语言模型( MLLM )等尖端技术。跟踪多模态 AI 领域的最新技术动态,优化和改进现有技术和系统。
2.研究多模态模型的训练范式,探索更高效的结合范式,并以此为基础发表高价值论文。
3.探索多模态数据利用方式,对图文对, 图文交错等数据有更高效的使用方式。
职位要求
1.熟悉 Python, Linux, PyTorch 等深度学习必备知识,精通深度学习、机器学习、计算机视觉、自然语言处理的基本知识。
2.有在 ICLR 、ICCV 、CVPR 、ECCV 、NeurIPS 、ICML 、TPAMI 、ACL 、EMNLP 等国际顶级会议和期刊上发表成果的优先。
3.熟悉预训练算法的历史,熟悉对比学习,MAE 等大语言模型之前的预训练算法,有 Visual-Language Model 和大规模语言模型( LLMs )方面的经验者优先。
4.熟悉 Flamingo, Llava, Fuyu 等多模态大模型的基本原理与优劣,熟悉 MMMU, MathVista 等多模态评测方式
5.具备优秀的团队合作意识和沟通能力,出色的自我驱动和抗压能力,强烈的求知欲和技术热情,优秀的数据分析和逻辑思维能力。
6.对多模态模型如何提升当前语言模型能力有独到的见解
7.博士及以上学历(或者参与过出知名多模态项目的硕士)
加分项
1.在高影响力项目中做出过核心贡献者优先考虑。
视觉生成算法工程师
职位描述
1. 负责 AI 原生应用中的视觉内容生成模型等相关算法的研发和落地
2. 负责跟踪前沿图像和视频方向生成的前沿技术,并调用落地到应用
3. 参与多模态大模型的算法调研
职位要求
1. 硕士及以上学历,计算机科学、数学、人工智能等相关专业;
2. 熟练掌握 Python/C++/Go 等编程语言之一,具备良好的编程习惯;
3. 理解 Diffusion model ,Clip 等多模态/生成式模型原理,有实际实践经验者优先;
4. 良好的团队协作能力,善于沟通和解决问题;
5. 有相关领域论文发表或竞赛获奖者优先。
多模态语音算法工程师(语音合成 tts )
职位描述
1 、负责多模态大模型( Large Multimodality Model )的数据和模型开发。
2 、负责 voice generation 、text to speech 、voice clone 模型的开发和产品应用。
职位要求
1 、本科及以上学历,计算机科学/计算机工程/电子信息技术等相关专业;
2 、有自然语言处理、语音合成与识别、语音生成等研究或者技术背景优先;
3 、具备扎实的机器学习、深度学习和自然语言处理的理论基础。熟悉至少一种主流深度学习框架(如 TensorFlow 或 PyTorch )
4 、对主流的多模态语音大模型例如 VITS/VALL-E/LLAVA 等有深入的研究和理解。
分布式训练工程师
职位职责:
1. 设计和实现超大规模语言模型的分布式训练算法,并提高训练效率和稳定性。
2. 优化模型结构,提高模型的精度和泛化能力。
3. 调优训练数据,提高模型训练效果。
4. 跟踪业界最新技术发展,探索新的训练算法和模型优化方法。
职位要求:
1. 精通分布式训练算法,具备超大规模模型训练的实际经验。
2. 精通深度学习算法,熟悉至少一种主流深度学习框架(例如 PyTorch 或 TensorFlow )。
3. 熟悉常用的模型结构和优化方法,例如 CNN 、RNN 、BERT 、GPT 等。
4. 熟悉数据调优和数据增强等相关技术。
5. 具备优秀的编程和算法能力,熟练使用 Python 和 C++ 等编程语言。
6. 具备良好的沟通能力和团队协作能力,能够与跨部门团队进行有效沟通和协作。
推理研发工程师
岗位职责:
1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。
2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。
3. 负责 LLM 模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。
要求:
1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。
2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。
3. 熟悉常见的深度学习框架,如 TensorFlow 、PyTorch 等,并能够根据业务需求进行算法实现和调试。
4. 熟悉 LLM 相关的算法技术以及推理加速方法。
5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。
大模型创业公司:百川、零一、月之暗面、minimax 等
地点:北京/上海
微信&电话:15210750729
邮箱: jxiao@hiringby.com
大模型算法专家
岗位职责
1.负责基于海量数据的 NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。
2.深入调研和关注大模型/多模态等方向的前沿技术
职位要求
1.参与或者领导过大规模预训练模型落地项目。
2.对预训练大模型充满热情,信仰 AGI 。
3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。
对齐算法工程师
1.负责大模型对齐算法相关技术研究,不断提升模型逻辑推理、数学、指令跟随、代码、Planning 、多轮对话等能力;
2.持续跟进业界最新的大模型对齐算法,参与大模型对齐算法的设计、训练、调优工作;
职位要求
1.硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上 NLP 相关经验;
2.熟练使用 pytorch/tensorflow 深度学习框架,熟练掌握 Transformer 框架;
3.对 LLM 有深入理解和实践,有 SFT 、RLHF 相关经验者优先;
4.较强的工程实现能力,熟练掌握 C/C++, JAVA,Python 等至少一种语言;
多模态算法工程师
职位描述
1.深入研究并探索视觉语言模型( VLM )、多模态大语言模型( MLLM )等尖端技术。跟踪多模态 AI 领域的最新技术动态,优化和改进现有技术和系统。
2.研究多模态模型的训练范式,探索更高效的结合范式,并以此为基础发表高价值论文。
3.探索多模态数据利用方式,对图文对, 图文交错等数据有更高效的使用方式。
职位要求
1.熟悉 Python, Linux, PyTorch 等深度学习必备知识,精通深度学习、机器学习、计算机视觉、自然语言处理的基本知识。
2.有在 ICLR 、ICCV 、CVPR 、ECCV 、NeurIPS 、ICML 、TPAMI 、ACL 、EMNLP 等国际顶级会议和期刊上发表成果的优先。
3.熟悉预训练算法的历史,熟悉对比学习,MAE 等大语言模型之前的预训练算法,有 Visual-Language Model 和大规模语言模型( LLMs )方面的经验者优先。
4.熟悉 Flamingo, Llava, Fuyu 等多模态大模型的基本原理与优劣,熟悉 MMMU, MathVista 等多模态评测方式
5.具备优秀的团队合作意识和沟通能力,出色的自我驱动和抗压能力,强烈的求知欲和技术热情,优秀的数据分析和逻辑思维能力。
6.对多模态模型如何提升当前语言模型能力有独到的见解
7.博士及以上学历(或者参与过出知名多模态项目的硕士)
加分项
1.在高影响力项目中做出过核心贡献者优先考虑。
视觉生成算法工程师
职位描述
1. 负责 AI 原生应用中的视觉内容生成模型等相关算法的研发和落地
2. 负责跟踪前沿图像和视频方向生成的前沿技术,并调用落地到应用
3. 参与多模态大模型的算法调研
职位要求
1. 硕士及以上学历,计算机科学、数学、人工智能等相关专业;
2. 熟练掌握 Python/C++/Go 等编程语言之一,具备良好的编程习惯;
3. 理解 Diffusion model ,Clip 等多模态/生成式模型原理,有实际实践经验者优先;
4. 良好的团队协作能力,善于沟通和解决问题;
5. 有相关领域论文发表或竞赛获奖者优先。
多模态语音算法工程师(语音合成 tts )
职位描述
1 、负责多模态大模型( Large Multimodality Model )的数据和模型开发。
2 、负责 voice generation 、text to speech 、voice clone 模型的开发和产品应用。
职位要求
1 、本科及以上学历,计算机科学/计算机工程/电子信息技术等相关专业;
2 、有自然语言处理、语音合成与识别、语音生成等研究或者技术背景优先;
3 、具备扎实的机器学习、深度学习和自然语言处理的理论基础。熟悉至少一种主流深度学习框架(如 TensorFlow 或 PyTorch )
4 、对主流的多模态语音大模型例如 VITS/VALL-E/LLAVA 等有深入的研究和理解。
分布式训练工程师
职位职责:
1. 设计和实现超大规模语言模型的分布式训练算法,并提高训练效率和稳定性。
2. 优化模型结构,提高模型的精度和泛化能力。
3. 调优训练数据,提高模型训练效果。
4. 跟踪业界最新技术发展,探索新的训练算法和模型优化方法。
职位要求:
1. 精通分布式训练算法,具备超大规模模型训练的实际经验。
2. 精通深度学习算法,熟悉至少一种主流深度学习框架(例如 PyTorch 或 TensorFlow )。
3. 熟悉常用的模型结构和优化方法,例如 CNN 、RNN 、BERT 、GPT 等。
4. 熟悉数据调优和数据增强等相关技术。
5. 具备优秀的编程和算法能力,熟练使用 Python 和 C++ 等编程语言。
6. 具备良好的沟通能力和团队协作能力,能够与跨部门团队进行有效沟通和协作。
推理研发工程师
岗位职责:
1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。
2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。
3. 负责 LLM 模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。
要求:
1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。
2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。
3. 熟悉常见的深度学习框架,如 TensorFlow 、PyTorch 等,并能够根据业务需求进行算法实现和调试。
4. 熟悉 LLM 相关的算法技术以及推理加速方法。
5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。