二次元视频与图像生成
来打个广告:
这是一个研究将深度学习技术用于二次元视频与图像生成已有十年时间的团队。和大家不一样的地方是,我们不得不承认,我们在我们自己的研究方向上目前还真的很菜。
简单来说是这样的:我们目前在这个方向上做到真正能用的顶会文章数量为 0 。我们在 2014 年曾中二病地模仿李飞飞搞了个二次元的 imagenet ,最后发现试遍各种模型都无力 fit 它。我们在 2020 年凭空捏造了“ai 动画”“可控性”“一致性”这些词,最后发现只能用来糊弄我们自己。我们曾经的一个合作者每天做梦都在想着有一天能像 lvmin 一样发一篇 cvpr ,还嚷嚷过要改名 kaiming he 去蹭热度。哦,有趣的事实是,我和另外几个稍微更理解一原和 layout 的区别的同学可能都没听说过 cvpr 。
然而,有不可忽略的概率是,这个团队是在过去十年里起起落落的风口中所剩不多的还依然在对这个目标执着努力着的团队。这应该是 feature ,不是 bug 。
如果你正在对二次元 gt 总量将在有生之年因为人口增长放缓、内卷、经济下行、战争、人类之间无法互相理解等原因而停滞于一个定值但三次元数据还可以预期速度继续膨胀这个猜想产生过焦虑,渴望通过统计学方法理解二次元和三次元的本质区别,希望探索出逼近或超越内插法所能带来的“魔法程度极限”但仍可在硅基和碳基计算机上协同运转的算法,好奇过 scale up 二次元世界的问题是不是一个“AGI-Complete 问题”,愿意“像 2012 年的人笑话 alexnet 是伪科学,像 2018 年的人笑话 gpt 是复读机”那样被世人嘲笑的话,请加入我们的冒险:
1149496649@qq.com (这不是我的邮箱,是我朋友的。别和她说我在广告里写了什么,毕竟广告嘛,还是要追求那种瞳孔地震的效果,都往大家熟知的那个味道包装,我们很强,很有钱,这个已经没有 novelty 了)
哦,其实我们是有一个 gpt 生成的 jd ,但是我觉得那种东西吧,随便写写就得了,也不会真的有人看的,对吧喵?
一、动漫视频生成大模型
职位描述
1 、探索辅助动漫制作的视频生成基础模型的最优的模型架构和最佳的训练方法。
2 、探索数据打标工具开发、质量微调和效果迭代。
职位要求
1 、有视频/图像的生成与理解领域的研究经验,并对相关工作有深刻的理解;
2 、优秀的代码能力,熟练掌握 pytorch ,能在较短时间内独立复现论文算法,并且能有针对性地优化;
3 、优秀的团队合作能力和持续学习能力,能在团队合作中高效推进项目进展;
加分项:
1 、深入理解 diffusion models 、image/video latent method 、transformer scaling up 、GAN 等方法 ;
2 、理解手绘动漫制作流程和数据形式,熟悉卡通风格补间动画,上色方法;
3 、具有 GPU CUDA 开发和性能优化经验
4 、有 CV 、ML 相关论文,或 GitHub 高影响力项目优先。
二、3D 模型(人物与场景)生成与卡通渲染
岗位职责:
1 、结合计算机图形学和计算机视觉领域技术,研发 3D 模型生成、纹理精细化、几何编辑等;
2 、在图形学领域跟踪学术和产业前沿方案,持续构建三维生成领域的技术竞争力;
任职要求:
1 、有扎实的图形学基础;
2 、了解机器学习与深度学习的基本理论,熟悉 C++/C#/Python 语言;
加分项:
1 、熟悉三渲二模型的基本要求和卡通渲染基本原理,了解程序化模型生成或编辑(例如 blender 几何节点等)即卡通特效制作(刀光,草,水);
2 、有 Blender 、Unity 、UE 等引擎的 API 开发经验,理解渲染管线中的 GPU 编程原理;
3 、熟悉 triplane,gaussian,nerf 等 3d 表示,或有相关领域顶级学术会议/期刊论文发表经历,如 SIGGRAPH 、SIGGRAPH Aisa 、TOG 等,或有 GitHub 高影响力开源项目经历。
这是一个研究将深度学习技术用于二次元视频与图像生成已有十年时间的团队。和大家不一样的地方是,我们不得不承认,我们在我们自己的研究方向上目前还真的很菜。
简单来说是这样的:我们目前在这个方向上做到真正能用的顶会文章数量为 0 。我们在 2014 年曾中二病地模仿李飞飞搞了个二次元的 imagenet ,最后发现试遍各种模型都无力 fit 它。我们在 2020 年凭空捏造了“ai 动画”“可控性”“一致性”这些词,最后发现只能用来糊弄我们自己。我们曾经的一个合作者每天做梦都在想着有一天能像 lvmin 一样发一篇 cvpr ,还嚷嚷过要改名 kaiming he 去蹭热度。哦,有趣的事实是,我和另外几个稍微更理解一原和 layout 的区别的同学可能都没听说过 cvpr 。
然而,有不可忽略的概率是,这个团队是在过去十年里起起落落的风口中所剩不多的还依然在对这个目标执着努力着的团队。这应该是 feature ,不是 bug 。
如果你正在对二次元 gt 总量将在有生之年因为人口增长放缓、内卷、经济下行、战争、人类之间无法互相理解等原因而停滞于一个定值但三次元数据还可以预期速度继续膨胀这个猜想产生过焦虑,渴望通过统计学方法理解二次元和三次元的本质区别,希望探索出逼近或超越内插法所能带来的“魔法程度极限”但仍可在硅基和碳基计算机上协同运转的算法,好奇过 scale up 二次元世界的问题是不是一个“AGI-Complete 问题”,愿意“像 2012 年的人笑话 alexnet 是伪科学,像 2018 年的人笑话 gpt 是复读机”那样被世人嘲笑的话,请加入我们的冒险:
1149496649@qq.com (这不是我的邮箱,是我朋友的。别和她说我在广告里写了什么,毕竟广告嘛,还是要追求那种瞳孔地震的效果,都往大家熟知的那个味道包装,我们很强,很有钱,这个已经没有 novelty 了)
哦,其实我们是有一个 gpt 生成的 jd ,但是我觉得那种东西吧,随便写写就得了,也不会真的有人看的,对吧喵?
一、动漫视频生成大模型
职位描述
1 、探索辅助动漫制作的视频生成基础模型的最优的模型架构和最佳的训练方法。
2 、探索数据打标工具开发、质量微调和效果迭代。
职位要求
1 、有视频/图像的生成与理解领域的研究经验,并对相关工作有深刻的理解;
2 、优秀的代码能力,熟练掌握 pytorch ,能在较短时间内独立复现论文算法,并且能有针对性地优化;
3 、优秀的团队合作能力和持续学习能力,能在团队合作中高效推进项目进展;
加分项:
1 、深入理解 diffusion models 、image/video latent method 、transformer scaling up 、GAN 等方法 ;
2 、理解手绘动漫制作流程和数据形式,熟悉卡通风格补间动画,上色方法;
3 、具有 GPU CUDA 开发和性能优化经验
4 、有 CV 、ML 相关论文,或 GitHub 高影响力项目优先。
二、3D 模型(人物与场景)生成与卡通渲染
岗位职责:
1 、结合计算机图形学和计算机视觉领域技术,研发 3D 模型生成、纹理精细化、几何编辑等;
2 、在图形学领域跟踪学术和产业前沿方案,持续构建三维生成领域的技术竞争力;
任职要求:
1 、有扎实的图形学基础;
2 、了解机器学习与深度学习的基本理论,熟悉 C++/C#/Python 语言;
加分项:
1 、熟悉三渲二模型的基本要求和卡通渲染基本原理,了解程序化模型生成或编辑(例如 blender 几何节点等)即卡通特效制作(刀光,草,水);
2 、有 Blender 、Unity 、UE 等引擎的 API 开发经验,理解渲染管线中的 GPU 编程原理;
3 、熟悉 triplane,gaussian,nerf 等 3d 表示,或有相关领域顶级学术会议/期刊论文发表经历,如 SIGGRAPH 、SIGGRAPH Aisa 、TOG 等,或有 GitHub 高影响力开源项目经历。