我们提出Tokenverse-一种多概念个性化的方法,利用了预先训练的文本对图像扩散模型。我们的框架可以将复杂的视觉元素和属性从单个图像中删除,同时可以从多个图像中提取的概念的无缝插件生成。与现有作品相反,Tokenverse可以处理各个具有多个概念的图像,并支持广泛的概念,包括对象,配件,材料,姿势和照明 ...
2D卡通风格是数字角色创作中的一种突出艺术形式,尤其受到年轻观众的欢迎。虽然数字人类技术的进步激发了对逼真数字人类和 3D 角色的广泛研究,但交互式 2D 卡通角色受到的关注相对较少。与需要复杂构造和资源密集型渲染的 3D 同行不同,Live2D(一种广泛使用的 2D 卡通人物格式)提供了更有效的替代方案,它允许以模拟 3D 运动的方式制作 2D 角色动画,而无需构建一个完整的3D模型 ...
MangaNinjia 源自扩散模型,专门从事参考引导的线条艺术着色任务。我们采用了两种深思熟虑的设计来确保精确的字符细节转录,包括一个补丁改组模块,以促进参考彩色图像和目标线条艺术之间的对应学习,以及一个点驱动控制方案,以实现细粒度的颜色匹配。在自行收集的基准上进行的实验证明了我们的模型在精确着色方面优于当前解决方案 ...
检测有益的特征交互在推荐系统中至关重要,现有方法通过检查所有可能的特征交互来实现这一点。然而,检查所有可能的高阶特征交互的成本是令人望而却步的(随着阶数的增加呈指数增长)。因此,现有的方法只能检测有限的顺序(例如 ...
合成满足用户需求的视觉内容通常需要对生成对象的姿势、形状、表情和布局进行灵活而精确的控制。现有方法通过手动注释的训练数据或先前的 3D 模型来获得生成对抗网络 (GAN) 的可控性,但这些方法通常缺乏灵活性、精确性和通用性。在这项工作中,我们研究了一种强大但较少探索的控制 GAN 的方法,即以用户交互的方式“拖动”图像的任何点以精确到达目标点,如图 1 所示 ...
将定制文本对象合并到图像生成中在到图像生成中呈现出一个威胁的功能。然而,现有的基于优化和基于编码器的方法存在优化运行、身份保存不足以及普遍存在的复制粘贴为了克服这些限制,我们引入了 CustomNet,这是一种新颖的对象定制方法,它显着地将 3D 新颖视图合成功能合并到对象定制过程中...... ...
通过文本反转、DreamBooth和LoRA等方法,个性化图像合成取得了重大进展。然而,它们在现实世界中的适用性受到高感官需求、冗长的音响过程以及对多个参考图像需求的阻碍。 ,现有的基于 ID 嵌入的方法虽然只需要一次前向推理,但也面临着挑战:它们或者需要对群体模型参数进行广泛的参数,或者缺乏与社区预训练模型的兼容性,或者无法保持较高的兼容性脸部保真度... ...