个性签名 ...
大规模文本到图像的扩散模型取得了惊人的进步。然而,现状是单独使用文本输入,这会妨碍可控性。在这项工作中,我们提出了 GLIGEN(接地语言到图像生成),这是一种基于现有预训练文本到图像扩散模型并扩展其功能的新颖方法,使它们也能够以接地输入为条件 ...
大规模文本到图像的扩散模型取得了惊人的进步。然而,现状是单独使用文本输入,这会妨碍可控性。在这项工作中,我们提出了 GLIGEN(接地语言到图像生成),这是一种基于现有预训练文本到图像扩散模型并扩展其功能的新颖方法,使它们也能够以接地输入为条件 ...