综合介绍

 

InstantID是一项先进的技术,专注于利用单张参考身份证图片,在几秒钟内生成具有个性化风格或姿态的图像,同时确保高度保真。该技术采用了基于扩散模型的解决方案,通过集成面部图片、地标图片与文本提示,精准引导图像生成过程。主要特点包括高保真度图像生成、与流行的预训练文本到图像扩散模型兼容,无需大量微调或多个参考图像即可使用,并且具备高面部保真度与文本的编辑能力。

 

InstantID 是一种新的最先进的免调整方法,只需单个图像即可实现 头像特征ID 保留生成,支持各种下游任务。只需一张照片克隆面部,并使用提示词生成相同面部的不同风格图片。

 

InstantID

 

InstantID

 

InstantID

 

 

功能列表

 

利用单张面部图像生成不同风格的图像
保持高保真度图像生成
兼容流行的预训练文本到图像扩散模型
无需大量微调或多个参考图像
保持高面部保真度和文本的编辑能力
在重要性保持真实身份的实际应用中发挥巨大价值

 

 

使用帮助

 

上传人物图像。对于多张人物图像,我们只会检测最大的人脸。确保脸部不会太小,也不会明显遮挡或模糊。
(可选)上传另一张人物图片作为参考姿势。如果没有上传,我们将使用第一张人物图像提取地标。如果在步骤 1 中使用的是裁剪过的人脸,建议将其上传以提取新的姿势。
输入文本提示,就像普通文本到图像模型一样。
点击提交按钮开始自定义。

用户需要提供单张参考身份证图片
可以选择不同的风格和姿态进行个性化图像生成
无需进行测试时微调或收集多个图像进行微调
生成的图像可以直接与流行的预训练模型和控制网络融合使用
支持身份属性到非人类角色的灵活添加

 

 

ComfyUI实现方案

 

选择 SDXL 基础底座。您还可以尝试 SDXL Turbo 的 4 个步骤,对于快速测试非常有效。

首次加载通常需要60秒以上,但节点会尽力缓存模型。

https://github.com/huxiuhan/ComfyUI-InstantID

相关导航