Si quieres hacer imágenes usa Stable diffusion
Lo mejor es bajar la web UI para trabajar en el navegador
Webui
Los modelos se bajan y pesan de 2 a 5 GB, y se agregan a la carpeta de la ui > models> stable diffuison
El último modelo que salió es la versión 2.1 y es el mejor para trabajar de base y es bueno también tener la 1.5.
La comunidad utiliza más el 1.5, porque a partir del 2.0 se pusieron Flanders y hubo censura, además la gente ha creado muchos modelos nuevos que los puedes buscar en civitai (checkpoints), la mayoría utiliza como base la versión 1.5. Hay desde aquellos que buscan el realismo, hasta el animé y el porno...... yo diría que el 50% es mierda de asiáticos con sus idols y toda esa mierda.
Los modelos se agregan a la carpeta y desde la ui puedes seleccionar cualquiera que quieras usar.
Cuando ya tengas listo SD puedes probar diferentes imágenes y también se pueden entrenar cosas básicas.
Actualmente hay dos que se usan (es increíble como esto cambia de mes a mes)
Uno es "textual inversion", donde entrenas a SD con imágenes para tener una palabra que representará a ese concepto y después la usas.
El otro es "LORA", que entrena de manera similar y obtienes un archivo liviano de 9 a 32 megas, que lo agregas a la carpeta modelos>Loras
es fácil de usar, una vez en la carpeta lo seleccionas y te agrega un pequeña frase que representa a ese concepto.
Hacer Lora es fácil, hasta en mi notebook puedo hacer uno. Es bueno usar kohya en su versión webui
kohya ui , en youtube está lleno de guías para instalarlo y usarlo.
Para entrenar un lora lo único que necesitas son imágenes de tu concepto, persona, ropa, tipo de arte, etc.
Por ejemplo unas 15 fotos, las que se debe pasar a 512x512 o 768x768 (este tarda más), hay una página (birme.net) que te hace ese paso de inmediato.
Luego entrenas, y según tu pc puede tardar 20 minutos a 1 hora, dependiendo del número de imágenes y repeticiones por c/u (esto se cacha cuando veas las guías)
Esta guía es a prueba de wns para instalar SD, por algo se llama retard guide
:
Guía instalación SD
Después en youtube está lleno de guías para usar la ui kohya si quieres entrenar un lora: este socio explica claro:
kohyaui (para lora) y en su mismo repositorio está explicado.
Por ejemplo yo probé con algunas fotos del wn de fonola para reírme y recrear su vida en forma exitosa
Fonola ultra filtros:
Fonola y su mina
Fonola en su trabajo como gerente: