Escuchar "NTN 418 - ️ Cómo funciona un generador de imágenes"
Síntesis del Episodio
• Del ruido al arte: DDPM → Latent Diffusion → Stable Diffusion.
• CLIP + latentes + CFG: la fórmula que escaló calidad/costo.
• ControlNet/DreamBooth/LoRA/DiT: control, personalización y escala.
Fuentes:
• https://arxiv.org/abs/2006.11239
• https://openaccess.thecvf.com/content/CVPR2022/papers/Rombach_High-Resolution_Image_Synthesis_With_Latent_Diffusion_Models_CVPR_2022_paper.pdf
• https://arxiv.org/abs/2302.05543 · https://arxiv.org/abs/2208.12242
• CLIP + latentes + CFG: la fórmula que escaló calidad/costo.
• ControlNet/DreamBooth/LoRA/DiT: control, personalización y escala.
Fuentes:
• https://arxiv.org/abs/2006.11239
• https://openaccess.thecvf.com/content/CVPR2022/papers/Rombach_High-Resolution_Image_Synthesis_With_Latent_Diffusion_Models_CVPR_2022_paper.pdf
• https://arxiv.org/abs/2302.05543 · https://arxiv.org/abs/2208.12242
Más episodios del podcast No Tiene Nombre
NTN 421 - Fotos que hackean
16/09/2025
NTN 420 - Así funcionan las IAs de video
12/09/2025
NTN 419 - ️IA, dinero y survival kit
09/09/2025
NTN 414 - Educación, chips y políticas
25/08/2025