Llevamos varias semanas hablando de las sorprendentes capacidades de DALL-E Mini y DALL-E 2, dos modelos de IA generadores de imágenes que, si bien son muy diferentes en lo que respecta a la calidad de sus resultados, destacan por ser capaces de traducir en imágenes una descripción por escrito del usuario. Pero OpenAI no es la única compañía que busca liderar este campo…
…sin ir más lejos Meta —la compañía propietaria de Facebook— no quiere quedarse atrás y ha presentado en las últimas horas su propia IA generativa, bautizada como 'Make-A-Scene' y aún en fase de prototipo. Este modelo ofrece lo mismo que DALL-E 2 y va aún más lejos a la hora de permitirnos traducir nuestra imaginación en imágenes.
Excited to announce Make-A-Scene, our latest research tool Mark Zuckerberg just shared. Make-A-Scene is an exploratory concept that gives creative control to anyone, artists & non-artists alike to use both text & sketches to guide AI image generation: https://t.co/p9HNFy3VeY pic.twitter.com/Ir5U4IvikV— Meta AI (@MetaAI) July 14, 2022
Unas gotitas de bocetos a la masa de descripciones, y rico, rico
Pues allí donde un texto como "un pato azul montando en moto" puede ser interpretado por DALL-E 2 de múltiples formas (dibujando ambas figuras con diversos tamaños, o situándolas a un lado u otro de la imagen), Make-A-Scene —partiendo también de una descripción textual— nos permite afinar los resultados acompañando el texto de un sencillo boceto dibujado que guíe a la IA durante el proceso generativo y que reste aleatoriedad, de …