Dall E, la IA que está rompiendo el internet
Probablemente hayas visto imágenes disímiles flotando en el internet o a través de tus redes sociales: Elvis como el “rey de los lagartos”, Michael Jackson “regresando a su planeta” o el legendario basquetbolista, Michael Jordan, haciendo una épica anotación… en el espacio.

Algunas de estás imágenes son producidas a través de la Inteligencia Artificial, Dall E, que con una simple descripción de lo que querés ver, produce una imagen relativamente fiel a lo que tenías en mente. ¿Cuál es el límite y qué hay tras bambalinas de esta entretenida pero compleja IA? Quedate a averiguarlo en Tech Takes.

Más allá de un generador de imágenes

Aunque a primera vista Dall E podría parecer sólo un generador de imágenes, tras bambalinas hay un trabajo de años que implica un uso de la tecnología muy particular.

Al ingresar a la web, lo primero con lo que te encontrarás es, precisamente, un campo en blanco para que puedas ingresar una descripción y generar la imagen que desees (tocaremos esto un poco más adelante); sin embargo, también es un amplio patio de juegos si buscás aprender algo sobre inteligencia artificial.

La lista de temas relativos a esta particular herramienta incluyen:

  • Algoritmos para digitalizar la ropa utilizada por los modelos.
  • Identificación de valores específicos (como nombre, edad, adjetivos o lugar de origen) en un texto.
  • Modelos de traducción entre diferentes idiomas.
  • Detección y clasificación de objetos.
  • Segmentación de imágenes. 
¿Cuál es el uso de estas herramientas en la vida real? En su respectiva sección, encontrarás la respuesta: vehículos autónomos que pueden identificar el mejor camino posible, poder eliminar el fondo de una imagen para crear efectos especiales e incluso comparar imágenes médicas para obtener un diagnóstico más preciso. Y esto apenas hablando de la segmentación de imágenes; imaginá el uso que se puede hacer de todas estas aplicaciones.

Ahora que conocimos un poco más a fondo todo el trabajo que hay detrás de esta herramienta empecemos a divertirnos con ella.

El ABC de Dall E

¿Listo para la acción? Generar una imagen a través de Dall E es tan fácil como:

  1. Ingresá a: https://www.craiyon.com/
  2. Hacé una descripción de la imagen que querés generar.
  3. Esperá unos segundos y… ¡voilá! tu idea es ahora una imagen real, más o menos.
Es muy posible que tu primer resultado no sea el que esperabas del todo, así que dejanos darte unos tips sobre cómo afinar tus búsquedas y experimentar con esta herramienta.

Intentá poner en el campo de descripción: “Elvis en la cárcel”, verás a un rey del rock tras las rejas, pero sentirás también como que algo hace falta; intentá ahora con “Elvis en la cárcel con uniforme de reo”, luce bastante más convincente ¿no?; ¿qué tal: “Elvis en la cárcel con uniforme de reo y policías”?, el resultado será una foto bastante convincente del inmortal ídolo tras las rejas (y no en la cárcel del rock).

Este experimento sirve para afinar cada vez más las instrucciones y poder entrenar el machine learning con el que funciona esta herramienta; más datos de entrada equivalen a un resultado más preciso. Y, aunque este generador de imágenes haya sido la sensación de internet por las curiosas imágenes que la gente creaba y compartía, es apenas un vistazo de lo que la comunidad puede hacer con una herramienta así en sus manos.
Elefante volando por el cielo colgado de un globo aerostáticoElefante volando por el cielo colgado de un globo aerostático

El siguiente paso en IA

Para adivinar qué es lo que sigue en esta rama de la informática, debemos voltear a ver a un sector que ha sido fundamental para extender los alcances de la IA: la comunidad. ¿Querés saber qué otras curiosas aplicaciones han creado? Te las compartimos a continuación.

Descubriendo aplicaciones de machine learning creadas por la comunidad

Podés encontrar estas aplicaciones en https://huggingface.co/spaces, todas ellas han sido desarrolladas por la comunidad a través de machine learning. Podés experimentar con la mayoría de ellas y echar un vistazo a la documentación técnica en inglés por si querés comenzar a crear tu propia herramienta de IA.

Is it huggable: ¿Alguna vez has visto un objeto sin saber si es seguro abrazarlo? Olvidate de este predicamento con esta herramienta. Lo único que necesitás es tomarle una foto y subirla en esta inteligencia artificial Python; tendrás la respuesta en unos segundos.

Smile or Not Smile: ¿Tenés dudas sobre ese gesto ambiguo con el que tu crush te saluda a diario? Salí de la duda con esta herramienta, lo único que necesitás es una imagen de su cara y con certeza te enterarás si está sonriendo o no.

Cassava Leaf Disease Classification: Si sos un aficionado de la botánica, esta herramienta te interesará. Las plagas son inevitables, aunque no todas requieren el mismo tratamiento. Si querés saber con precisión qué enfermedad aqueja a tus plantas, este clasificador de enfermedades botánicas realizará el trabajo por ti; lo único que necesitás es una foto de las hojas de la planta enferma para tener un diagnóstico para su posterior tratamiento.

Cat breed 2: Todos adoran a los gatitos, eso es un hecho. Pero si querés obtener un poco más de información sobre el linaje de tu pequeño amigo peludo, esta herramienta te ayudará a saber si es un gato persa, siamés, egipcio, azul ruso, etc.

Shakespearify: Si deseás hablar como si estuvieras en una obra del máximo poeta inglés, difícil será, señor mío, encontrar una mejor herramienta (prometemos que el resultado será mejor que nuestro insulso intento).

Question answering: Si sos un maestro y querés poner a prueba esta IA, todo lo que tenés que hacer es darle algo de contexto, un párrafo o dos; después, preguntá lo que quieras y sorprendete con la precisión de la respuesta

Estás herramientas son apenas una prueba de los cientos de aplicaciones de machine learning creadas por la comunidad y disponibles en esta web.

Advertencia: una gran parte de estas herramientas son un trabajo en proceso, así que si te encontrás con un enlace que no funciona, dale un par de días para que la comunidad pueda arreglarlo.

En resumen

Aunque Dall E fue algo que nos tomó por sorpresa y que probablemente se perderá con el tiempo en el mar de información que es internet, llamó la suficiente atención para alimentar nuestra curiosidad por crear aquellas imágenes que de otra manera solo vivirían en nuestra imaginación.

Podés dar el paso entre consumir y crear las aplicaciones que se convertirán en la próxima sensación de internet. ¿Tenés el equipo adecuado para hacerlo? Revisá nuestra sección de notebooks para adquirir los más poderosos equipos de cómputo y lograr programar tu propia inteligencia artificial Python.