Usé una IA sin conexión para generar una imagen de un cachorro perdiguero en un teléfono

Published:

En el MWC 2023, Qualcomm mostró sus nuevas habilidades de IA, en particular la capacidad de ejecutar una instancia local de Stable Diffusion 1.5 para generar una imagen sin conexión en un teléfono. Tenemos que trabajar con él para ver qué tan rápido y qué tan bien funciona.

El modelo se ejecutó en un teléfono Android con un chip Snapdragon 8 Gen 2, en modo avión. Simplemente ingrese un mensaje de foto usando lenguaje natural, y el generador de imágenes de IA fuera de línea comienza a construir la imagen desde un contorno borroso hasta un producto terminado. Todo el proceso tarda menos de 15 segundos en generar una imagen de 512 x 512.

El modelo Stable Diffusion de Qualcomm funciona sin conexión en un teléfono Android con el chip Snapdragon 8 Gen 2.

Mi primer aviso tenía que ser un cachorro de golden retriever con un beie androide verde, y debo decir que estuvo bastante cerca. Deténgase por un segundo para darse cuenta de que este cachorro en particular no existe: una IA lo acaba de crear basándose en lo que sabe sobre los cachorros golden retriever.

Robert Triggs / Autoridad de Android

Si bien 15 segundos pueden parecer demasiado tiempo (y 512 x 512 es una imagen demasiado pequeña), todo es bastante impresionante teniendo en cuenta que todo se ejecuta localmente. Qualcomm dice que el Hexagon DSP de 8 Gen 2 es crucial para hacer que este modelo de IA funcione tan rápido sin conexión; confiar en la CPU llevaría mucho más tiempo.

Distribución estable Qualcomm Lisa

Robert Triggs / Autoridad de Android

Dada la recompensa instantánea, decidí probar otras indicaciones para divertirme. ¿La Mona Lisa al estilo de Pablo Picasso? Cuenta. ¿Un hombre que sostiene un teléfono inteligente dos veces su tamaño? Por qué no. ¿Otras inspiraciones artísticas aleatorias? Naturalmente.

Cada imagen fue generada localmente por el modelo de IA en menos de 15 segundos.

Al igual que con los generadores de imágenes DALL-E, Midjourney y alternativos, cuanto más precisa sea la indicación, mejor será el resultado final. Traté de hacer famosas las «vidrieras» estilo Gaudí de Gustave Klimt El beso pintura, pero tomó una forma de jarrón en su lugar. Cambiar a «vidrio de colores» creó el efecto de vidrio de ventana que estaba buscando.

Dispersión estable Qualcomm Klimt El Beso al estilo Gaudí

Rita El Khoury / Autoridad de Android

Por ahora, el modelo generador de imágenes de IA fuera de línea de Qualcomm es una prueba de concepto. No pude guardar o compartir las imágenes en ningún lugar para revisarlas más a fondo. No tenemos idea si esto llegará a nuestros teléfonos, cómo o cuándo. Además, el mismo aviso genera exactamente la misma imagen, por lo que no tiene sentido volver a ejecutarlo para ver qué más puede aparecer. Tienes que cambiar al menos una palabra para obtener resultados diferentes.

Pero la tecnología está llegando. Por el momento, la generación de texto a imagen basada en AI o ML requiere una conexión a Internet, servidores remotos rápidos y potentes, y debe esperar su turno en la cola para que se procese su solicitud. Cuanto más popular sea un servicio, más tardará en recibir sus imágenes. Pronto podrá hacer eso en su teléfono cuando lo desee, en segundos y con más privacidad, y eso es increíblemente genial.

¿Ha utilizado generadores de texto a imagen como Midjourney, Stable Diffusion o Dall-E?

3 votos

Esto te podría gustar..

Recién publicado