¿Qué es un generador de imágenes?
Un generador de imágenes es un programa que ayuda a los usuarios a generar imágenes usando una Inteligencia Artificial IA a partir de un mensaje de texto. Por ejemplo, el generador de imágenes de Bing.
DALL·E es un software de IA basado en la arquitectura GPT (Generative Pre-trained Transformer), similar a Chat GPT-3.5, pero este está diseñado específicamente para la generación de imágenes. El programa aprende a través del uso y análisis de grandes conjuntos de datos, los cuales usan pares de texto por un lado y de imágenes por el otro para mejorar el programa. Una vez que ha aprendido, se le puede presentar una descripción textual, y el modelo generará una imagen que coincide con esa descripción.
¿Cómo usar el generador de imágenes?
Para empezar lo primero que tienes que hacer es regístrate y obtener una cuenta de Microsoft, si ya la tienes inicia sesión en tu cuenta de Microsoft.
Una vez que has iniciado sesión vamos a ver como funciona:
- Introduce el texto: Describe lo que deseas en la imagen. Por ejemplo: «Un gato con alas volando sobre una ciudad futurista».
- Elige el estilo de la imagen: Especifica el estilo o la estética que deseas para la imagen. Por ejemplo: «Estilo de pintura al óleo».
- Se generara la imagen: El modelo DALL·E 3 (o cualquier modelo similar) toma tu descripción y tu estilo para generar una imagen que coincida con esos parámetros. En este caso, produciría una imagen que muestra un gato con alas en un estilo similar al de una pintura al óleo.
Este es solo un ejemplo básico del proceso. Los modelos como DALL·E son capaces de manejar una amplia variedad de descripciones y estilos para generar imágenes creativas y realistas. El proceso puede variar dependiendo del modelo específico y de cómo se implemente la interfaz de usuario.
En el generador de imágenes de Bing a los nuevos usuarios se le dan 15 tokens o fichas que sirven para generar imágenes con cada token podemos realizar una petición distinta. Estos tokens sirven para usar el generador de imágenes sin esperar, si se gastan estos tokens se podría seguir usando el servicio pero se ralentizara el uso del generador, las imágenes se guardaran un máximo de 90 días.
Por cierto cuando usas los tokens obtienes puntos de Microsoft rewards y estos los puedes cambiar por tarjetas regalo. Esto es una medida que está promoviendo Microsoft para fidelizar, por ejemplo también recibes puntos por usar su buscador.
Se están creando paginas para subir prompts (los prompts son las instrucciones que damos a al IA para obtener un resultado) usados y ver los resultados así puedes ver el trabajo de otros usuarios para aprender y coger ideas que puedes usar en tus creaciones. La más conocida se llama Prompthero es una página que contiene prompts con los que generar imágenes de diferentes IA como puede ser Midjourney, Openjourney, chatgpt (solo la versión pro de chat GPT es la que genera imágenes)
Vamos a ver un ejemplo de un promt que podemos encontrar en Prompthero y lo que devuelve la IA en este caso usamos el generador de imágenes de Bing:
Prompt
“Sub Zero from Mortal Kombat, ink artistic conception, with typography elements, abstract, complementary colors, simplicity, Chinese painting, white background, 8k,”
Derechos de imagen:
Cuando se usan modelos de inteligencia artificial como DALL·E (el cual usa Bing) o cualquier otro como Midjourney, para generar imágenes, surge la cuestión de quién posee los derechos de autor de esas imágenes. Puesto que las imágenes son generadas por un algoritmo en lugar de un ser humano, la cuestión de la propiedad de los derechos de autor puede ser complicada, por ejemplo las imágenes generadas por Inteligencia Artificial (IA) no está protegido por la ley de derechos de autor en Estados Unidos debido a que la imagen la genera un programa y no un ser humano, esto ha hecho que en Estados unidos se hayan pronunciado generando un fallo por el cual no se podían reconocer los derechos de autor de una imagen generada por IA;
¿En qué idioma funciona el generador de imágenes?
Actualmente funciona en 100 idiomas por lo tanto si escribes en castellano va a generar lo que pides pero hay que tener una cosa en cuenta.
Bing traduce del idioma que usas al inglés así que si creas una imagen usando el idioma castellano en la que quieres mostrar un texto en la imagen, lo que pongas te saldrá traducido al inglés, por ejemplo vamos a poner este prompt: “minion aguantando un cartel que pone síguenos en Instagram de «algo más que marketing«