Mientras los chatbots de inteligencia artificial se centran cada vez más en crear más contenido basado en texto, no es solo la única funcionalidad que puede tener tal asistente. Los más asiduos al uso de la IA sabrán de la plena capacidad de ayuda que poseen estos chatbots. Normalmente, nuestras ideas escritas se convierten en imágenes, vídeos o audios… pero, ¿y si invirtiéramos este orden?
Es decir, podríamos partir de una imagen para reconstruir el texto que la habría generado dentro de un modelo de IA. De hacerlo con éxito, sería extremadamente útil para crear otras imágenes con los mismos patrones o recrear la escogida lo más fielmente posible. Es decir, tendríamos la capacidad de «rescatar» el prompt original sin saber cuál ha sido el que la ha creado.
Y el procedimiento es mucho más sencillo de lo que imaginas. Podemos nuestro propio chatbot de ChatGPT para ello. Tan solo deberemos subir la imagen y hacer las preguntas adecuadas para llevar a cabo este proceso de «ingeniería inversa». Vamos a contaros el truco para hacerlo de manera rápida y sencilla, para que podáis replicar el estilo de una imagen en vuestras futuras creaciones.
| Característica | ChatGPT (Versión Gratuita con 4o) | Google Gemini | Recomendación de Uso |
|---|---|---|---|
| Generación Gratuita | Límite de ~4 imágenes/hora | Ilimitada | Gemini para proyectos extensos o experimentación |
| Precisión de Colores | Descriptiva (ej: 'rojo vibrante') | Códigos HEX exactos (ej: #E74C3C) | Gemini para diseño gráfico y trabajos que requieren precisión cromática |
| Análisis de Estilo | Identifica influencias generales | Identifica movimientos artísticos específicos (ej: '85% Art Deco') | Gemini para análisis histórico o académico |
| Integraciones | APIs de pago para automatización | Integración nativa con Google Docs | Gemini para flujos de trabajo de documentación y archivo |
Cómo convertir imágenes en prompts de IA con ChatGPT
Existe un camino muy sencillo de seguir a la hora de convertir imágenes en prompts de texto. Uno de los métodos más rápidos es acudir a cualquier IA que conozcamos con capacidades multimodales, esencial para trabajar con imágenes. En nuestro caso, hemos utilizado ChatGPT, pero podéis usar cualquiera compatible con esta función. Obviamente, deberemos disponer de la imagen con la que queramos trabajar. Así que solo tendremos que arrastrarla a la interfaz de un nuevo chat y establecer este prompt:
«Crea un prompt de texto detallado basado en esta imagen«.
Los resultados hablan por sí solos:
Como puedes ver, la IA se encarga de analizar los parámetros de composición, colores, estilos, texturas y ambientación que se implementan dentro de la imagen. Es decir, que podremos saber las características de «origen» que dieron pie a esta imagen. Pero todo no queda aquí, y es que podemos estructurarlo de una manera más ordenada si queremos obtener de manera más definida la información del estilo y extrapolarla a nuevas creaciones.
Un paso más allá: recopilar los patrones para futuras creaciones
Ahora que sabemos -o nos acercamos empíricamente- al prompt de origen, vamos a estructurarlo para poder crear nuevas imágenes a partir de esta en el futuro de manera muy sencilla. Puedes usar un prompt de este estilo:
«Ayúdame a definir el mismo prompt de manera estructurada para utilizar el estilo de la imagen en creaciones futuras:
- Tema:
- Composición:
- Estilo:
- Paleta de colores:
- Iluminación:
- Detalles adicionales: «
La IA lo recopilará con precisión y sin problema alguno:
Creación de una nueva imagen a partir del prompt de origen
Ahora que ya disponemos de una estructura con las «órdenes» originales para la creación de la imagen, solo tenemos que crear una por nuestra cuenta con el mismo estilo de la que hemos analizado y extraído información. Para ello, puedes utilizar un prompt donde le especifiques la nueva imagen a crear manteniendo el mismo estilo:
«De acuerdo. A raíz de estos patrones que acabas de recopilar, necesito que crees una imagen del mismo estilo. En esta ocasión no vamos a centrarnos en un rostro humano, sino en el concepto de una Tokio futurista Cyberpunk. Recuerda mantener los parámetros lo más parecidos posibles.»
De esta manera, el chatbot seguirá la estructura que hemos extraído de la primera imagen para comenzar a crear imágenes propias. Os dejo el resultado para que juzguéis por vosotros mismos.
Como podéis ver, el resultado es fiel en estilo al original. De esta manera, podréis extrapolar la información que se obtiene de una imagen para vuestras propias creaciones. Y así potenciar vuestra creatividad al máximo.
