Nano-PDF. Ese es el nombre de una app que no es demasiado convencional. De hecho, no se descarga e instala como cualquier otra app. En esta ocasión, estamos ante una herramienta de línea de comandos (CLI) de código abierto que nos permite editar nuestros archivos PDF mediante instrucciones en lenguaje natural. Pero lo mejor de todo es que está impulsada por el propio Gemini Nano Banana de Google.
Esta herramienta, diseñada por developers y equipos técnicos, se encarga de transformar la manera en que hacemos cambios en nuestros documentos PDF. En lugar de utilizar un software tradicional, como los de Adobe o cualquier lector/editor de pago o código abierto. Tan solo escribes lo que quieres cambiar y la IA se encarga del resto. En todo momento mantiene el formato original, preserva capas de texto mediante OCR y es capaz de generar nuevas páginas que coincidan tanto con el estilo del documento como con tus instrucciones.
Se encuentra bajo licencia MIT, accesible directamente desde GitHub, pero requiere de cumplir ciertos prerrequisitos técnicos, como Python 3.10+ o dependencias del sistema como Poppler y Tesseract. Sin olvidarnos de lo más importante: una clave API de Google Gemini de pago.
Qué es Nano-PDF
Nano-PDF es prácticamente distinto a cualquier software de edición de PDF tradicional. En lugar de utilizar una interfaz gráfica que conste de menús y paneles, es una herramienta de terminal que juega con comandos de texto. De hecho, no descargamos un instalador «.exe», en su lugar, clonamos un repositorio de GitHub y lo configuras de manera manual en tu PC. El propósito de ello es permitir a los usuarios más técnicos editar PDF de la forma más ágil posible utilizando instrucciones en lenguaje natural.
GitHub Projects Community@GithubProjectsEdit PDF files with Nano Banana https://t.co/4pxfYZdDCt02 de diciembre, 2025 • 21:30
2.8K
1
Por ejemplo, en lugar de abrir Adobe Acrobat o Photoshop, modificar un gráfico y exportarlo, podemos optar por:
nano-pdf edit deck.pdf 5 "Update the revenue chart to show Q3 at $2.5M
La IA lleva a cabo la edición manteniendo en todo momento el estilo visual. Como puedes intuir, estamos ante una herramienta realmente valiosa para automatizar cualquier proceso repetitivo, donde editar de manera pormenorizada los documentos puede ser ineficiente en términos de tiempo. Nano-PDF puede incluso editar varias páginas de manera coetánea, añadir diapositivas nuevas que coincidan con el diseño de nuestras hojas o mantener la capa de texto para buscar, copiar e incorporar elementos como layouts, tablas e imágenes dentro del PDF.
Cómo obtener Nano-PDF y qué necesitas
Hacerte con Nano-PDF implica un proceso diferente al tradicional. Primero, es obligatorio que tengas Git instalado para clonar el repositorio desde GitHub. En él, solo debes incluir:
git clone https://github.com/gavrielc/Nano-PDF.git
Luego, acceder a la carpeta y ejecutas: «pip install -e .» para instalar todas sus dependencias en Python (recuerda, 3.10 o posterior). También necesitaremos Poppler para renderizar PDF a imágenes y Tesseract, para OCR (reconocimiento óptico de caracteres). En Windows, macOS o Linux, deberás descargar cada una de estas herramientas por separado.
Por último, deberás crear un archivo «.env» con tu clave API de Google Gemini, la cual es de pago. Dicha API es obligatoria porque Nano-PDF depende del modelo Gemini Nano Banana Pro para realizar cualquier edición de manera inteligente. Sin ella, la herramienta no funcionará. Desde GitHub se te muestra exactamente qué variable necesitarás ejecutar.
Ejemplos de uso y limitaciones
Nano-PDF brilla específicamente donde la automatización y la IA puedan agregar un valor material. Por lo que puede ser idónea para startups y equipos que quieran modificar documentos de manera masiva, mediante lotes, para pipelines de CI/CD donde necesites editar PDF y para investigadores o desarrolladores que necesiten procesar documentos de manera programada.
Cuenta con licencia open source MIT que permite que revisemos el código, auditemos su seguridad y podamos adaptarlo a nuestro gusto. Aun así, ten en cuenta algo muy importante: requiere una competencia técnica importante. No es amigable para usuarios que no estén familiarizados con Python o a trabajar con líneas de comandos. Además, dependen de una conexión a internet para acceder a la API de Gemini, y esta misma API tiene un coste variable que va sumando si procesamos muchos documentos.
