Si tuvieras la oportunidad de crear tu propio chatbot que funcionase de manera offline, totalmente legal y sin pagar a OpenAI, Anthropic o cualquier otra empresa de IA, ¿lo harías? Pues, aunque pueda parecer imposible, sí que se puede hacer. Pero si te decimos que, además, no has de instalar nada, el asunto se vuelve especialmente llamativo.
Esto es precisamente lo que podemos hacer sin pasar por cualquier procedimiento de pago relacionado con las API de estas inteligencias artificiales. La clave de todo este proceso ha sido el descubrimiento de los modelos GGUF, versiones optimizadas de los grandes modelos de lenguaje que podemos ejecutar en nuestro propio PC. Es decir, que aunque nuestro hardware no sea tan potente, podremos utilizarlos debido a su gran optimización.
Para ello, hemos utilizado la herramienta Nebula Block, muy simple y cuyo proceso de funcionamiento vamos a compartir en este artículo. Esta plataforma pone a nuestra disposición puntos de acceso en línea, o «endpoints», con los cuales podemos enviar mensajes y recibir respuestas generadas por dicho modelo. Sin usar ninguna clave de pago. Además, nos permite alquilar GPU para cuando se acaben los créditos gratuitos.
Cómo crear un chatbot mediante Nebula Block
Lo primero que deberemos hacer es pulsar sobre este enlace que nos llevará a la propia plataforma. La web se encuentra disponible en idiomas inglés y francés, pero es solo la web. Nada que ver con los modelos de IA. Desde el enlace se abrirá la sección para que elijamos los modelos que queramos ejecutar.
Encontraremos tanto modelos de IA multimodales, como Claude Sonnet 4, Gemini-2.5 Pro o GPT 4o-mini, o modelos de texto como DeepSeek-R1, Llama 3.3 o Qwen-QwQ. Has de tener en cuenta que, a la derecha del recuadro de cada modelo, te especifica el coste de su uso. En este caso, yo he optado por el modelo de DeepSeek-R1-0528 (free). Por lo que, tras pinchar en él, o sobre cualquier otra opción, veremos la siguiente pantalla:
Opciones para configurar tu propio Chatbot de IA
Desde esta propia pantalla, veremos un panel principal donde, en el cuadro de texto blanco que aparece abajo, deberemos iniciar sesión con nuestro correo. Es el único requisito que necesitaremos para utilizar este modelo.
Desde el panel de la derecha, tenemos varias opciones a nuestra disposición:
- En «Model», se nos permitirá que escojamos entre los distintos modelos de IA que hemos visto antes en la propia web. Aunque justo en el pequeño cuadro de debajo se nos indica el que estamos utilizando en este momento.
- Desde el apartado de «System Prompt», podemos dar instrucciones a la propia IA para contextualizar sus respuestas. Es decir: ¿queremos que aporte ejemplos mediante sus respuestas? ¿Que nos hable de tú o usted? ¿Que el tono sea más científico, serio o jocoso? Todo ello podemos indicárselo en ese cuadro de texto.
- Luego nos encontraremos con tres barras de ajuste: en la primera, podremos escoger la extensión de tokens que se generarán en cada respuesta. De igual manera, «temperature» nos permitirá ajustar la creatividad en las respuestas. A mayor «temperatura», más aleatoriedad de ejemplos en las mismas. Por último, en «Top P», podremos escoger estructuras más repetitivas para nuestro texto o más únicas. Cuanto más alto esté, más diversidad encontraremos en la estructura del texto. Consejo: no subas «temperature» y «Top P» a la vez.
Todo esto, lo hemos realizado de manera gratuita. Pero en el caso de que necesites un modelo de pago, lo puedes alquilar por un precio estimado de 40 céntimos la hora (según el modelo, pero es un precio medio). Las condiciones más habituales para los modelos de pago son un límite de consultas, que suelen ser unas 20 por día. Si excedes los créditos gratuitos que nos presta la página, deberemos pagar el alquiler que hemos mencionado arriba.
Por lo tanto, si te interesa el uso de la IA profesional, pero sin el muro de pago que poseen las API, ya sabes dónde puedes acudir.
| Modelo | Idiomas Principales | Tokens Máx. | Coste/Hora (Aprox.) | Mejor para... |
|---|---|---|---|---|
| DeepSeek-R1 | EN/ES | 128K | Gratis (con límites) | Razonamiento técnico y código |
| Llama 3.3 | Multilingüe | 64K | 0.35€ | Uso generalista y conversacional |
| Qwen-QwQ | EN/CN | 32K | 0.28€ | Traducciones y contenido bilingüe |
| Gemini-2.5 Pro | Multilingüe | 128K | 0.42€ | Tareas multimodales y análisis complejo |
