En estos momentos tenemos la oportunidad de echar mano de diferentes modelos de IA que se implementan en todo tipo de aplicaciones y plataformas. Ahora Google acaba de presentar una nueva propuesta en este sentido con la que pretende dejar atrás el popular ChatGPT, os hablamos de Gemini.
Y es que el gigante de las búsquedas la acaba de presentar públicamente. Y no solo eso, ya que la propia Google asegura este es su modelo de IA más potente hasta la fecha. Tal es así que la empresa asegura que las capacidades que es capaz de ofrecernos Gemini superan a las de la mencionada ChatGPT y otros modelos de la competencia. Básicamente nos vamos a encontrar con una Inteligencia Artificial capacitada para incorporar información de distintas fuentes.
Para que os hagáis una idea más aproximada, todo esto significa que Gemini puede comprender sin problema alguno, operar y combinar diferentes tipos de información. Hoy aquí se incluyen elementos en la importancia del texto, los códigos de programación, las fotos, el audio e incluso el vídeo. Tal y como nos informan, este nuevo modelo se pondrá a disposición de todo el mundo y en un principio se lanzarán tres versiones: Ultra, Pro y Nano. Cabe destacar que el primero será el más potente.
Por otro lado merece la pena reseñar que la IA de Gemini está diseñada para que la podamos usar en todo tipo de dispositivos. Aquí se incluyen tanto móviles como equipos de sobremesa o servidores. Quizá lo más llamativo sea que Google afirma que el rendimiento de este nuevo modelo supera al de su principal competidor, GPT-4. La propia empresa asegura que Gemini Ultra ha conseguido superar a GPT-4 en 30 de las 32 pruebas de referencia a las que lo ha sometido.
Gemini de Google supera en rendimiento a GPT-4
También es cierto que en muchas de estas pruebas las diferencias encontradas entre ambos modelos de Inteligencia Artificial son mínimas. Un ejemplo de todo ello lo encontramos en que Gemini obtuvo un 53,2% en la prueba MATH, lo que supone un 0,3% más que GPT-4. La única prueba En la que la IA de Google ha obtenido una diferencia importante a su favor es en la de generación de código Python.
Quizá muchos de vosotros ya sabéis que en los diferentes modelos IA hasta ahora los componentes se entrenaban por separado y luego se fusionaban. Pero ahora el gigante de las búsquedas afirma que ha entrenado a Gemini para que sea multimodal de forma nativa. Básicamente esto se traduce en que lo ha entrenado desde el principio en diferentes modalidades. Así logrará mejores resultados en todo tipo de modos de funcionamiento y contenidos.
Esto significa que Google ha entrenado a Gemini para que reconozca texto, imágenes, audio, vídeo y más, al mismo tiempo. Todo ello con el fin de ofrecernos respuestas a preguntas más complejas. Además tal y como nos hacen ver, la IA también está capacitada para ayudarnos en todo aquello relacionado con la programación. Puede entender, ofrecer respuestas y generar código de alta calidad en los lenguajes más populares.
Decir que la empresa tiene previsto integrar Gemini Pro en los productos de la misma Google, mientras que, por ejemplo, Gemini Nano está llegando al terminal Google Pixel 8 Pro. En resumidas cuentas, este es un modelo IA de que vamos a oír hablar mucho a lo largo de los próximos meses.