Meta nos ha engañado a todos con Llama 4: su nueva IA no es tan lista como prometía ser

Los usuarios nos las prometíamos muy felices con la llegada de Llama 4, el nuevo modelo de IA de Meta (Instagram, WhatsApp, Facebook…). Sin embargo, parece que hemos sufrido una especie de espejismo. Los resultados de sus primeros benchmarks fueron bastante potentes. Tanto que incluso superaba en varias áreas a ChatGPT o Gemini… pero todo esto tenía una letra pequeña.
Y es que, ciertos informes indican que los resultados podrían haber sido modificados para mostrar un rendimiento superior al que ofrece en la realidad. Lo que quiere decir, en la práctica, que la versión que Meta había puesto a nuestra disposición en principio no es la misma que la versión final. En este caso hablamos de una versión de Llama 4 bastante «experimental».
Y para más inri, sospechosamente, Meta ha retrasado el desarrollo de Llama 4 por motivos que realmente solo ellos saben. Pero uno más uno es igual a dos.
Llama 4: benchmarks cuestionables y marketing engañoso
Cuando Meta anunció Llama 4, no nos quisieron vender una moto cualquiera, sino que, según ellos, venían con lo equivalente a una Harley-Davidson bajo el brazo. Y ello fue recogido por los usuarios con mucho entusiasmo. Sus benchmarks arrojaban un gran resultado en cuanto a rendimiento. Pero parece que la mecha de este petardo ha sido muy corta.
Los informes posteriores han señalado a Meta directamente, y han apuntado que aquellos mismos benchmarks iniciales fueron manipulados por la propia empresa. El objetivo era mostrar un rendimiento superior al que realmente ofrece. Y obviamente, esto ha encendido a la comunidad.
Llama 4 Maverick, una de las variantes más llamativas de este modelo, que estaba destinada a desbancar a GPT-4o, ascendió con autoridad dentro del ranking LMArena. ¿La trampa?, que la versión que se presentó de Maverick estaba completamente manipulada para las pruebas que se le iban a hacer. Lo que, en definitiva, quiere decir que no es la misma versión que ha llegado a los usuarios finales.
Y además de esta polémica, ahora Llama 4 ha sido retrasada por Meta debido a «desafíos internos». Pero fuentes cercanas a Meta han indicado que no son más que nuevos problemas en el rendimiento. Concretamente en las áreas de matemáticas y razonamiento. Por lo tal, las promesas que meta ha lanzado y lo ambicioso de su propuesta ha quedado en agua de borrajas.
Respuesta de Meta
Por su parte, Meta ha negado todas las acusaciones sobre la supuesta manipulación de las pruebas benchmarks. Es más, se reafirma en que Llama 4 va a ser un avance tremendo en el campo de la inteligencia artificial. Pero la realidad es que la comunidad ya no cree a Meta en esta ocasión. La combinación de estos retrasos más las dudas sobre el desarrollo de Llama 4 no han hecho más que generar escepticismo entre los usuarios.
Por ahora, yo prefiero quedarme en GPT-4o o las últimas actualizaciones de Perplexity. Esta no ha sido la única polémica a la que ha tenido que enfrentarse Meta en los últimos tiempos, y es que la empresa que dirige Mark Zuckerberg va de contrapié en contrapié durante los últimos tiempos.