El fenómeno de la inteligencia artificial no para y las empresas buscan desarrollar soluciones diferentes e innovadoras a las de la competencia. Anthropic acaba de anunciar una actualización de sus modelos Claude 3.5 Sonnet y Claude 3.5 Haiku. Estos modelos agregan una funcionalidad denominada ‘Modo Ordenador‘ que le permite controlar un PC como si fuera una persona, pero, ¿dejarías que una IA usara tu PC?
Hace poco Robin Li, CEO de Baidu, destacaba que la IA es una enorme burbuja insostenible que, más pronto que tarde, terminará explotando. Indica que solo el 1% de las empresas del sector sobrevivirá, algo completamente lógico.
Seguramente todos tenemos en la cabeza los tres grandes nombres que resistirán: Google, Meta y Microsoft. Puedo decir, sin miedo a equivocarme, que OpenAI terminará integrándose dentro de Microsoft. Bueno, ya lo está, ya que es los de Redmond han invertido miles de millones en esta empresa.
¿Qué es el Modo Ordenador de Claude 3.5?
Anthropic ha presentado una solución en fase experimental que permite a la IA utilizar el ordenador. El denominado ‘Modo Ordenador’ tiene la capacidad de controlar el escritorio, interactuar con las aplicaciones y ejecutarlas. No es algo nuevo, ya que hay varias empresas trabajando en soluciones con IA que puedan navegar por la web o realizar comandos de software.
Claude 3.5 es la primera solución de inteligencia artificial que implementa este tipo de función. Según indica la empresa desarrolladora, de este modo, tiene la capacidad de interpretar pantallas y ejecutar comandos como si fuera una persona.
Se han realizado varias demostraciones, las cuales son bastante sorprendentes. Tiene la capacidad de programar una web, ejecutar scripts en un servidor usando VS Code, depurar errores y realizar diferentes acciones múltiples de manera simultánea.
Esto tiene grandes implicaciones en diferentes sectores. Puede ser una excelente solución para la automatización de tareas administrativas pesadas o el desarrollo de software. Tiene la capacidad de simplificar procesos complejos que requieren de intervención humana constante.
Gracias a este modo, Claude podría realizar búsquedas en bases de datos, extraer información de hojas de cálculo o rellenar formularios. Todo esto se podría hacer sin necesidad de supervisión o intervención humana.
Así que, de momento, vas a seguir siendo un manco jugando a los videojuegos. Está enfocado en tareas relativamente simples y repetitivas que pueden ser costosas para los humanos.
Buena idea, pero está bastante verde
Como era de esperar, esta nueva característica está lejos de ser perfecta. Este modelo comete errores en acciones básicas, como pueda ser hacer zoom o desplazarse. Además, no se lleva muy bien con las notificaciones que están poco tiempo en pantalla.
Supone esto que requiere de una constante supervisión para detectar problemas y deficiencias. Tampoco sirve, de momento, para procesos complejos. Además, requiere de un constante aprendizaje e información ante errores.
No nos podemos olvidar del aspecto de la seguridad, algo verdaderamente critico. Anthropic ha destacado que si estos modelos son atacados con técnicas de jailbreak, pueden realizar acciones perjudiciales. Podría suponer que robe información para un tercero sin saberlo o manipule un proceso generando daños.
Anthropic destaca que han implementado medidas de seguridad adicionales. Indican que agregan la función de retención de capturas de pantalla durante 30 días o la restricción a ciertas funciones críticas.
Queda ahora ver como OpenAI, Salesforce y Microsoft responde a esta solución. Estas compañías llevan tiempo desarrollando tecnologías similares para automatizar procesos de software.
Bueno, Microsoft ya tiene algo así con Recall, la polémica función de Copilot+ que hace capturas cada 5 segundos de todo lo que pasa en pantalla y que puede comprometer claves de acceso e información personal.