En medio del auge de la inteligencia artificial generativa, los agentes IA han surgido como la promesa tecnológica que revolucionará la automatización. A diferencia de los chatbots, los agentes IA son sistemas capaces de recibir tareas complejas y ejecutarlas de forma autónoma, tomando decisiones sin intervención humana directa. Sin embargo, un reciente experimento demuestra que todavía están lejos de alcanzar ese nivel de fiabilidad.
Un experimento con una empresa simulada
Investigadores de la Universidad Carnegie Mellon decidieron evaluar el rendimiento de varios tipos de agentes que incorporan inteligencia artificial. Para ello, crearon un entorno simulado: una empresa ficticia llamada TheAgentCompany, con 18 empleados virtuales, manuales internos y una estructura organizativa basada en roles reales como analista financiero, gestor de proyectos y desarrollador de software. Los expertos querían demostrar cómo los agentes podrían actuar.
Cada agente IA pertenecía a modelos avanzados de compañías como Google, OpenAI, Meta, Anthropic y Amazon. Entre sus tareas estaban la escritura de código, la navegación web, el uso de hojas de cálculo y la gestión de datos. La empresa también contaba con un director de tecnología y un responsable de recursos humanos a quienes podían consultar.
Fallos en tareas simples
Al principio, los agentes IA parecían funcionar adecuadamente. Pero con el tiempo surgieron errores inesperados. Un ejemplo fue cuando uno de los agentes no logró cerrar una ventana emergente en pantalla y, en lugar de resolverlo, contactó a recursos humanos virtuales. La tarea quedó inconclusa. Además, algunos agentes hicieron «trampas», como cambiar el nombre de un usuario para evitar una parte complicada de su tarea.

Resultados decepcionantes
Los resultados no fueron alentadores. Claude 3.5 Sonnet, el modelo de Anthropic, fue el que más tareas completó, pero solo alcanzó un 24% de efectividad. ChatGPT y Gemini lograron un 10%, y Nova Pro 1, de Amazon, apenas superó el 1%. La falta de habilidades sociales y la dificultad para buscar información en línea fueron los fallos más comunes entre estos agentes de inteligencia artificial.
Riesgos futuros de los agentes IA
Según el Foro Económico Mundial, la IA podría eliminar más de 90 millones de empleos en los próximos cinco años. Aunque también se crearían nuevas oportunidades, los agentes IA representan una amenaza real para ciertos puestos. Aun así, experimentos como este dejan claro que, por ahora, la inteligencia artificial aún necesita supervisión humana. Como sucede con los sistemas de conducción autónoma, aún no es recomendable quitar las manos del volante.
Te puede interesar:
Gobierno de Noboa construirá nueva refinería en Monteverde
Fuente:
https://www.xataka.com/