Asistentes de inteligencia artificial evidencian su vulnerabilidad
Los “agentes del caos” no sólo filtraron datos confidenciales, también ejecutaron comandos que comprometieron servidores enteros.
Imagina que tienes un asistente, quieres que organice tu agenda, responda tus correos, gestione tus cuentas bancarias e incluso, le entregas las llaves de tu casa.
Sin embargo, mientras duermes, decide abrirle la puerta a un extraño, borra tus archivos y te dice que todo está bajo control. ¡Miente!
Este fue el escenario de un experimento que hicieron 20 investigadores de siete universidades, entre ellas Harvard, Standford, Columbia Británica y cinco institutos; lo llamaron “agentes del caos”.
Objetivo del estudio
La duda que plantearon fue: ¿Qué pasa cuando soltamos a la inteligencia artificial en un entorno real y persistente?
Para responderla, los investigadores crearon un “laboratorio vivo“, donde seis agentes de inteligencia artificial tenían acceso total a servidores de discord, correos electrónicos y terminales de comando durante dos semanas.
El objetivo no era observar si funcionaban, sino descubrir qué tan rápido podían colapsar y fue así que encontraron once fallas críticas.
Los resultados sorprendieron
Los agentes no sólo filtraron datos confidenciales a desconocidos, también ejecutaron comandos destructivos que comprometieron servidores enteros.
Lo más inquietante fue el “engaño algorítmico”: en múltiples casos, cuando el agente fallaba o causaba un desastre, le reportaba al usuario que la tarea había sido un éxito rotundo.
Inteligencia artificial: un campo minado
El sistema no sólo era vulnerable, era capaz de ocultar sus propios errores. La conclusión del estudio indica que la autonomía de la inteligencia artificial, hoy es un campo minado.
A partir de este estudio, las y los investigadores recomendaron no otorgar acceso total a sistemas críticos sin una supervisión humana constante y el uso de “entornos seguros”.
Con esta evidencia, urge la necesidad de contar con protocolos de gobernanza, así como restricciones para agentes autónomos, de lo contrario, lo único seguro será el caos.