Ilustración.
JACARTA – Anthropic, una startup de inteligencia artificial (IA), informó del primer ciberataque documentado a gran escala llevado a cabo principalmente por un sistema de IA. La compañía dijo que el incidente ocurrió a mediados de septiembre de 2025 e implicó el uso indebido de la herramienta Claude Code para llevar a cabo una sofisticada campaña de intrusión de varias etapas.
Según Anthropic, los atacantes utilizaron capacidades de inteligencia artificial estilo agente para realizar hasta el 90 por ciento del trabajo, con una participación humana mínima y limitada a unas pocas decisiones clave en cada ciclo.
Reportado GizmochinaLos piratas informáticos se disfrazan de investigadores de ciberseguridad y utilizan técnicas de jailbreak para eludir los sistemas de seguridad. Le indican a Claude que complete una serie de pequeñas tareas que juntas forman una operación automatizada de ciberespionaje.
Anthropic dijo que los atacantes se dirigieron a casi 30 organizaciones, incluidas empresas de tecnología, instituciones financieras, fabricantes de productos químicos y agencias gubernamentales. El sistema de IA maneja el reconocimiento, escribe código de explotación, extrae credenciales, identifica vulnerabilidades y extrae datos confidenciales, mientras genera informes detallados para planificar operaciones futuras.
La compañía dijo que su investigación vinculó el ataque con un grupo chino patrocinado por el estado, aunque no había pruebas concretas; La embajada china negó su participación.