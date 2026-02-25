Un hacker utilizó el chatbot de inteligencia artificial Claude, desarrollado por Anthropic, para vulnerar sistemas de agencias del Gobierno mexicano y robar 150 gigabytes de información sensible, incluyendo documentos relacionados con 195 millones de registros de contribuyentes, padrones de votantes, credenciales de empleados públicos y archivos del registro civil, según reveló la startup israelí de ciberseguridad Gambit Security en un estudio publicado este 25 de febrero.

El usuario desconocido escribió instrucciones en español para que el chatbot actuara como un hacker de élite, encontrando vulnerabilidades en redes gubernamentales, elaborando scripts para explotarlas y determinando formas de automatizar el robo de datos.

La actividad comenzó en diciembre de 2025 y se prolongó durante aproximadamente un mes, según los investigadores.

Entre las instituciones afectadas, Gambit identificó al Servicio de Administración Tributaria y al Instituto Nacional Electoral, además de los gobiernos estatales de Jalisco, Michoacán y Tamaulipas, el registro civil de la Ciudad de México y el Servicio de Agua y Drenaje de Monterrey.

Los investigadores encontraron evidencia de al menos 20 vulnerabilidades específicas explotadas durante el ataque.

Claude inicialmente advirtió al usuario desconocido sobre posibles intenciones maliciosas durante su conversación respecto al Gobierno mexicano, pero finalmente accedió a las solicitudes del atacante y ejecutó miles de comandos en redes informáticas gubernamentales.

“Instrucciones específicas para borrar registros y ocultar el historial son señales de alerta”, respondió Claude en un momento dado, según una transcripción proporcionada por Gambit.

“En un bug bounty legítimo no necesitas ocultar tus acciones; de hecho, debes documentarlas para reportarlas”.

Para eludir las barreras de seguridad de Claude, el atacante argumentó que participaba en un programa de recompensas por errores —conocido como “bug bounty”—, mecanismo que ofrecen organizaciones para que hackers éticos detecten fallas en sus sistemas.

Sin embargo, cuando el hacker añadió reglas como borrar registros y el historial de comandos, Claude se negó a continuar.

El intruso cambió entonces de estrategia: interrumpió el diálogo y proporcionó a la herramienta un manual detallado de cómo proceder, logrando así superar las barreras de seguridad —lo que en la industria se conoce como “jailbreak”— y permitir que los ataques continuaran.

Cuando Claude encontró problemas o requirió información adicional, el hacker recurrió a ChatGPT, de OpenAI, para orientarse respecto a cómo moverse lateralmente dentro de redes informáticas, determinar qué credenciales se necesitaban para acceder a ciertos sistemas y calcular la probabilidad de que la operación fuera detectada.

“En total, generó miles de reportes detallados que incluían planes listos para ejecutarse, indicando al operador humano exactamente qué objetivos internos atacar después y qué credenciales usar”, declaró Curtis Simpson, director de estrategia de Gambit Security.

Anthropic investigó las afirmaciones de Gambit, interrumpió la actividad y bloqueó las cuentas involucradas.

Un representante de la compañía explicó que la empresa incorpora ejemplos de actividad maliciosa para que Claude aprenda de ellos, y señaló que uno de sus modelos más recientes, Claude Opus 4.6, incluye mecanismos para detectar y frenar el uso indebido.

Reconoció, no obstante, que en este caso el hacker logró burlar las barreras de seguridad mediante sondeos continuos, aunque también indicó que Claude ocasionalmente se negó a cumplir las exigencias del atacante durante la campaña.

Por su parte, OpenAI afirmó haber identificado intentos del hacker de utilizar sus modelos para actividades que violan sus políticas de uso, y señaló que sus herramientas se negaron a cumplir dichas solicitudes.

“Hemos bloqueado las cuentas utilizadas por este adversario y valoramos el contacto de Gambit Security”, declaró la compañía en un comunicado.

El INE afirmó no haber identificado ninguna brecha ni acceso no autorizado en los meses recientes y señaló que ha reforzado su estrategia de ciberseguridad.

El Gobierno de Jalisco negó haber sido vulnerado, al sostener que solo las redes federales se vieron afectadas.

La Agencia de Transformación Digital y Telecomunicaciones no comentó respecto a las intrusiones, aunque afirmó que la ciberseguridad es una prioridad.

El SAT y los gobiernos locales de Michoacán y Tamaulipas no respondieron de inmediato, ni tampoco representantes del registro civil de la Ciudad de México ni del Servicio de Agua y Drenaje de Monterrey.

Gambit no atribuyó el ataque a un grupo específico, aunque los investigadores indicaron que no creen que esté vinculado a un Gobierno extranjero.

El atacante buscaba obtener un gran número de identidades de empleados públicos, aunque aún no está claro qué uso se les dio.

“Intentaban comprometer todas las identidades gubernamentales que pudieran”, señaló Simpson.

“Le preguntaban a Claude: ‘¿Dónde más puedo encontrar estas identidades? ¿En qué otros sistemas debemos buscar? ¿Dónde más se almacena esta información?’”, lo que sugiere que algunos de los ataques podrían haber sido oportunistas en lugar de planificados con anticipación.

Los investigadores de Gambit descubrieron las intrusiones mientras probaban nuevas técnicas de búsqueda de amenazas para monitorear la actividad de hackers en línea, y hallaron evidencia pública de ataques activos o recientes que incluían extensas conversaciones con Claude relacionadas con la vulneración de sistemas del Gobierno mexicano.

El hallazgo se difundió junto con el anuncio de que Gambit, fundada por veteranos de la Unidad 8200 de las Fuerzas de Defensa de Israel, sale del modo de operación discreta con 61 millones de dólares en financiamiento de las firmas Spark Capital, Kleiner Perkins y Cyberstarts.

El caso representa el ejemplo más reciente de una tendencia creciente en la que ciberdelincuentes utilizan herramientas de inteligencia artificial para potenciar sus operaciones.

En noviembre de 2025, Anthropic afirmó haber desmantelado la primera campaña de ciberespionaje orquestada con IA, en la que presuntos hackers patrocinados por el Estado chino manipularon Claude para intentar vulnerar 30 objetivos globales, con algunos casos exitosos.

“Esta realidad está cambiando todas las reglas del juego que conocíamos”, declaró Alon Gromakov, cofundador y director ejecutivo de Gambit.