Qué sabemos sobre la inusitada censura a los modelos de Claude

En los días más turbulentos para Anthropic, se suceden un jailbreak viral y una censura sin precedente a los modelos de Claude.

Juan José CastilloJuan José Castillo  ·  junio 15, 2026
Compartir
Qué sabemos sobre la inusitada censura a los modelos de Claude
Foto: Negative Space/ Pexels

Una orden gubernamental sin precedente contra la inteligencia artificial (IA) se tradujo en la censura de Anthropic y dos de sus modelos de Claude. Previamente, la empresa fundada por los hermanos Amodei había sufrido el ataque de un renombrado hacker.

Lee también: Google Dreambeans te convierte en protagonista de tu propia historia

La semana más turbulenta que recuerde la firma con sede en San Francisco partió con un inconveniente técnico. Apenas unas horas después del lanzamiento del modelo Fable 5, el red-teamer conocido como Pliny the Liberator se ufanó en redes sociales.

«Jailbreak alert, Anthropic pwned (sic), Fable 5 liberated», publicó en su cuenta de X. Según su versión, pudo haber burlado los clasificadores de seguridad del modelo y publicó capturas de pantalla. En ellas, estaría produciendo código de explotación de software e instrucciones de síntesis química, información que el sistema está diseñado para rechazar.

Pliny describió un ataque multietapa sofisticado, fragmentando las solicitudes peligrosas en tokens aparentemente inocuos para luego ensamblarlos usando un modelo Opus previamente pirateado. Anthropic desestimó que fuera un jailbreak universal, argumentando que sus pruebas incluían más de 1,000 horas de bug bounty sin encontrar vulnerabilidades generalizadas.

Mazo en vez de bisturí

El 12 de junio llegó el segundo y más fiero golpe. Como ha sido la tónica durante su mandato, la información proveniente del gobierno de Donald Trump se conoció a última hora del viernes, cuando ya muchos habían comenzado su descanso de fin de semana.

La Casa Blanca emitió una directiva de control de exportaciones que ordenó suspender el acceso a Fable 5 y Mythos 5 para cualquier ciudadano extranjero, dentro o fuera de Estados Unidos. Esta caso de censura a los modelos de Claude incluyó a empleados no estadounidenses de la propia Anthropic.

Para cumplir la orden, la empresa desactivó ambos modelos para todos sus usuarios globales. El gobierno no aclaró explícitamente si la acción de Pliny motivó la directiva, pero la cronología es inequívoca: el jailbreak y la orden apenas se distanciaron en 48 horas.

El secretario de Guerra, Pete Hegseth, fue más explícito que el Departamento de Comercio. «Hace tres meses, el Departamento de Guerra expulsó a Anthropic de su edificio para siempre. Cada día que pasa, demuestra por qué esa fue la decisión correcta», escribió en su cuenta de X.

Desde febrero de 2026, la administración de Trump había excluido a Anthropic de contratos federales después de que la empresa se negara a permitir que sus modelos fueran usados en sistemas de armas autónomas o vigilancia masiva doméstica.

Una de las consecuencias más reveladoras de la censura a Claude fue personal. Andrej Karpathy, uno de los principales científicos de IA de Anthropic y ciudadano no estadounidense, quedó bloqueado del acceso a los modelos de su propia empresa. De esa forma, se convirtió en el rostro humano de una política que la industria calificó de blunt instrument, es decir, un mazazo donde se necesitaba proceder con un bisturí.

Anthropic lamenta censura a Claude

Anthropic respondió con un argumento que nadie en el sector ha rebatido. El nivel de capacidad técnica que preocupa al gobierno ya está disponible en modelos públicos como GPT-5.5 de OpenAI, explicó, los cuales no están sujetos a restricciones equivalentes.

«No estamos de acuerdo en que el descubrimiento de una posible vulnerabilidad limitada deba ser motivo para retirar un modelo comercial implementado para cientos de millones de personas», señaló.

Anthropic aseguró cumplir con la orden de censura a los modelos de Claude, pese a sus diferencias con las autoridades. «Si este criterio se aplicara a toda la industria, creemos que paralizaría prácticamente todos los nuevos lanzamientos de modelos para todos los proveedores de modelos de vanguardia», ahondó.

La compañía reiteró que «el gobierno debería tener la facultad de bloquear despliegues inseguros, mediante un proceso legal transparente, justo, claro y basado en hechos técnicos». Sin embargo, la última acción «no se ajusta a dichos principios», finalizó.

También te puede interesar: