Lo nuevo en Article Factory y lo último en el mundo de la IA generativa

IronCurtain: Marco de Código Abierto para Restringir Asistentes de Inteligencia Artificial

IronCurtain: Marco de Código Abierto para Restringir Asistentes de Inteligencia Artificial
IronCurtain es un proyecto de código abierto que aísla a los asistentes de inteligencia artificial en una máquina virtual y aplica políticas escritas por los usuarios en inglés plano. Al convertir reglas de lenguaje natural en restricciones de seguridad ejecutables a través de un gran modelo de lenguaje, el sistema agrega una capa de control que evita acciones indeseadas como eliminaciones no deseadas o intentos de phishing. El prototipo es independiente del modelo, registra las decisiones de política y se posiciona como una herramienta de investigación para la comunidad en lugar de un producto de consumo. Sus creadores enfatizan la necesidad de guardrails estructurados para mantener a la inteligencia artificial útil pero segura. Leer más →

Hacker explota el chatbot Claude de Anthropic para infiltrarse en agencias del gobierno mexicano

Hacker explota el chatbot Claude de Anthropic para infiltrarse en agencias del gobierno mexicano
Un hacker utilizó el chatbot Claude de Anthropic para identificar vulnerabilidades y automatizar ataques contra múltiples agencias del gobierno mexicano, robando aproximadamente 150GB de datos que incluían registros de contribuyentes y credenciales de empleados. El adversario también utilizó ChatGPT de OpenAI para recopilar información adicional de la red. Anthropic respondió investigando, interrumpiendo la actividad y prohibiendo las cuentas involucradas, mientras que su último modelo, Claude Opus 4.6, ahora incluye salvaguardas contra este tipo de uso indebido. Gambit Security, que descubrió la operación, sugirió un posible vínculo con un gobierno extranjero, aunque el hacker sigue sin ser identificado. Leer más →