Anthropic lanza Claude Fable 5, su modelo de IA más potente, pero con límites de seguridad

0
Anthropic lanza Claude Fable 5, su modelo de IA más potente, pero con límites de seguridad
COMPARTE ESTA NOTA

La empresa de inteligencia artificial Anthropic anunció el lanzamiento de Claude Fable 5, una versión pública de su avanzado modelo de IA conocido como Mythos, considerado hasta ahora uno de los sistemas más potentes desarrollados por la compañía.

El nuevo modelo estará disponible para usuarios a través de la API de Claude y de los planes empresariales de consumo, aunque con importantes restricciones de seguridad en áreas consideradas de alto riesgo, como ciberseguridad, biología, química y procesos de destilación de IA.

Según la compañía, cuando un usuario intente realizar consultas relacionadas con estos campos sensibles, Fable 5 bloqueará la respuesta y transferirá la solicitud a una versión menos avanzada denominada Claude Opus 4.8.

Mythos fue presentado inicialmente en abril bajo acceso limitado para un pequeño grupo de organizaciones debido a preocupaciones relacionadas con posibles riesgos en materia de seguridad informática. Posteriormente, la compañía amplió el acceso a cientos de organizaciones en 15 países, principalmente aquellas encargadas de infraestructura crítica.

Ahora, por primera vez, una versión de esa tecnología estará disponible para el público general.

Anthropic señaló que Fable 5 destaca especialmente en tareas de ingeniería de software, análisis de información compleja, trabajo del conocimiento y comprensión visual, áreas donde busca competir con los modelos más avanzados del mercado.

La empresa explicó que antes del lanzamiento sometió al sistema a extensas pruebas de seguridad para intentar detectar vulnerabilidades o métodos que permitieran eludir sus restricciones.

De acuerdo con la compañía, se realizaron más de mil horas de pruebas de jailbreak y ejercicios de red teaming sin que se encontraran vulnerabilidades universales que comprometieran los mecanismos de protección del modelo.

Como medida adicional, Anthropic anunció que todos los usuarios empresariales que utilicen Fable 5 deberán aceptar una política de retención de datos de 30 días, incluso aquellos que previamente contaban con acuerdos de almacenamiento cero.

La empresa aseguró que esos datos no serán utilizados para entrenar modelos futuros y que únicamente servirán para detectar posibles ataques, identificar nuevos métodos de evasión y reducir falsos positivos en los sistemas de seguridad.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *