Anthropic Revisa la Prueba de Contratación mientras Claude AI Supera a los Candidatos
Antecedentes
Desde 2024, el grupo de optimización de rendimiento de Anthropic ha requerido que los solicitantes de empleo completen una prueba en casa diseñada para evaluar su experiencia técnica. La prueba originalmente se centró en problemas de optimización de hardware, reflejando el trabajo principal del equipo.
Avances de la IA Provocan Rediseños
Durante los últimos años, los asistentes de codificación de IA, particularmente los modelos Claude de Anthropic, han avanzado rápidamente. Según el líder del equipo, Tristan Hume, cada nueva versión de Claude ha obligado a la empresa a rediseñar la evaluación. Cuando se introdujo Claude Opus 4, superó a la mayoría de los solicitantes humanos, aunque la prueba aún permitió distinguir a los candidatos más fuertes del modelo. La posterior lanzamiento de Claude Opus 4.5 igualó incluso a los mejores performers humanos, eliminando la capacidad de la prueba para diferenciar entre los mejores candidatos y la salida de la IA.
Política sobre el Uso de Herramientas de IA
Anthropic permite explícitamente que los candidatos utilicen herramientas de IA durante la prueba en casa. Una corrección a informes anteriores aclaró que el uso de IA está permitido, no prohibido. A pesar de esta política permisiva, la empresa enfrenta un dilema: si los participantes humanos no pueden mejorar las respuestas de la IA, la prueba ya no sirve como una medición confiable de la habilidad humana.
Nuevo Diseño de la Prueba
En respuesta a estos desafíos, Hume desarrolló una nueva versión de la evaluación que se aleja de las tareas de optimización de hardware. La prueba rediseñada enfatiza elementos de resolución de problemas novedosos destinados a ser difíciles para los modelos de IA actuales, restaurando así su utilidad para evaluar el talento humano. Hume también compartió la prueba original públicamente, invitando a expertos externos a diseñar desafíos que pudieran superar a Claude Opus 4.5, diciendo: "Si puedes superar a Opus 4.5, nos encantaría escucharte".
Implicaciones y Perspectivas
La situación en Anthropic refleja preocupaciones más amplias sobre el impacto de la IA en las evaluaciones educativas y profesionales en todo el mundo. A medida que las herramientas de IA se vuelven más capaces, las organizaciones deben adaptar continuamente sus métodos de evaluación para asegurarse de que sigan siendo significativos. El enfoque proactivo de Anthropic —actualizar regularmente su prueba y buscar comentarios de la comunidad— demuestra un compromiso para preservar la integridad de su proceso de contratación mientras reconoce las capacidades evolutivas de la IA.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas