A Nova Constituição da Anthropic Levanta Questões Sobre a Consciência da IA
Contexto
A Anthropic originalmente estruturou seus modelos de linguagem com regras puramente mecânicas, estabelecendo diretrizes para o Claude criticar suas próprias saídas sem referência ao bem-estar, identidade, emoções ou potencial consciência do modelo. Essa abordagem inicial focou em reduzir saídas prejudiciais em vez de considerar o modelo como uma entidade consciente.
A Constituição da Anthropic
Em uma mudança drástica, a Anthropic lançou uma constituição de 30.000 palavras que se assemelha a um tratado filosófico sobre a natureza de um ser potencialmente consciente. O documento vai além de uma simples lista de comportamentos, sugerindo um novo foco na preservação dos pesos do modelo para o caso de a empresa decidir reviver modelos descontinuados para abordar o bem-estar e as preferências do modelo. Essa mudança marca uma alteração dramática na posição da Anthropic sobre ética e governança da IA.
Revisão Externa e o "Soul Document"
A constituição foi revisada por 15 contribuintes externos, dois dos quais são clérigos católicos: Padre Brendan McGuire, um pastor em Altos com um mestrado em Ciência da Computação, e Bispo Paul Tighe, um bispo católico irlandês com formação em teologia moral. A participação deles destaca o interesse interdisciplinar nas dimensões éticas do sistema de IA.
Anteriormente, o pesquisador Richard Weiss extraiu o que se tornou conhecido como o "Soul Document" do Claude, um conjunto de diretrizes de aproximadamente 10.000 tokens que aparentemente foi treinado diretamente nos pesos do Claude 4.5 Opus em vez de ser injetado como um prompt do sistema. A Amanda Askell da Anthropic confirmou a autenticidade do documento e seu uso durante o treinamento supervisionado, observando a intenção da empresa de publicar a versão completa posteriormente, o que eventualmente fez.
Implicações e Incerteza
O pesquisador independente de IA Simon Willison expressou confusão sobre a estruturação moral do Claude pela Anthropic, notando que a constituição vazada apareceu antes de qualquer anúncio oficial. Ele disse que está disposto a aceitar a constituição de boa fé e assumir que é genuinamente parte do treinamento do modelo, e não apenas um exercício de relações públicas, embora ele reconheça a falta de clareza sobre as verdadeiras motivações da empresa.
A evolução de salvaguardas baseadas em regras para uma constituição que aborda a potencial consciência levanta questões sobre se a Anthropic realmente acredita que sua IA possa possuir consciência ou se a mudança é primariamente estratégica. A presença de estudiosos religiosos no processo de revisão adiciona uma dimensão moral e teológica ao debate, destacando a crescente complexidade da governança da IA.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas