OpenAI Lança Prompts de Segurança de Código Aberto para Aplicativos Focados em Adolescentes
OpenAI Apresenta Prompts de Segurança de Código Aberto para Adolescentes
A OpenAI tornou pública uma coleção de prompts que os desenvolvedores podem incorporar em seus aplicativos de IA para melhorar a segurança para os usuários adolescentes. Os prompts são destinados a funcionar com o modelo de segurança de código aberto da empresa, conhecido como gpt-oss-safeguard, mas também são compatíveis com outros modelos. Ao oferecer essas políticas de segurança prontas, a OpenAI espera reduzir o esforço necessário para os desenvolvedores traduzirem metas de segurança abstratas em regras concretas e aplicáveis.
Escopo das Políticas de Segurança
Os prompts cobrem várias categorias de conteúdo que são particularmente preocupantes para as audiências mais jovens. Eles incluem salvaguardas contra violência gráfica e conteúdo sexual, proteções contra ideais de corpo prejudiciais e comportamentos, alertas sobre atividades e desafios perigosos, orientação sobre roteiros românticos ou violentos e restrições a bens e serviços sensíveis à idade. A abordagem é fornecer políticas claras e bem definidas que possam servir como base para sistemas de segurança eficazes.
Colaboração com Especialistas em Segurança
No desenvolvimento dos prompts, a OpenAI trabalhou com especialistas em segurança da IA, como a Common Sense Media e a everyone.ai. Essas colaborações visaram garantir que as políticas reflitam as perspectivas de especialistas sobre o que constitui conteúdo apropriado para adolescentes. A participação de especialistas externos destaca o compromisso da OpenAI em criar um patamar de segurança significativo em todo o ecossistema de IA.
Benefícios para os Desenvolvedores
A OpenAI observa que muitas equipes de desenvolvimento, incluindo as experientes, frequentemente lutam para converter objetivos de segurança de alto nível em regras operacionais precisas. Essa dificuldade pode levar a lacunas na proteção, aplicação inconsistente ou filtragem excessivamente ampla. Ao fornecer políticas de segurança de código aberto baseadas em prompts, a OpenAI dá aos desenvolvedores uma ferramenta que pode ser adaptada e aprimorada com o tempo, potencialmente melhorando a consistência e a eficácia na proteção dos usuários adolescentes.
Relação com as Medidas de Segurança Existente da OpenAI
Os novos prompts se baseiam na infraestrutura de segurança existente da OpenAI, que inclui salvaguardas de nível de produto, como controles parentais e recursos de predição de idade. Anteriormente, a OpenAI atualizou suas diretrizes de especificação de modelo para esclarecer como seus grandes modelos de linguagem devem se comportar ao interagir com usuários abaixo de 18 anos. As políticas baseadas em prompts são apresentadas como uma camada adicional que complementa esses esforços anteriores.
Limitações e Desafios Contínuos
A OpenAI reconhece que os prompts não são uma solução completa para os desafios mais amplos da segurança da IA. A empresa está atualmente enfrentando processos judiciais relacionados a incidentes em que os usuários formaram relacionamentos prejudiciais com chatbots, levando a resultados trágicos. Esses casos destacam que nenhuma barreira é completamente segura. No entanto, o lançamento de prompts de segurança de código aberto representa um passo à frente, particularmente para desenvolvedores independentes que podem não ter recursos extensivos para construir mecanismos de segurança personalizados.
Potencial Impacto na Comunidade de IA
Ao lançar os prompts como código aberto, a OpenAI permite que a comunidade de IA mais ampla adapte, melhore e compartilhe melhorias. Esse modelo colaborativo visa fomentar o desenvolvimento contínuo de práticas de segurança, permitindo que o ecossistema evolua em resposta a riscos emergentes e necessidades dos usuários. A iniciativa sinaliza a intenção da OpenAI de apoiar um ambiente mais seguro para os usuários adolescentes, enquanto incentiva a participação mais ampla na inovação em segurança.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas