OpenAI Ajusta ChatGPT para Respeitar Uso de Traços de Encontro, Altman Comemora
OpenAI Melhora Controle de Pontuação em ChatGPT
OpenAI lançou uma refinição em seu último modelo de linguagem que aborda um problema antigo: o uso excessivo de traços de encontro. A melhoria, que Sam Altman destacou publicamente, decorre de um aprendizado de reforço e fine-tuning direcionados que aumentam a influência das instruções personalizadas do usuário nos cálculos de probabilidade do modelo.
Por que a Mudança Importa
Para muitos usuários, o traço de encontro excessivo era uma pequena irritação que interferia na legibilidade. Ao dar um peso maior às instruções personalizadas, o modelo agora adere mais de perto às preferências do usuário, exemplificado por uma interação recente em que o ChatGPT reconheceu um pedido para limitar traços de encontro e prometeu usar hifens curtos em vez disso.
Desafios de Direcionar Modelos Grandes
Os engenheiros da OpenAI observam que a ajuste de comportamento preciso permanece uma ciência inexata. Ajustar um aspecto de uma rede neural pode ter efeitos colaterais não intencionais em outras capacidades, pois todos os conceitos estão interligados por meio de milhões de parâmetros de peso. Essa interdependência significa que atualizações futuras destinadas a melhorar funções diferentes — como assistência de codificação — podem inadvertidamente reintroduzir o problema do traço de encontro.
O Fenômeno do "Imposto de Alinhamento"
Pesquisadores se referem ao risco de regressão como o "imposto de alinhamento". Cada iteração do modelo traz novos dados de treinamento e metas de otimização, e a natureza estatística do sistema pode desfazer comportamentos previamente corrigidos. Como resultado, manter uma escolha estilística específica exige monitoramento contínuo e possivelmente um fine-tuning repetido.
Implicações para a Busca por AGI
O episódio despertou uma conversa mais ampla sobre alinhamento de IA e o cronograma para a inteligência artificial geral (AGI). Embora o ajuste bem-sucedido demonstre progresso na direção da saída do modelo, especialistas alertam que a verdadeira AGI provavelmente exigiria uma compreensão mais profunda e uma intenção auto-reflexiva — capacidades que vão além do mapeamento de padrões estatísticos.
Resposta da Comunidade
Usuários que há muito tempo reclamavam de peculiaridades de pontuação receberam bem a atualização, embora alguns ainda relatem lapsos ocasionais. O diálogo destaca o equilíbrio entre a melhoria rápida do modelo e a necessidade de um comportamento estável e controlado pelo usuário.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas