A OpenAI anunciou uma prévia limitada de sua nova linha de modelos GPT-5.6, apresentando três sistemas em camadas batizados de Sol, Terra e Luna. O Sol foi descrito pela gigante de IA como seu modelo mais capaz para cibersegurança.
O lançamento inicial ocorre após um processo de consulta com o governo dos Estados Unidos, resultando em uma distribuição antecipada restrita a um grupo seleto de parceiros confiáveis.
A OpenAI indicou que essa liberação faseada é uma medida temporária enquanto a organização colabora com a administração federal para desenvolver um marco regulatório alinhado ao recente Decreto Executivo, que permite ao governo avaliar os riscos à segurança nacional representados por sistemas avançados de IA.
A atualização do GPT marca uma mudança na estratégia de marca da OpenAI, na qual os números de versão indicam a geração do modelo, enquanto os nomes representam camadas permanentes de capacidade. O GPT-5.6 Sol é o modelo principal de ponta, projetado para tarefas de raciocínio de alta intensidade. O GPT-5.6 Terra tem como foco cargas de trabalho do dia a dia, com a OpenAI relatando desempenho competitivo com o GPT-5.5 pela metade do custo operacional. O GPT-5.6 Luna está posicionado como uma alternativa rápida, representando o menor preço da linha.
Em testes de cibersegurança no ExploitBench, o Sol se equiparou a sistemas concorrentes como o Mythos Preview usando aproximadamente um terço dos tokens de saída.
A empresa destacou que o Sol demonstra uma afinidade maior com tarefas de segurança defensiva, como identificação de vulnerabilidades e desenvolvimento de correções, em vez de ataques cibernéticos completos. Durante avaliações nos códigos-base do Chromium e do Firefox, o sistema isolou com sucesso bugs e primitivas básicas de exploração, mas não construiu de forma independente um exploit funcional de cadeia completa.
Para gerenciar os potenciais riscos de uso duplo, em que a pesquisa defensiva se assemelha muito ao comportamento ofensivo, a série GPT-5.6 conta com uma arquitetura de segurança em múltiplas camadas. Além das recusas padrão em nível de treinamento, a infraestrutura emprega classificadores automatizados em tempo real para entradas de biologia e cibersegurança. Caso uma anomalia seja detectada, a geração de saída é pausada enquanto um modelo secundário de raciocínio revisa o contexto da conversa.
Algumas instâncias também podem acionar avaliações em nível de conta para ajudar a distinguir pesquisas legítimas de segurança de comportamentos maliciosos.
A OpenAI afirmou ter alocado mais de 700 mil horas de GPU (Unidade de Processamento Gráfico) equivalentes a A100 para a realização de red-teaming (testes adversariais) automatizado, com o objetivo de tornar o modelo mais resistente a vulnerabilidades sistêmicas. Essa abordagem se concentrou em descobrir jailbreaks (tentativas de contorno de restrições) universais, em vez de falhas isoladas em comandos únicos.
Embora os modelos estejam acessíveis no momento apenas via API (Interface de Programação de Aplicações) e Codex para parceiros aprovados, a OpenAI planeja ampliar a disponibilidade geral para o ChatGPT, o Codex e usuários mais amplos da API nas próximas semanas.
A empresa se posicionou publicamente contra a transformação da pré-aprovação mediada pelo governo em um padrão de longo prazo para implantações de IA, argumentando que restrições prolongadas atrasam a entrega de ferramentas defensivas essenciais à comunidade mais ampla de cibersegurança.