O OpenAI está atualizando o operador de alimentação do modelo de IA, seu agente de IA que pode navegar autonomamente na Web e usar certos softwares dentro de uma máquina virtual hospedada em nuvem.
Em breve, o operador usará um modelo baseado no O3, um dos mais recentes modelos de “raciocínio” do OpenAI. Anteriormente, o operador contava com uma versão personalizada do GPT-4O.
Por muitos benchmarks, a O3 é um modelo muito mais avançado, principalmente em tarefas envolvendo matemática e raciocínio.
“Estamos substituindo o modelo existente baseado em GPT-4o para operador por uma versão baseada no OpenAi O3”, Openai escreveu em uma postagem no blog. “A versão da API [of Operator] permanecerá com base em 4o. ”
O operador é um dos muitas ferramentas agênticas divulgadas pelas empresas de IA nos últimos meses. As empresas estão correndo para fazer agentes altamente sofisticados que podem realizar tarefas com segurança mais ou menos sem supervisão.
O Google oferece um agente de “uso de computador” por meio de sua API Gemini que pode navegar da Web da mesma forma e tomar ações em nome dos usuários, bem como uma oferta mais focada no consumidor chamada Mariner. Os modelos da Anthropic também podem executar tarefas de computador, incluindo arquivos de abertura e navegação na web.
De acordo com o OpenAI, o novo modelo de operador, chamado O3 Operator, foi “ajustado com dados de segurança adicionais para uso do computador”, incluindo conjuntos de dados projetados para “ensinar o modelo [OpenAI’s] Limites da decisão sobre confirmações e recusas. ”
O OpenAI divulgou um relatório técnico mostrando o desempenho do operador da O3 em avaliações de segurança específicas. Comparado ao modelo do operador GPT-4O, o operador O3 tem menos probabilidade de se recusar a executar atividades “ilícitas” e procurar dados pessoais sensíveis e menos suscetíveis a uma forma de ataque de IA conhecido como injeção rápida, de acordo com o relatório técnico.
“O operador da O3 usa a mesma abordagem em várias camadas para a segurança que usamos para a versão 4o do operador”, escreveu o Openai em sua postagem no blog. “Embora o operador da O3 herde os recursos de codificação da O3, ele não tem acesso nativo a um ambiente ou terminal de codificação”.