OpenAI atualiza o Codex com controle de computador e memória.

  • O Codex se integra ao computador: controla aplicativos da área de trabalho, visualiza a tela e usa seu próprio cursor sem interromper o usuário.
  • O agente utiliza nova memória, reutiliza conversas e automatiza tarefas de longo prazo com múltiplos agentes trabalhando em paralelo.
  • Inclui um navegador integrado, geração de imagens com gpt-image-1.5 e suporte aprimorado para fluxos de trabalho de desenvolvedores.
  • A atualização chega primeiro ao macOS; na Europa e no Reino Unido, alguns recursos estão atrasados ​​devido à regulamentação de dados.

Atualização do Codex com controle por computador

A OpenAI deu mais um passo na integração de inteligência artificial com uso diário de computadores Ao reformular completamente o Codex, seu agente de código para desktop, a ferramenta, antes conhecida principalmente por sua assistência à programação, torna-se agora um assistente capaz de lidar com aplicativos, memorizar preferências e gerenciar projetos de forma quase perfeita.

Com esta atualização, a empresa liderada por Sam Altman aproxima-se do seu plano de criar um Um "superaplicativo" para desktop que unifica o ChatGPT, o Codex e o seu navegador Atlas.A iniciativa visa simplificar a experiência do usuário, concentrar recursos em um único espaço de trabalho e competir com rivais como a Anthropic, principalmente no ambiente de desenvolvimento de software e automação avançada.

Codex aprende a usar o computador como qualquer outro usuário.

Uma das mudanças mais marcantes é que o Codex agora pode controlar o computador em segundo planoO agente consegue ver o que está na tela, mover seu próprio cursor, clicar, digitar texto e reagir ao que acontece nos aplicativos instalados, sem interromper o que o usuário está fazendo com o mouse ou o teclado.

Essa funcionalidade permite que vários agentes Codex trabalhem juntos. em paralelo na mesma equipeIsso envolve realizar testes, alterar configurações ou executar tarefas repetitivas enquanto a pessoa continua com suas atividades normais. Isso abre caminho para a automação de fluxos de trabalho que antes exigiam supervisão constante, como testar um aplicativo após cada alteração de código ou repetir ações de interface.

A OpenAI propõe essa função como uma forma de o assistente operar com ferramentas que não possuem uma API ou integrações diretas, algo comum em muitos programas de desktop. O Codex, ao "enxergar" a tela e controlar o cursor, pode interagir com esses aplicativos da mesma forma que um usuário humano faria, embora, por enquanto, de maneira controlada e com atenção especial à segurança.

Segundo a empresa, o uso de computadores estará inicialmente disponível em macOS através do aplicativo de desktop Codex, vinculado a uma conta ChatGPT. A versão para Windows será lançada posteriormente, após os testes de desempenho e a adaptação dos recursos ao ambiente Microsoft.

No caso da Europa e do Reino Unido, a OpenAI confirmou que... Controle por computador, personalização avançada, sugestões contextuais e memória. Elas serão ativadas posteriormente. O motivo é a necessidade de adequar essas funcionalidades às normas de proteção de dados, uma exigência particularmente rigorosa na União Europeia e no mercado britânico.

Codex com memória e controle de aplicativo

Navegador integrado e trabalho direto em páginas da web

A atualização também fortalece a relação do Codex com a web graças a um navegador integrado ao próprio aplicativoEm vez de simplesmente receber instruções de texto genéricas, o agente pode receber comandos diretamente em elementos específicos de uma página.

No desenvolvimento frontend, por exemplo, o usuário pode Selecione um componente web e descreva a alteração. O usuário deseja realizar alguma ação (como alterar a cor, o tamanho do texto ou o layout de um bloco), e o Codex interpreta a instrução dentro desse contexto visual específico. Isso evita a necessidade de escrever longas instruções explicando qual parte do site precisa ser alterada.

Este navegador integrado também permite o uso do Codex. Analisar conteúdo, coletar informações e usá-las como contexto. Para outras tarefas, como documentar código, revisar especificações de produtos ou comparar documentação técnica, tudo é feito no mesmo ambiente, sem precisar alternar entre várias janelas do sistema operacional.

Geração e edição de imagens com gpt-image-1.5

Outro pilar da nova versão do Codex é a integração do modelo. gpt-image-1.5 para criar e modificar imagens A partir do próprio aplicativo para desktop, o agente pode gerar gráficos, diagramas, maquetes ou esboços visuais a partir de texto, ou combinando instruções com capturas de tela e trechos de código.

Essa funcionalidade é direcionada diretamente às equipes que trabalham em design de produto, interfaces de usuário ou protótipos de videogamesPor exemplo, um desenvolvedor pode capturar uma imagem de uma interface inacabada, pedir ao Codex que sugira uma reformulação do menu ou um novo esquema de cores e obter imagens geradas que se encaixem nesse contexto, sem precisar trocar de ferramenta.

Com tudo centralizado no Codex, os agentes podem encadear tarefas de codificação e designEscrever a lógica de uma funcionalidade, atualizar o frontend correspondente e gerar um protótipo visual para apresentar à equipe, sem sair do fluxo de trabalho ou precisar abrir aplicativos externos de edição gráfica.

Memória, contexto e automação de tarefas de longo prazo

Além do controle por computador e da geração de imagens, a grande aposta da OpenAI com esta versão é equipar o Codex com um memória persistente e gerenciamento de contexto muito mais amploA ferramenta pode reutilizar conversas anteriores, preservar informações importantes e recuperá-las quando necessário para dar continuidade a um projeto.

O recurso de memória, que está sendo lançado em versão prévia, permite ao Codex Lembrar preferências pessoais, correções frequentes ou dados difíceis de coletar.Isso inclui tudo, desde o conjunto típico de tecnologias de uma equipe até a forma como as pastas são organizadas, os formatos de relatório mais comuns e a tag normalmente usada no GitHub para determinados tipos de problemas.

Com esse contexto acumulado, o agente pode propor tarefas proativamenteIsso pode ser usado para sugerir a retomada de um projeto inacabado, recomendar refatorações pendentes ou notificar os usuários sobre solicitações de pull request antigas. Algumas empresas já o utilizam para monitorar conversas no Slack, Gmail ou Notion e reagir quando determinados eventos ocorrem.

O Codex também pode Planeje o trabalho para o futuro e se reative de forma independente. para concluir tarefas de longo prazo. Por exemplo, pode gerenciar uma fila de revisões de código por dias ou semanas, respondendo a comentários e atualizando a documentação sem que o desenvolvedor precise monitorá-la constantemente.

Mais de 90 complementos e suporte aprimorado para desenvolvedores.

Para concluir a mudança, a OpenAI adicionou quase 90 novos plugins do CodexIsso inclui integrações com o Microsoft Suite, GitLab Issues, Neon by Databricks, Render e Superpowers, além de suporte para servidores MCP (Model Context Protocol). O objetivo é fornecer ao agente mais fontes de contexto e maiores capacidades operacionais.

Graças a esses plugins, o Codex pode Reunir informações de diferentes serviços e agir de acordo com elas. A partir de um único espaço de trabalho, você pode revisar problemas no GitLab, consultar dados em um ambiente Databricks, atualizar documentos do Office ou interagir com serviços de implantação, sem forçar o usuário a alternar entre plataformas.

Em termos puramente técnicos, a atualização fortalece o fluxos de trabalho típicos de desenvolvedoresAgora, o Codex ajuda você a revisar solicitações de pull, gerenciar várias abas do terminal simultaneamente, conectar-se a ambientes de desenvolvimento remotos via SSH e abrir arquivos com visualizações avançadas, sejam eles PDFs, planilhas, apresentações ou documentos em outros formatos.

Tudo isso está concentrado em uma experiência unificada que, segundo a própria OpenAI, permite um progresso mais rápido. em todas as fases do ciclo de vida do softwareDesde a escrita do código inicial até os testes, implantação, documentação e manutenção, com agentes de IA colaborando continuamente no mesmo ambiente de desktop.

Disponibilidade, foco nos desenvolvedores e situação na Europa.

A nova versão do Codex já está sendo implementada no Aplicativo para desktop para macOS Para quem faz login com uma conta ChatGPT. Nem todos os recursos exigem o mesmo tipo de assinatura, e alguns recursos avançados podem depender do plano adquirido, como acontece com outras ferramentas da OpenAI.

Thibault Sottiaux, diretor do Codex, explicou que esta atualização É especialmente direcionado para desenvolvedores.Embora a intenção seja expandir o recurso para um público mais geral posteriormente, a ideia é que as equipes técnicas sejam as primeiras a aproveitar os novos agentes e fluxos de trabalho automatizados e, com o tempo, transferir esse modelo para tarefas de escritório, gerenciamento de documentos ou produtividade pessoal.

A OpenAI enfatiza que o uso de poder computacional e memória é implementado com um abordagem de segurança e conformidade regulatóriaIsso é especialmente relevante na União Europeia e no Reino Unido. Por esse motivo, recursos avançados de personalização, sugestões contextuais, memória persistente e controle direto do sistema operacional levarão um pouco mais de tempo para estarem disponíveis nesses mercados.

Em todo caso, a empresa afirma que essa evolução do Codex abre as portas para um Superaplicativo para desktop focado em automação inteligenteonde agentes de IA não apenas ajudam a escrever código, mas também coordenam tarefas, adaptam-se ao estilo de trabalho do usuário e mantêm projetos complexos em execução por longos períodos. Para os desenvolvedores de software na Europa, a mensagem é clara: novas funcionalidades estão chegando, mas com os ajustes necessários para se adequarem à estrutura regulatória existente.