Qwen3.7-Plus unifica visão e linguagem em um modelo multimodal para agentes. MiniMax M3 mira código, tarefas agenticas, contexto de até 1 milhão de tokens e input nativo de imagem e vídeo. A rota aberta segue pressionando quem vende agente fechado.
Codex Sites permite transformar conversa em app, protótipo ou página compartilhável

OpenAI colocou Sites, plugins e annotations no Codex.
O Codex já era forte como agente de código. A atualização empurra a ferramenta para outro território: criar websites e apps interativos, refinar entregas no próprio fluxo e adaptar o agente a funções que não vivem só no repo. A OpenAI diz que mais de 5 milhões de pessoas usam Codex por semana, e que não-devs já representam cerca de 20% do uso.
O detalhe que importa é o formato da entrega. Com Codex Sites, o agente começa a devolver algo navegável, compartilhável e revisável por outras pessoas do time.
Microsoft lança o agente Scout e 7 novos modelos próprios.

A Microsoft apresentou o Scout como seu primeiro Autopilot agent dentro do Microsoft 365.
Scout se conecta a Teams, Outlook, OneDrive, SharePoint, chats, email, calendário e contatos. Pelo desktop, estende o alcance para browser, recursos locais e MCP servers. A Microsoft também apresentou sete novos modelos MAI para imagem, voz, transcrição, coding e reasoning.
Hermes Desktop cria uma alternativa aberta ao Codex e ao Claude no computador

A Nous Research lançou o Hermes Desktop como app nativo para macOS, Windows e Linux.
Ele leva para o computador um agente open-source com memória persistente, skills reutilizáveis, browser automation, terminal, edição de arquivos, delegação e busca em sessões passadas.
NVIDIA potencializa novos computadores para rodar agentes localmente

A Microsoft apresentou o Surface RTX Spark Dev Box, e a NVIDIA colocou RTX Spark e Vera e Nemotron 3 Ultra no centro da conversa sobre agentes.
O Surface RTX Spark Dev Box é um PC compacto para desenvolvimento local-first com IA. A NVIDIA descreve RTX Spark como uma classe de Windows PCs para personal agents, com até 1 petaflop de performance e 128 GB de memória unificada. Vera entra como CPU para workloads agenticos. Nemotron 3 Ultra fecha a camada de modelo: um MoE aberto de 550B parâmetros, até 1 milhão de tokens de contexto e foco em agentes longos e até 30% menos custo em tarefas agenticas frente a outros modelos abertos da classe.
