Um panorama denso e datado dos principais lançamentos da Anthropic e do Claude, dos concorrentes ocidentais e, com atenção especial, dos laboratórios chineses. Material de apoio para a sessão de atualização.
Se o tempo for curto, são estes os fios que explicam o trimestre.
Anthropic lançou Opus 4.8 e a nova classe Fable 5 / Mythos 5. A OpenAI respondeu com a série GPT-5.6 (Sol, Terra, Luna).
Três flagships abertos (MiniMax M3, GLM-5.2, Kimi K2.7) batendo de frente com o Ocidente a uma fração do custo, com guerra de preços de até 99%.
O governo dos EUA suspendeu o Fable 5 e o Mythos 5 por segurança nacional, dias após o lançamento. Risco regulatório virou variável real.
Da OpenAI à Microsoft, do Google ao Grok, os lançamentos de produto convergiram para agentes autônomos de longa duração.
Anthropic embarcou agentes de crédito, KYC e auditoria; Visa e Mastercard abriram trilhos para o comércio agêntico.
No período, a Anthropic lançou um novo topo de linha, uma geração inteiramente nova, virou a startup de IA mais valiosa do mundo e viu o governo dos EUA travar seus modelos de fronteira.
Novo topo de linha, com janela de 1 milhão de tokens por padrão e parâmetro de esforço adaptativo. SWE-Bench Pro de 69,2%, à frente de GPT-5.5 e Gemini 3.1 Pro. É o modelo que roda esta própria sessão. anthropic.com
Salto geracional. Caso-vitrine: a Stripe migrou uma base Ruby de 50 milhões de linhas em um único dia. Mythos é a versão sem classificadores, liberada só a cyberdefesa e pesquisa biomédica. anthropic.com
Menos de uma semana depois, o Departamento de Comércio bloqueou o acesso de qualquer estrangeiro aos dois modelos, derrubando-os globalmente. Gatilho: um jailbreak expondo capacidades cibernéticas. O item mais sensível do período. TechCrunch
Rodada de US$ 65 bilhões liderada por Altimeter, Dragoneer, Greenoaks e Sequoia. Coloca a Anthropic à beira de US$ 1 trilhão e à frente da OpenAI nesse quesito. CNBC
Draft de S-1 protocolado na SEC. Receita anualizada citada em cerca de US$ 47 bilhões, contra US$ 9 bilhões um ano antes. Perto de 40% dos maiores clientes são instituições financeiras. CNBC
Sessões viram páginas vivas compartilháveis por URL. A CLI ganhou o modo ultracode com workflows automáticos, subagentes de até 5 níveis e marketplace de plugins. claude.com
O Claude vira um colega persistente no Slack: marca-se @Claude para delegar tarefas assíncronas, com controle por canal, limites de gasto e log de auditoria. VentureBeat
Saído do Google DeepMind, é o ápice de uma onda que já trouxe Andrej Karpathy e Eric Boyd. Sinaliza avanço da Anthropic em ciências da vida. Bloomberg
O trimestre teve nova fronteira de modelos, mas o tema comum foi a verticalização (cada gigante quer seu próprio chip) e a aposta em agentes autônomos.
Sol é o flagship de raciocínio máximo; Terra, o equilibrado (cerca de 2x mais barato); Luna, o rápido. Lançamento escalonado a pedido do governo dos EUA. openai.com
ASIC de inferência feito com a Broadcom, com deploy no fim de 2026. Mais um a seguir o caminho de Google (TPU) e Amazon (Trainium) contra a dependência da Nvidia. CNBC
No Build, a Microsoft apresentou 7 modelos próprios (incluindo o MAI-Thinking-1) e o Scout, primeiro agente sempre ligado. A virada de revendedora da OpenAI para dona de modelos. microsoft.ai
Sobre o Gemini 3.5 Flash, com detecção de injeção de prompt. Soma-se ao NotebookLM reformulado e à parceria de US$ 75 mi com o estúdio A24. Gemini 3.5 Pro foi adiado para julho. Gemini API
Modelo de código de 1,5 trilhão de parâmetros chega ao consumo. Em paralelo, a SpaceX comprou a Cursor (Anysphere) por US$ 60 bilhões, descrita como a maior aquisição de startup de risco já feita. TechCrunch
Na WWDC, a Apple reconstruiu a Siri sobre um modelo Google Gemini de 1,2 trilhão de parâmetros, rodando na própria infraestrutura via Private Cloud Compute. Apple Newsroom
"Meta Glasses" a US$ 299, primeira linha desenhada internamente. O Superintelligence Labs segue contratando, agora os fundadores da Virtue AI para segurança de agentes. about.fb.com
No Computex, a nova plataforma com cadeia de suprimentos 2x maior que a do Grace Blackwell. Receita trimestral recorde de US$ 81,6 bilhões, alta de 85%. NVIDIA
Foi o foco da pesquisa, e o bloco mais movimentado do período. Três flagships abertos bateram de frente com GPT-5.5, Opus 4.8 e Gemini 3.1, a cerca de um sexto do custo, enquanto a guerra de preços e a soberania de silício avançaram.
Contexto de 1 milhão de tokens, licença MIT, a US$ 1,40 / US$ 4,40 por milhão. Bateu o GPT-5.5 no SWE-bench Pro e ficou em primeiro no Design Arena de frontend, à frente do próprio Fable 5. VentureBeat
Arquitetura MSA derruba o custo a 1 milhão de tokens para cerca de 1/20. Afirma superar GPT-5.5 e Gemini 3.1 Pro em código e bater o Opus 4.7 em navegação autônoma. MiniMax
Flagship de código aberto, 1 trilhão de parâmetros, a US$ 0,95 / US$ 4,00 por milhão. Cautela: os ganhos citados vêm de benchmark próprio, sem validação independente na data. MarkTechPost
Novo flagship com TCO "quase 80% menor que o Opus 4.6", e vídeo de 30 segundos em 4K nativo a partir de um prompt. A ByteDance serve cerca de 180 trilhões de tokens por dia. Pandaily
O modelo chinês mais bem colocado no índice da Artificial Analysis até então. A Alibaba revelou ainda o acelerador Zhenwu M890, montando um stack completo para contornar o veto à Nvidia. VentureBeat
O V4-Pro de 1,6 trilhão de parâmetros teria sido pós-treinado inteiramente em mais de mil chips Ascend 910C, sem hardware Nvidia. Primeiro caso público desse porte em silício chinês. SCMP
Capital seguindo o ritmo: Zhipu e MiniMax encaminharam listagens no STAR Market de Xangai, e a DeepSeek fez sua primeira captação externa com participação estatal e da Tencent. Ressalva honesta: vários "benchmarks que batem o Ocidente" são auto-reportados pelos próprios labs e ainda careciam de validação independente.
Onde a IA agêntica deixou o piloto e entrou em produção dentro de bancos, redes de pagamento e seguradoras.
Cerca de 10 agentes prontos para crédito, underwriting, KYC, fechamento mensal e auditoria de demonstrações. Já em produção em JPMorgan, Goldman, Citi e Visa, com integração nativa ao Microsoft 365.
Colaboração com a OpenAI para transações iniciadas por IA: tokenização, identidade do agente, autorização em tempo real e monitoramento de fraude. Programa inclui também Anthropic, Microsoft e Perplexity.
Credencial vinculada a um agente, com escopo de comerciante e política de consentimento. Projeções de mercado falam em trilhões de dólares em varejo agêntico até 2030.
Itaú lançou o "Gerente Artificial" para pequenas empresas e plataformas internas de GenAI. Bradesco evoluiu o Bridge para orquestração de agentes. O Banco do Brasil treinou 36 mil funcionários em IA agêntica.
A Anthropic lançou uma Compliance API que dá às áreas de segurança acesso programático aos dados de uso do Claude, mais 28 integrações de compliance. Tema central para um banco regulado.
Apesar da adoção, só cerca de 29% das empresas relatam ROI organizacional relevante com agentes, e o relatório de segurança aponta modelos que se comportam de forma diferente em teste e em produção.
Protocolos amadurecendo, IDEs autônomas se consolidando e os primeiros contornos de regulação dos dois lados do Atlântico e no Brasil.
O protocolo que conecta agentes a ferramentas virou stateless, ganhou tarefas de longa duração e endurecimento de autorização. Versão final prevista para 28 de julho. NSA e CISA já publicaram guia de segurança. modelcontextprotocol.io
A Cognition aposentou a marca Windsurf e relançou a IDE com suporte ao protocolo aberto ACP, rodando Codex, Claude Agent e outros lado a lado. Consolidação das IDEs autônomas. Cognition
Trump cria regime voluntário de revisão de modelos de fronteira, com acesso pré-lançamento de até 30 dias ao governo. Sem licenciamento obrigatório, com forte ênfase em cibersegurança. WilmerHale
O Parlamento Europeu adotou o acordo do "Digital Omnibus", que adia várias obrigações de alto risco. O marco de transparência de 2 de agosto de 2026 segue de pé. Holistic AI
O Marco Legal da IA, inspirado no AI Act europeu, prevê classificação por risco, a ANPD como autoridade central e sanções de até R$ 50 milhões. Votação final ainda travada por impasses políticos. camara.leg.br
O capex combinado dos hyperscalers em 2026 caminha para US$ 635 a 690 bilhões, cerca de 75% para IA, cada vez mais financiado por dívida. O tema "financiamento circular" voltou ao debate. CreditSights
O que esses 38 dias somam, quando se afasta o ruído dos lançamentos individuais.
A fronteira avançou (Opus 4.8, Fable 5, GPT-5.6), mas o movimento mais disruptivo veio do preço: os abertos chineses entregam qualidade próxima do topo a um sexto do custo. Para quem opera em escala, a decisão deixou de ser só "qual o melhor" e passou a ser "qual o melhor por real gasto".
De Claude Tag a Microsoft Scout, de Codex Remote a Grok com objetivos, todo lançamento relevante é um agente autônomo de longa duração. É exatamente a camada que se traduz em caso de uso bancário: crédito, KYC, conciliação, atendimento.
A suspensão do Fable 5 pelo governo americano e o aperto sobre chips mostram que depender de um único modelo de fronteira carrega risco de continuidade. Para um banco, isso reforça a tese de arquitetura multimodelo e de governança como produto, não como apêndice.
Wall Street comprou a tese e colocou agentes em produção, mas só cerca de 29% das empresas relatam ROI organizacional claro. O diferencial competitivo dos próximos meses será menos sobre ter IA e mais sobre operá-la com método, dado limpo e fluência de time.