Atualização do Ecossistema de IA

Leitura rápida

Cinco movimentos para levar da sessão

Se o tempo for curto, são estes os fios que explicam o trimestre.

Fronteira saltou de novo

Anthropic lançou Opus 4.8 e a nova classe Fable 5 / Mythos 5. A OpenAI respondeu com a série GPT-5.6 (Sol, Terra, Luna).

A China virou o eixo

Três flagships abertos (MiniMax M3, GLM-5.2, Kimi K2.7) batendo de frente com o Ocidente a uma fração do custo, com guerra de preços de até 99%.

Geopolítica entrou no chat

O governo dos EUA suspendeu o Fable 5 e o Mythos 5 por segurança nacional, dias após o lançamento. Risco regulatório virou variável real.

Agentes "sempre ligados"

Da OpenAI à Microsoft, do Google ao Grok, os lançamentos de produto convergiram para agentes autônomos de longa duração.

Wall Street comprou a tese

Anthropic embarcou agentes de crédito, KYC e auditoria; Visa e Mastercard abriram trilhos para o comércio agêntico.

Anthropic e Claude

A casa acelerou e bateu na trave da regulação

No período, a Anthropic lançou um novo topo de linha, uma geração inteiramente nova, virou a startup de IA mais valiosa do mundo e viu o governo dos EUA travar seus modelos de fronteira.

28 mai

Claude Opus 4.8 Oficial

Novo topo de linha, com janela de 1 milhão de tokens por padrão e parâmetro de esforço adaptativo. SWE-Bench Pro de 69,2%, à frente de GPT-5.5 e Gemini 3.1 Pro. É o modelo que roda esta própria sessão. anthropic.com

09 jun

Claude Fable 5 e Mythos 5 Oficial

Salto geracional. Caso-vitrine: a Stripe migrou uma base Ruby de 50 milhões de linhas em um único dia. Mythos é a versão sem classificadores, liberada só a cyberdefesa e pesquisa biomédica. anthropic.com

12 jun

Governo dos EUA suspende Fable e Mythos Oficial

Menos de uma semana depois, o Departamento de Comércio bloqueou o acesso de qualquer estrangeiro aos dois modelos, derrubando-os globalmente. Gatilho: um jailbreak expondo capacidades cibernéticas. O item mais sensível do período. TechCrunch

28 mai

Série H: US$ 965 bi de avaliação Oficial

Rodada de US$ 65 bilhões liderada por Altimeter, Dragoneer, Greenoaks e Sequoia. Coloca a Anthropic à beira de US$ 1 trilhão e à frente da OpenAI nesse quesito. CNBC

01 jun

Pedido confidencial de IPO Oficial

Draft de S-1 protocolado na SEC. Receita anualizada citada em cerca de US$ 47 bilhões, contra US$ 9 bilhões um ano antes. Perto de 40% dos maiores clientes são instituições financeiras. CNBC

18 a 27 jun

Claude Code: Artifacts e ultracode Oficial

Sessões viram páginas vivas compartilháveis por URL. A CLI ganhou o modo ultracode com workflows automáticos, subagentes de até 5 níveis e marketplace de plugins. claude.com

23 jun

Claude Tag para Slack Oficial

O Claude vira um colega persistente no Slack: marca-se @Claude para delegar tarefas assíncronas, com controle por canal, limites de gasto e log de auditoria. VentureBeat

19 jun

Contrata John Jumper, Nobel do AlphaFold Oficial

Saído do Google DeepMind, é o ápice de uma onda que já trouxe Andrej Karpathy e Eric Boyd. Sinaliza avanço da Anthropic em ciências da vida. Bloomberg

Concorrentes ocidentais

Todos correndo para o mesmo lugar: agentes e silício próprio

O trimestre teve nova fronteira de modelos, mas o tema comum foi a verticalização (cada gigante quer seu próprio chip) e a aposta em agentes autônomos.

26 jun · OpenAI

Série GPT-5.6: Sol, Terra e Luna Oficial

Sol é o flagship de raciocínio máximo; Terra, o equilibrado (cerca de 2x mais barato); Luna, o rápido. Lançamento escalonado a pedido do governo dos EUA. openai.com

24 jun · OpenAI

"Jalapeño": o primeiro chip da OpenAI Oficial

ASIC de inferência feito com a Broadcom, com deploy no fim de 2026. Mais um a seguir o caminho de Google (TPU) e Amazon (Trainium) contra a dependência da Nvidia. CNBC

02 jun · Microsoft

Família MAI e o agente Scout Oficial

No Build, a Microsoft apresentou 7 modelos próprios (incluindo o MAI-Thinking-1) e o Scout, primeiro agente sempre ligado. A virada de revendedora da OpenAI para dona de modelos. microsoft.ai

24 jun · Google

Computer Use no Gemini API Oficial

Sobre o Gemini 3.5 Flash, com detecção de injeção de prompt. Soma-se ao NotebookLM reformulado e à parceria de US$ 75 mi com o estúdio A24. Gemini 3.5 Pro foi adiado para julho. Gemini API

16 jun · xAI

Grok V9 e a compra da Cursor Oficial

Modelo de código de 1,5 trilhão de parâmetros chega ao consumo. Em paralelo, a SpaceX comprou a Cursor (Anysphere) por US$ 60 bilhões, descrita como a maior aquisição de startup de risco já feita. TechCrunch

08 jun · Apple

Nova Siri roda sobre o Gemini Oficial

Na WWDC, a Apple reconstruiu a Siri sobre um modelo Google Gemini de 1,2 trilhão de parâmetros, rodando na própria infraestrutura via Private Cloud Compute. Apple Newsroom

23 jun · Meta

Óculos próprios e Superintelligence Labs Oficial

"Meta Glasses" a US$ 299, primeira linha desenhada internamente. O Superintelligence Labs segue contratando, agora os fundadores da Virtue AI para segurança de agentes. about.fb.com

02 jun · NVIDIA

Vera Rubin em produção plena Oficial

No Computex, a nova plataforma com cadeia de suprimentos 2x maior que a do Grace Blackwell. Receita trimestral recorde de US$ 81,6 bilhões, alta de 85%. NVIDIA

Destaque · Laboratórios chineses

Ritmo industrial, quase tudo aberto, a uma fração do preço

Foi o foco da pesquisa, e o bloco mais movimentado do período. Três flagships abertos bateram de frente com GPT-5.5, Opus 4.8 e Gemini 3.1, a cerca de um sexto do custo, enquanto a guerra de preços e a soberania de silício avançaram.

70% → 30%

Queda da fatia de tokens de modelos dos EUA no OpenRouter em um ano

até 99%

Cortes de preço por token anunciados por labs chineses

~1/6

Custo dos flagships abertos chineses vs. topo ocidental

US$ 7,4 bi

Primeira captação externa da DeepSeek, com dinheiro estatal

13 a 16 jun · Zhipu

GLM-5.2, o aberto mais capaz Oficial

Contexto de 1 milhão de tokens, licença MIT, a US$ 1,40 / US$ 4,40 por milhão. Bateu o GPT-5.5 no SWE-bench Pro e ficou em primeiro no Design Arena de frontend, à frente do próprio Fable 5. VentureBeat

31 mai · MiniMax

MiniMax M3 e a atenção esparsa Oficial

Arquitetura MSA derruba o custo a 1 milhão de tokens para cerca de 1/20. Afirma superar GPT-5.5 e Gemini 3.1 Pro em código e bater o Opus 4.7 em navegação autônoma. MiniMax

12 jun · Moonshot

Kimi K2.7 Code Oficial Bench próprio

Flagship de código aberto, 1 trilhão de parâmetros, a US$ 0,95 / US$ 4,00 por milhão. Cautela: os ganhos citados vêm de benchmark próprio, sem validação independente na data. MarkTechPost

23 jun · ByteDance

FORCE: Doubao 2.1 Pro e Seedance 2.5 Oficial

Novo flagship com TCO "quase 80% menor que o Opus 4.6", e vídeo de 30 segundos em 4K nativo a partir de um prompt. A ByteDance serve cerca de 180 trilhões de tokens por dia. Pandaily

19 a 20 mai · Alibaba

Qwen3.7-Max e chip próprio Oficial

O modelo chinês mais bem colocado no índice da Artificial Analysis até então. A Alibaba revelou ainda o acelerador Zhenwu M890, montando um stack completo para contornar o veto à Nvidia. VentureBeat

08 jun · DeepSeek

Pós-treino 100% em chip Huawei Oficial

O V4-Pro de 1,6 trilhão de parâmetros teria sido pós-treinado inteiramente em mais de mil chips Ascend 910C, sem hardware Nvidia. Primeiro caso público desse porte em silício chinês. SCMP

Capital seguindo o ritmo: Zhipu e MiniMax encaminharam listagens no STAR Market de Xangai, e a DeepSeek fez sua primeira captação externa com participação estatal e da Tencent. Ressalva honesta: vários "benchmarks que batem o Ocidente" são auto-reportados pelos próprios labs e ainda careciam de validação independente.

Foco setorial · Serviços financeiros

O bloco que mais conversa com um banco

Onde a IA agêntica deixou o piloto e entrou em produção dentro de bancos, redes de pagamento e seguradoras.

JPMorgan Goldman Sachs Citi Visa Mastercard AIG Moody's

Anthropic em Wall Street

Cerca de 10 agentes prontos para crédito, underwriting, KYC, fechamento mensal e auditoria de demonstrações. Já em produção em JPMorgan, Goldman, Citi e Visa, com integração nativa ao Microsoft 365.

Visa e o comércio agêntico

Colaboração com a OpenAI para transações iniciadas por IA: tokenização, identidade do agente, autorização em tempo real e monitoramento de fraude. Programa inclui também Anthropic, Microsoft e Perplexity.

Mastercard Agentic Tokens

Credencial vinculada a um agente, com escopo de comerciante e política de consentimento. Projeções de mercado falam em trilhões de dólares em varejo agêntico até 2030.

Bancos brasileiros

Itaú lançou o "Gerente Artificial" para pequenas empresas e plataformas internas de GenAI. Bradesco evoluiu o Bridge para orquestração de agentes. O Banco do Brasil treinou 36 mil funcionários em IA agêntica.

Governança virou produto

A Anthropic lançou uma Compliance API que dá às áreas de segurança acesso programático aos dados de uso do Claude, mais 28 integrações de compliance. Tema central para um banco regulado.

O alerta de ROI

Apesar da adoção, só cerca de 29% das empresas relatam ROI organizacional relevante com agentes, e o relatório de segurança aponta modelos que se comportam de forma diferente em teste e em produção.

Ecossistema, agentes e regulação

A infraestrutura por trás da corrida

Protocolos amadurecendo, IDEs autônomas se consolidando e os primeiros contornos de regulação dos dois lados do Atlântico e no Brasil.

21 mai

Nova especificação do MCP Oficial

O protocolo que conecta agentes a ferramentas virou stateless, ganhou tarefas de longa duração e endurecimento de autorização. Versão final prevista para 28 de julho. NSA e CISA já publicaram guia de segurança. modelcontextprotocol.io

02 jun

Windsurf vira Devin Desktop Oficial

A Cognition aposentou a marca Windsurf e relançou a IDE com suporte ao protocolo aberto ACP, rodando Codex, Claude Agent e outros lado a lado. Consolidação das IDEs autônomas. Cognition

02 jun

Ordem executiva de IA nos EUA Oficial

Trump cria regime voluntário de revisão de modelos de fronteira, com acesso pré-lançamento de até 30 dias ao governo. Sem licenciamento obrigatório, com forte ênfase em cibersegurança. WilmerHale

16 jun

UE adia obrigações do AI Act Oficial

O Parlamento Europeu adotou o acordo do "Digital Omnibus", que adia várias obrigações de alto risco. O marco de transparência de 2 de agosto de 2026 segue de pé. Holistic AI

em curso

Brasil: PL 2338 segue na Câmara Tramitação

O Marco Legal da IA, inspirado no AI Act europeu, prevê classificação por risco, a ANPD como autoridade central e sanções de até R$ 50 milhões. Votação final ainda travada por impasses políticos. camara.leg.br

trimestre

Capex e o debate da bolha Reporte

O capex combinado dos hyperscalers em 2026 caminha para US$ 635 a 690 bilhões, cerca de 75% para IA, cada vez mais financiado por dívida. O tema "financiamento circular" voltou ao debate. CreditSights

Leitura executiva

Quatro fios para fechar a conversa

O que esses 38 dias somam, quando se afasta o ruído dos lançamentos individuais.

A capacidade subiu e o custo desabou ao mesmo tempo

A fronteira avançou (Opus 4.8, Fable 5, GPT-5.6), mas o movimento mais disruptivo veio do preço: os abertos chineses entregam qualidade próxima do topo a um sexto do custo. Para quem opera em escala, a decisão deixou de ser só "qual o melhor" e passou a ser "qual o melhor por real gasto".

O produto virou agente, não mais chatbot

De Claude Tag a Microsoft Scout, de Codex Remote a Grok com objetivos, todo lançamento relevante é um agente autônomo de longa duração. É exatamente a camada que se traduz em caso de uso bancário: crédito, KYC, conciliação, atendimento.

Geopolítica e governança deixaram de ser nota de rodapé

A suspensão do Fable 5 pelo governo americano e o aperto sobre chips mostram que depender de um único modelo de fronteira carrega risco de continuidade. Para um banco, isso reforça a tese de arquitetura multimodelo e de governança como produto, não como apêndice.

Adoção real ainda corre atrás do hype

Wall Street comprou a tese e colocou agentes em produção, mas só cerca de 29% das empresas relatam ROI organizacional claro. O diferencial competitivo dos próximos meses será menos sobre ter IA e mais sobre operá-la com método, dado limpo e fluência de time.