Notícias Tech

Claude Opus 4.7 Chegou: Melhor Modelo de Coding do Mercado, Visão 3× Maior e Mesmo Preço

A Anthropic lançou o Claude Opus 4.7 em 16 de abril de 2026. SWE-bench Pro subiu de 53,4% para 64,3%, visão triplicou para 3,75MP, e chegou um novo nível de esforço xhigh — tudo pelo mesmo preço do Opus 4.6.

Gpor Genildo Souza17 de abr.6 min de leitura

Claude Opus 4.7 Chegou: Melhor Modelo de Coding do Mercado, Visão 3× Maior e Mesmo Preço

16 de abril de 2026. A Anthropic acabou de lançar o Claude Opus 4.7 — disponível agora no claude.ai, na API, no Amazon Bedrock, no Google Cloud Vertex AI e no Microsoft Foundry.

Não é uma atualização incremental. O SWE-bench Pro subiu 10,9 pontos percentuais. O CursorBench subiu 12 pontos. A resolução de visão triplicou. E — detalhe que empresas ficam felizes em ouvir — o preço não mudou.

SWE-bench Pro

64,3%

era 53,4% no Opus 4.6 (+10,9pp)

CursorBench

70%

era 58% (+12pp) — melhor coding do mercado

Visão

3,75MP

era 1,15MP — 3× mais resolução

O que mudou de verdade

O Opus 4.7 foi construído em torno de três problemas reais que usuários do Opus 4.6 reportavam: o modelo às vezes abandonava tarefas longas no meio, às vezes entregava código que parecia correto mas falhou na revisão, e às vezes interpretava instruções de forma mais livre do que o esperado.

As três apostas centrais do Opus 4.7 são diretamente contra esses problemas: persistência em tarefas longas, auto-verificação antes de reportar e seguimento literal de instruções.

Benchmarks: onde o Opus 4.7 ganhou e onde cedeu

Comparativo Opus 4.6 vs Opus 4.7 nos principais benchmarks

Opus 4.7 vs GPT-5.4 vs Gemini 3.1 Pro

Claude Opus 4.7 lidera

SWE-bench Pro: 64,3% vs 57,7% (GPT) e 54,2% (Gemini) SWE-bench Verified: 87,6% CursorBench: 70% — melhor coding em IDE do mercado MCP-Atlas (tool use): 77,3% vs 68,1% (GPT) Finance Agent: 64,4% vs 59,7% (Gemini) GDPVal-AA knowledge work: Elo 1.753 vs 1.674 (GPT)

Onde perde ou empata

BrowseComp: 79,3% vs 89,3% (GPT) e 85,9% (Gemini) GPQA Diamond: 94,2% — praticamente empatados (GPT: 94,4%, Gemini: 94,3%) Terminal-Bench 2.0: 69,4% vs 75,1% (GPT) Humanity's Last Exam: 54,7% vs 58,7% (GPT) CyberGym: intencional — capabilities cyber foram reduzidas durante o treinamento

Visão 3× melhor — o que isso muda na prática

O Opus 4.6 processava imagens em até 1.568px no lado longo (1,15 megapixels). O Opus 4.7 vai até 2.576px (3,75 megapixels) — mais de 3× mais pixels.

Na prática: diagramas técnicos densos, capturas de tela de IDEs, documentos PDF de alta resolução, mockups de design e gráficos financeiros complexos chegam com fidelidade real — não interpolados. O benchmark CharXiv de raciocínio visual com ferramentas saltou de 84,7% para 91,0%.

O novo nível xhigh — controle fino entre qualidade e custo

O Opus 4.6 tinha quatro níveis de esforço: low, medium, high e max. O Opus 4.7 insere um novo nível entre high e max:

Escala de níveis de esforço no Opus 4.7

O xhigh é agora o padrão do Claude Code para todos os planos. A lógica é simples: se uma tarefa exige três tentativas no high pra acertar, uma tentativa no xhigh costuma ser mais barata no total — menos retentativas, menos tokens gastos.

Task budgets, /ultrareview e memória cross-session

Três features novas que chegam junto com o modelo:

— Task budgets (beta pública): defina um teto de tokens para agentes autônomos. O modelo vê o contador decrescendo e prioriza o trabalho, terminando de forma limpa ao invés de cortar abruptamente. Ativa via header task-budgets-2026-03-13 + parâmetro output_config.task_budget.

— /ultrareview no Claude Code: novo comando que roda uma sessão de revisão dedicada, lê todo o diff e sinaliza o que um revisor humano cuidadoso detectaria. 3 usos gratuitos nos planos Pro e Max no lançamento.

— Memória cross-session: o Opus 4.7 é melhor em usar memória baseada em sistema de arquivos. Guarda notas importantes entre sessões longas de trabalho, reduzindo o contexto que você precisa colar no início de cada nova sessão.

Atenção na migração do 4.6

A Anthropic chamou de "direct upgrade" mas há mudanças que afetam token usage e comportamento:

O elefante na sala: o Mythos Preview

A Anthropic foi transparente: o Opus 4.7 não iguala o Claude Mythos Preview, seu modelo mais poderoso — que não está disponível publicamente por preocupações de segurança.

O Mythos Preview foi lançado semana passada para um grupo seleto de empresas de tecnologia e cibersegurança como parte do Project Glasswing. O Opus 4.7 é o primeiro modelo onde a Anthropic testou salvaguardas contra uso em ataques cibernéticos — o que aprendem aqui vai guiar como eventualmente liberam modelos de nível Mythos em escala.

Preço, disponibilidade e model ID

Preço idêntico ao Opus 4.6: $5 por milhão de tokens de entrada e $25 por milhão de tokens de saída. Prompt caching reduz em até 90%. Batch processing reduz em 50%.

Model ID na API: claude-opus-4-7. Disponível em: claude.ai (Pro, Max, Team, Enterprise), API Anthropic, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.

O que fica do Opus 4.7

SWE-bench Pro: 64,3% (+10,9pp vs 4.6) — melhor modelo de coding geralmente disponível no mercado hoje.
CursorBench: 70% (+12pp) — o benchmark que mede o que desenvolvedores realmente fazem no dia a dia em IDE.
Visão 3,75MP (era 1,15MP) — diagramas técnicos, screenshots e mockups chegam com fidelidade real.
xhigh: novo nível de esforço entre high e max — agora padrão no Claude Code. Mais qualidade sem pagar o custo do max.
Task budgets (beta): teto de tokens para agentes autônomos. Fim das surpresas de cobrança em runs noturnos.
/ultrareview no Claude Code: revisão paralela multi-agente do diff com sinalização de bugs e problemas de design.
Mesmo preço do Opus 4.6: $5/$25 por milhão de tokens. Não tem upgrade gratuito mais barato que esse.
BrowseComp regrediu: 79,3% (era 83,7%). Agentes que dependem de pesquisa web intensiva devem testar antes de migrar.
Breaking changes na migração: tokenizador novo (1,0–1,35× mais tokens), instruções mais literais, thinking adaptativo obrigatório.

Para a maioria dos desenvolvedores que usam Claude Code no dia a dia, o Opus 4.7 é uma atualização direta sem decisão a tomar. Mesmo preço, melhor modelo.

Para times com agentes em produção, a migração pede atenção: medir o impacto do novo tokenizador, revisar prompts que dependiam de interpretação livre e configurar task budgets antes de ligar o auto mode.

#Claude #AI

16 de abril de 2026. A Anthropic acabou de lançar o Claude Opus 4.7 — disponível agora no claude.ai, na API, no Amazon Bedrock, no Google Cloud Vertex AI e no Microsoft Foundry.

SWE-bench Pro

64,3%

era 53,4% no Opus 4.6 (+10,9pp)

CursorBench

70%

era 58% (+12pp) — melhor coding do mercado

Visão

3,75MP

era 1,15MP — 3× mais resolução

O que mudou de verdade

As três apostas centrais do Opus 4.7 são diretamente contra esses problemas: persistência em tarefas longas, auto-verificação antes de reportar e seguimento literal de instruções.

Benchmarks: onde o Opus 4.7 ganhou e onde cedeu

Comparativo Opus 4.6 vs Opus 4.7 nos principais benchmarks

Opus 4.7 vs GPT-5.4 vs Gemini 3.1 Pro

Claude Opus 4.7 lidera

Onde perde ou empata

Visão 3× melhor — o que isso muda na prática

O Opus 4.6 processava imagens em até 1.568px no lado longo (1,15 megapixels). O Opus 4.7 vai até 2.576px (3,75 megapixels) — mais de 3× mais pixels.

O novo nível xhigh — controle fino entre qualidade e custo

O Opus 4.6 tinha quatro níveis de esforço: low, medium, high e max. O Opus 4.7 insere um novo nível entre high e max:

Escala de níveis de esforço no Opus 4.7

Task budgets, /ultrareview e memória cross-session

Três features novas que chegam junto com o modelo:

Atenção na migração do 4.6

A Anthropic chamou de "direct upgrade" mas há mudanças que afetam token usage e comportamento:

O elefante na sala: o Mythos Preview

A Anthropic foi transparente: o Opus 4.7 não iguala o Claude Mythos Preview, seu modelo mais poderoso — que não está disponível publicamente por preocupações de segurança.

Preço, disponibilidade e model ID

Preço idêntico ao Opus 4.6: $5 por milhão de tokens de entrada e $25 por milhão de tokens de saída. Prompt caching reduz em até 90%. Batch processing reduz em 50%.

Model ID na API: claude-opus-4-7. Disponível em: claude.ai (Pro, Max, Team, Enterprise), API Anthropic, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.

O que fica do Opus 4.7

SWE-bench Pro: 64,3% (+10,9pp vs 4.6) — melhor modelo de coding geralmente disponível no mercado hoje.
CursorBench: 70% (+12pp) — o benchmark que mede o que desenvolvedores realmente fazem no dia a dia em IDE.
Visão 3,75MP (era 1,15MP) — diagramas técnicos, screenshots e mockups chegam com fidelidade real.
xhigh: novo nível de esforço entre high e max — agora padrão no Claude Code. Mais qualidade sem pagar o custo do max.
Task budgets (beta): teto de tokens para agentes autônomos. Fim das surpresas de cobrança em runs noturnos.
/ultrareview no Claude Code: revisão paralela multi-agente do diff com sinalização de bugs e problemas de design.
Mesmo preço do Opus 4.6: $5/$25 por milhão de tokens. Não tem upgrade gratuito mais barato que esse.
BrowseComp regrediu: 79,3% (era 83,7%). Agentes que dependem de pesquisa web intensiva devem testar antes de migrar.
Breaking changes na migração: tokenizador novo (1,0–1,35× mais tokens), instruções mais literais, thinking adaptativo obrigatório.

Para a maioria dos desenvolvedores que usam Claude Code no dia a dia, o Opus 4.7 é uma atualização direta sem decisão a tomar. Mesmo preço, melhor modelo.

Claude Opus 4.7 Chegou: Melhor Modelo de Coding do Mercado, Visão 3× Maior e Mesmo Preço

O que mudou de verdade

Benchmarks: onde o Opus 4.7 ganhou e onde cedeu

Opus 4.7 vs GPT-5.4 vs Gemini 3.1 Pro

Visão 3× melhor — o que isso muda na prática

O novo nível xhigh — controle fino entre qualidade e custo

Task budgets, /ultrareview e memória cross-session

Atenção na migração do 4.6

O elefante na sala: o Mythos Preview

Preço, disponibilidade e model ID

Arsenal do dev de elite.

Fim do subsídio no Claude Agent SDK: prepare seu orçamento para um aumento de 15x a 30x nos custos de IA

A Microsoft Admitiu Nos Próprios Termos que o Copilot É Só Entretenimento — e os Números Provam

O Copilot CLI Virou Agente: Escreve Código, Roda Testes e Corrige Erros Sem Você Pedir

Claude Opus 4.7 Chegou: Melhor Modelo de Coding do Mercado, Visão 3× Maior e Mesmo Preço

O que mudou de verdade

Benchmarks: onde o Opus 4.7 ganhou e onde cedeu

Opus 4.7 vs GPT-5.4 vs Gemini 3.1 Pro

Visão 3× melhor — o que isso muda na prática

O novo nível xhigh — controle fino entre qualidade e custo

Task budgets, /ultrareview e memória cross-session

Atenção na migração do 4.6

O elefante na sala: o Mythos Preview

Preço, disponibilidade e model ID

Arsenal do dev de elite.

Fim do subsídio no Claude Agent SDK: prepare seu orçamento para um aumento de 15x a 30x nos custos de IA

A Microsoft Admitiu Nos Próprios Termos que o Copilot É Só Entretenimento — e os Números Provam

O Copilot CLI Virou Agente: Escreve Código, Roda Testes e Corrige Erros Sem Você Pedir