Choque de novidade. Em 16 de abril de 2025 a OpenAI lançou dois modelos que mudam o jogo: o3 e o4‑mini. O o3 atingiu 69,1 % no rigoroso teste SWE‑Bench Verified, superando com folga gerações anteriores. Já o o4‑mini cravou 82 % no MMLU, a um custo de apenas US$ 0,15 por milhão de tokens de entrada e US$ 0,60 por milhão de saída. Performance de elite, preço de modelo enxuto.
Por que isso importa? Os dois modelos “pensam” com imagens — leem rascunhos, planilhas e gráficos para responder com precisão. Eles também operam todas as ferramentas internas do ChatGPT, do navegador ao Python, sem gambiarras. Em benchmarks abertos, o3 supera versões anteriores em código, matemática e ciência, enquanto o4‑mini entrega um equilíbrio raro de velocidade e economia, ideal para quem precisa rodar IA em escala de PME.
Para usuários do ChatGPT Plus, Pro ou Team, o acesso é imediato; bastam alguns cliques para testar as novidades. Se você dirige um negócio e quer ir além de chatbots básicos, estes números mostram uma oportunidade clara: mais cérebro, menos custo, zero enrolação.
o3: inteligência que enxerga, raciocina e age
O o3 é o novo motor por trás do ChatGPT. Mas não é só mais um upgrade. É um salto. Ele vê, entende, responde e age — tudo ao mesmo tempo. E faz isso com uma precisão que dobra os acertos da geração anterior.
Esse modelo lê textos complexos, interpreta imagens e executa tarefas sozinho. Tudo dentro da mesma interface. Sem plugins.
Multimodal de verdade
O3 entende imagens como se estivesse na sala com você. Pode interpretar gráficos, rascunhos à mão ou uma foto do seu dashboard. Dá zoom, gira a imagem e explica o que está vendo. Em segundos.
Abre sites, lê PDFs, executa código, gera imagens. Tudo numa mesma sessão. Além disso, alterna entre ferramentas sem que você precise configurar nada.
Benchmarks que impressionam
Os testes não deixam dúvidas:
| Teste | o3 | Modelo anterior (o1‑pro) |
|---|---|---|
| SWE‑Bench Verified | 69,1 % | 38 % |
| ARC‑AGI | 88 % | 32 % |
O que isso quer dizer? Que ele compila códigos, resolve contas e entrega respostas sólidas — tudo com mais velocidade.
O que isso significa para você
- Menos tempo quebrando a cabeça. Deixe o model analisar planilhas e sugerir correções.
- Suporte visual instantâneo. Fotografe o quadro branco da reunião; ele devolve um plano de ação.
- Automação sem dor. Integre via API e tenha relatórios diários prontos.
o3 junta visão, lógica e automação num único pacote. Potência de modelo premium, sem precisar contratar equipe de dados.
o4‑mini: desempenho de elite, preço de entrada
A OpenAI colocou o turbo em IA enxuta. O o4‑mini entrega raciocínio multimodal, usa todas as ferramentas do ChatGPT e roda em alta velocidade — tudo isso custando US$ 1,10 por milhão de tokens de entrada e US$ 4,40 por milhão de saída, o menor preço da linha de modelos de raciocínio da empresa. No teste AIME 2025 de matemática, cravou 99,5 % quando pôde usar Python, superando a maioria dos modelos maiores. Ele ainda “pensa” com imagens e é descrito pela OpenAI como “menor e mais rápido” que seus irmãos — sem perder a pontaria nos cálculos e no código.
Performance sem gorduras
- Foco em lógica e números. No AIME, resolve praticamente todas as questões com auxílio de código, mostrando que tamanho não limita raciocínio profundo.
- Integra imagens na cadeia de pensamento. Pode analisar rascunhos, gráficos ou fotos do quadro branco e responder com contexto preciso.
- Benchmarks internos reforçam consistência. A OpenAI aponta ganhos claros em matemática, código e visão, mesmo abaixo do limite de risco do novo Preparedness Framework OpenAIOpenAI.
Preço que cabe no caixa da PME
- Token barato. Entrada a US$ 1,10/M e saída a US$ 4,40/M; valores quase 4× mais baixos que o o3 e 10× inferiores a um GPT‑4 padrão.
- Batch API corta a fatura pela metade em tarefas que podem rodar assíncronas.
- Plano gratuito com limite. Qualquer usuário do ChatGPT sem assinatura já pode testar o4‑mini.
Velocidade que acompanha o ritmo dos negócios
- Resposta rápida. A própria OpenAI descreve o4‑mini como “mais rápido” que modelos maiores, ideal para fluxos em tempo real Axios.
- Baixa latência validada em nuvem. Guias da Azure recomendam a versão mini para quem precisa do menor tempo de espera nas chamadas da API Microsoft Learn.
- Throughput otimizado. Benchmarks independentes mostram mini sustentando mais de 80 tokens por segundo, batendo modelos premium em velocidade‑por‑dólar DocsBot AI.
Casos de uso
| Desafio comum | Como o4‑mini ajuda | Resultado esperado |
|---|---|---|
| Relatórios diários | Lê dashboards, cria resumo e envia por e‑mail. | Fechamento de mercado pronto em minutos. |
| Suporte ao cliente | Classifica tickets, sugere respostas e atualiza CRM. | Menos tempo de atendimento, maior satisfação. |
| Brainstorm visual | Analisa esboços de produto e gera checklist de melhorias. | Iterações de design mais rápidas. |
| Rotinas de código | Refatora scripts ou corrige bugs simples direto na API. | Menos horas gastas em manutenção. |
o4‑mini entrega cérebro de modelo premium em corpo “enxuto”. Se você precisa cortar custos sem perder precisão, ele é a pedida certa.
Imagens que Pensam por Você
Solte uma foto. O modelo enxerga, entende e devolve ação. A nova funcionalidade “Think with Images” no ChatGPT troca o modo texto por visão instantânea, ligando o motor o3/o4‑mini para interpretar gráficos, PDFs ou rabiscos na hora. Não exige plug‑in, não pede tag especial: basta arrastar e soltar.
Como funciona?
- A imagem vira texto interno e passa por camadas de raciocínio que já superam GPT‑4o em precisão visual.
- O modelo pode usar todas as ferramentas do ChatGPT — navegar, rodar Python, gerar novas imagens — dentro da mesma conversa.
- Resultados aparecem em segundos, mesmo na versão mini, que prioriza velocidade.
Por que importa para o seu negócio?
Veja alguns exemplos de como usar os novos modelos da OpenAI:
| Tarefa | O que a IA faz | Ganho prático |
|---|---|---|
| Análise de dashboard | Lê gráfico, destaca picos, sugere ação. | Você decide rápido, sem abrir Excel. |
| Revisão de contrato escaneado | Aponta cláusulas de risco. | Evita erro caro antes de assinar. |
| Briefing de design | Entende rascunho, gera checklist de ajustes. | Iterações mais ágeis, menos retrabalho. |
| Suporte técnico | Interpreta foto do erro na tela e responde com passo‑a‑passo. | Fechamento de ticket em minutos. |
Detalhes que valem ouro
- Reconhece texto pequeno, logotipos e símbolos com fidelidade.
- Armazena cada imagem em biblioteca própria; fácil buscar depois.
- Segurança não ficou de fora: todo upload passa pelo Preparedness Framework antes do modelo agir.
Lucro Rápido, Custo Baixo
Os novos modelos da OpenAI chegam na hora certa: a maioria das PMEs já testa IA e quem acelera agora ganha espaço antes dos concorrentes. Estudos mostram adoção recorde, cortes de custos no suporte ao cliente e saltos de conversão em marketing. Preço de entrada caiu, velocidade subiu. Resultado? Produtividade alta sem inflar a folha.
Qual modelo escolher? o3 vs o4‑mini
| Item‑chave | o3 | o4‑mini |
|---|---|---|
| Foco | Raciocínio profundo em código, matemática e ciência | Inteligência “suficientemente boa” com custo mínimo |
| Benchmark | 69,1 % no SWE‑Bench Verified | 82 % no MMLU |
| Preço (USD / 1M tokens) | In: 10,00 / Out: 40,00 | In: 0,15 / Out: 0,60 |
| Velocidade | Mais lenta (latência maior, pensado para tarefas longas) | ~ 85 tokens/s — ideal para tempo real |
| Visão | Sim, “think with images” nativo | Também suporta visão, mas otimizado para custo |
| Ferramentas | Acessa navegador, Python, geração de imagens, arquivos | Mesmo conjunto, sem limite extra |
| Contexto | 128 k tokens | 128 k tokens |
| Segurança | Avaliado no Preparedness Framework | Mesma certificação |
Quando usar o o3
- Automação crítica. Precisa de diagnósticos de código sem supervisão? Vá de o3. Ele entrega lógica mais sólida em pipelines complexos.
- Análises pesadas. Relatórios científicos ou cálculos extensos se beneficiam da profundidade de raciocínio.
- Projetos com baixo volume. Como o custo é alto, compensa em tarefas pontuais de alto valor.
Quando escolher o o4‑mini
- Atendimento em escala. Com tokens a centavos, você põe chatbots 24/7 sem estourar orçamento.
- Marketing em massa. Gere centenas de variações de anúncios em minutos a preço de café.
- Dashboards em tempo real. Latência baixa mantém o fluxo de dados sempre atualizado.
Regra simples
- Precisa de precisão cirúrgica? Pague pelo o3.
- Quer volume e velocidade? o4‑mini resolve.
Ambos já estão disponíveis no ChatGPT Plus/Pro/Team e nas APIs — escolha, teste e mede o ROI sem burocracia.

