O Gemini 3.5 Pro foi lançado?

Foi anunciado no Google I/O de 19 de maio de 2026, com disponibilidade geral prometida para junho, mas escorregou para julho. Até o fim de junho o modelo seguia numa preview limitada para clientes na Vertex AI, e o Google não confirmou uma data pública exata. Reportagens de fim de junho indicam que o lançamento foi liberado para julho, mas quem depende disso em produção deveria tratar a data como estimativa, não como compromisso.

Por que o atraso importa para quem já usa IA em produção?

Porque expõe um risco de planejamento. Se a sua entrega depende de uma capacidade que só existe no modelo prometido, e o modelo escorrega um mês, dois, você fica refém de um cronograma que não é seu. A saída é desenhar a operação para rodar com os modelos que já estão disponíveis hoje e tratar o próximo salto de fronteira como bônus, não como premissa.

Google adia o Gemini 3.5 Pro e perde gente para os rivais

O Google empurrou o Gemini 3.5 Pro de junho para julho e perdeu pesquisadores para os rivais. A lição de quem opera IA: não faça roadmap no que não enviou.

No palco do Google I/O, em 19 de maio de 2026, Sundar Pichai apresentou o Gemini 3.5 Pro como o modelo mais capaz que a empresa já construiu, com janela de contexto de 2 milhões de tokens e um modo de raciocínio mais cuidadoso. Quando perguntaram sobre a disponibilidade geral, a resposta foi "nos deem até o mês que vem", e a plateia soltou um gemido audível. O mês que vem virou o mês depois: o Gemini 3.5 Pro escorregou de junho para julho. Manchete de produto, à primeira vista. Mas por baixo dela há uma lição de operação que vale mais que o modelo.

O que de fato aconteceu

O Google atribuiu o atraso a refino de qualidade após rodadas de teste com empresas. Segundo as reportagens, três pontos ainda não estavam no padrão de um modelo de topo: eficiência de tokens, desempenho em código e raciocínio em tarefas longas de múltiplos passos, justamente o tipo de trabalho agêntico que um flagship deveria dominar. Até o fim de junho, o modelo seguia numa preview limitada para clientes na Vertex AI. No fim do mês, reportagens indicaram que o lançamento foi finalmente liberado para julho.

O atraso não veio sozinho. Ele coincidiu com uma sequência de saídas de peso. Reportagens dão conta de que o Google perdeu pesquisadores sêniores para os dois maiores rivais, OpenAI e Anthropic, em poucos dias. A leitura do mercado foi rápida e cruel: a ação da Alphabet caiu cerca de 5% em 22 de junho, algo em torno de US$ 225 bilhões de valor de mercado evaporados num dia. Não porque um modelo atrasou um mês, e sim porque atraso mais fuga de cérebros conta uma história sobre execução que investidor não gosta de ouvir.

A leitura crítica: manchete versus operação

É tentador transformar isso num placar de qual laboratório está ganhando. Não é esse o ponto para quem coloca IA em produção. O ponto é o risco de planejamento que essa notícia ilumina.

Todo time que constrói com IA hoje faz, em algum grau, uma aposta no futuro. Você olha o roadmap dos modelos, vê a capacidade prometida para o próximo trimestre e desenha a sua entrega contando com ela. Faz sentido, até o dia em que a capacidade prometida não chega no dia prometido. Aí você descobre que amarrou o seu cronograma ao cronograma de outra empresa, sobre o qual não tem controle nenhum. O Gemini 3.5 Pro escorregando um mês é um lembrete barato de uma verdade cara: fronteira de IA não é infraestrutura confiável, é promessa em movimento.

A régua não é qual modelo será o melhor no trimestre que vem. É o que a sua operação consegue entregar, hoje, com os modelos que já estão no ar.

Isso conversa direto com um padrão que já vimos de outro ângulo. Quando a OpenAI mostrou o GPT-5.6 e trancou o acesso, a lição foi a mesma por outra porta: capacidade anunciada não é capacidade disponível. Um modelo que você não pode chamar em produção, seja porque está trancado, seja porque atrasou, é um slide, não uma ferramenta. E a distância entre o slide e a ferramenta é exatamente onde 95% dos pilotos de IA morrem.

O que fazer na prática

A primeira decisão é separar premissa de bônus. Desenhe a sua operação para rodar bem com os modelos que estão disponíveis agora, os que você pode chamar por API hoje e medir amanhã. Se o próximo salto de fronteira chegar no prazo, ótimo, é ganho. Se atrasar, a sua entrega não trava. Roadmap que depende de um modelo não enviado não é roadmap, é torcida.

A segunda é abstrair o fornecedor. Quem amarra a arquitetura a um único modelo herda o calendário e os tropeços daquele fornecedor. Uma camada fina que permita trocar o modelo por trás sem reescrever o produto transforma o atraso do Gemini, ou o acesso trancado do GPT, ou o próximo modelo aberto que sair da China, de crise em ajuste de configuração. Você deixa de ser refém de um roadmap alheio.

A terceira é medir capacidade no seu problema, não no benchmark do anúncio. Uma janela de 2 milhões de tokens é uma linha impressionante num keynote e pode não mudar nada no seu caso de uso real, ou pode mudar tudo. Só o seu próprio teste, com os seus dados e a sua tarefa, responde isso. Enquanto o modelo não está na sua mão para testar, o número no slide é marketing, e planejar em cima de marketing é como construir rodovia antes de saber por onde o carro vai passar.

O episódio do Gemini vai virar nota de rodapé quando o modelo enfim sair e for, muito provavelmente, excelente. O que não vira nota de rodapé é o hábito. Quem constrói operação de IA madura trata anúncio de fronteira como notícia interessante e não como dependência de cronograma. A régua de quem leva IA a sério nunca foi ter o modelo mais novo, é ter uma operação que entrega valor com o que já está no ar e absorve o que vier depois sem sobressalto.

Se você está montando o roadmap de IA da sua empresa e quer torná-lo à prova de atraso de fornecedor, com uma arquitetura que troca de modelo sem reescrever o produto, fale com a gente no WhatsApp para desenhar isso junto.

Google adia o Gemini 3.5 Pro e perde gente para os rivais

O que de fato aconteceu

A leitura crítica: manchete versus operação

O que fazer na prática

Perguntas frequentes