
Antes de falar sobre a Gemma 3 … vamos voltar um pouco: um ano atrás, o Google lançou os primeiros modelos Gemma, versões de código aberto (portanto, acessíveis a todos) baseadas em Gemini, sua IA da casa. O objetivo de Gemma? Dê uma visão geral dos talentos de Gêmeos sem revelar seus segredos bem -chave.
Com 2 e 7 bilhões de parâmetros – unidades de cálculo que determinam a “potência” de um modelo – elas já eram fortes, mas exigiam computadores musculares ou a nuvem do Google para girar corretamente. Não é muito prático para pessoas comuns.
Então, o Google apresentou Gemma 2 em agosto de 2024, um modelo de idioma que compreende 2 bilhões de parâmetros.
Com Gemma 3, o Google vai além. Desta vez, existem quatro modelos, variando de 1 a 27 bilhões de parâmetros. Os maiores (4, 12 e 27 bilhões) são cortados para tarefas complexas: eles podem “ler” até 128.000 tokens. Eles também sabem como analisar imagens ou pequenos vídeos graças a um codificador visual, uma ferramenta com 417 milhões de parâmetros que lhes dá olhos digitais.
Mas o mais interessante é o modelo pequeno em 1 bilhão de parâmetros, Gemma3-1B. Menos ganancioso, ele se vira diretamente no seu smartphone, com um limite de 32.000 tokens e sem visão. Perfeito para usos simples e móveis.

Um artigo do Google Blog detalha essas abordagens e outro artigo descreve as técnicas usadas para otimizar a menor versão, o modelo de 1 bilhão, para dispositivos móveis. Isso inclui quatro técnicas atuais de engenharia de IA: quantificação, atualização das disposições de cache de “valor-chave”, melhorando o tempo de carregamento de certas variáveis e o “compartilhamento de peso da GPU”.
E no lado da performance?
No lado do poder, Gemma 3 é capaz de tudo. Os 4 bilhões de parâmetros modelo rivais com o antigo Gemma2-27b, enquanto o Big Brother, Gemma3-27b, é medido em Gemini-1.5, um peso pesado da IA.

O que é legal é a versatilidade deles: podemos transformá -los em ” agentes ” – tipos de pequenos assistentes virtuais que agem por você – ou personalizam -os para idiomas ou necessidades específicas. O Google até criou o ” Gemveverse“, Uma plataforma com exemplos para inspirar desenvolvedores.
E enfrentando Deepseek, um concorrente sério no mundo da IA? O Google retira a artilharia: Gemma3-27B, por exemplo, requer uma única placa NVIDIA H1000 para operar, enquanto o Deepseek R1 ou V3 exige 32 para resultados semelhantes. Você entenderá, o Google oferece uma IA tão poderosa, mas muito menos gananciosa em recursos.
Gemma 3 é geralmente menos preciso que Gemini 1.5 e Gemini 2.0, mas apesar de tudo, Gemma 3 “ Exibe o desempenho competitivo em comparação com os modelos fechados de Gemini ».
Por que isso conta para você?
Você pode se perguntar: ” OK, mas o que eu ganho?“. Por enquanto, nada. Mas esses modelos estão abertos, isso significa que qualquer desenvolvedor pode levá -los, hackear e criar funções úteis: um aplicativo que se traduz em tempo real, um assistente que grava seus e -mails ou mesmo uma ferramenta que verifica as imagens para respeitar regras precisas graças ao Shieldgemma 2, integradas em grandes modelos.
O Google também pressiona a adoção, oferecendo créditos em sua plataforma de cálculo. Seja você um técnico ou apenas curioso, o Gemma 3 pode muito bem tornar a IA mais acessível, mesmo no seu smartphone antigo.