Início Tecnologia Um código aberto, poderoso, que funciona no smartphone e conheceu Deepseek no...

Um código aberto, poderoso, que funciona no smartphone e conheceu Deepseek no desafio

10
0

Não é Gêmeos que vamos falar sobre esse tempo … com a Gemma 3, o Google se baseia em modelos de IA acessíveis e poderosos para competir com a Deepseek.

Antes de falar sobre a Gemma 3 … vamos voltar um pouco: um ano atrás, o Google lançou os primeiros modelos Gemma, versões de código aberto (portanto, acessíveis a todos) baseadas em Gemini, sua IA da casa. O objetivo de Gemma? Dê uma visão geral dos talentos de Gêmeos sem revelar seus segredos bem -chave.

Com 2 e 7 bilhões de parâmetros – unidades de cálculo que determinam a “potência” de um modelo – elas já eram fortes, mas exigiam computadores musculares ou a nuvem do Google para girar corretamente. Não é muito prático para pessoas comuns.

Então, o Google apresentou Gemma 2 em agosto de 2024, um modelo de idioma que compreende 2 bilhões de parâmetros.

Com Gemma 3, o Google vai além. Desta vez, existem quatro modelos, variando de 1 a 27 bilhões de parâmetros. Os maiores (4, 12 e 27 bilhões) são cortados para tarefas complexas: eles podem “ler” até 128.000 tokens. Eles também sabem como analisar imagens ou pequenos vídeos graças a um codificador visual, uma ferramenta com 417 milhões de parâmetros que lhes dá olhos digitais.

https://www.youtube.com/watch?v=uu13fn2xpyw

Link do YouTube assine o Frandroid

Mas o mais interessante é o modelo pequeno em 1 bilhão de parâmetros, Gemma3-1B. Menos ganancioso, ele se vira diretamente no seu smartphone, com um limite de 32.000 tokens e sem visão. Perfeito para usos simples e móveis.

Um artigo do Google Blog detalha essas abordagens e outro artigo descreve as técnicas usadas para otimizar a menor versão, o modelo de 1 bilhão, para dispositivos móveis. Isso inclui quatro técnicas atuais de engenharia de IA: quantificação, atualização das disposições de cache de “valor-chave”, melhorando o tempo de carregamento de certas variáveis ​​e o “compartilhamento de peso da GPU”.

E no lado da performance?

No lado do poder, Gemma 3 é capaz de tudo. Os 4 bilhões de parâmetros modelo rivais com o antigo Gemma2-27b, enquanto o Big Brother, Gemma3-27b, é medido em Gemini-1.5, um peso pesado da IA.

O que é legal é a versatilidade deles: podemos transformá -los em ” agentes ” – tipos de pequenos assistentes virtuais que agem por você – ou personalizam -os para idiomas ou necessidades específicas. O Google até criou o ” Gemveverse“, Uma plataforma com exemplos para inspirar desenvolvedores.

E enfrentando Deepseek, um concorrente sério no mundo da IA? O Google retira a artilharia: Gemma3-27B, por exemplo, requer uma única placa NVIDIA H1000 para operar, enquanto o Deepseek R1 ou V3 exige 32 para resultados semelhantes. Você entenderá, o Google oferece uma IA tão poderosa, mas muito menos gananciosa em recursos.

Gemma 3 é geralmente menos preciso que Gemini 1.5 e Gemini 2.0, mas apesar de tudo, Gemma 3 “ Exibe o desempenho competitivo em comparação com os modelos fechados de Gemini ».

Por que isso conta para você?

Você pode se perguntar: ” OK, mas o que eu ganho?“. Por enquanto, nada. Mas esses modelos estão abertos, isso significa que qualquer desenvolvedor pode levá -los, hackear e criar funções úteis: um aplicativo que se traduz em tempo real, um assistente que grava seus e -mails ou mesmo uma ferramenta que verifica as imagens para respeitar regras precisas graças ao Shieldgemma 2, integradas em grandes modelos.

O Google também pressiona a adoção, oferecendo créditos em sua plataforma de cálculo. Seja você um técnico ou apenas curioso, o Gemma 3 pode muito bem tornar a IA mais acessível, mesmo no seu smartphone antigo.


Fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui