Início Tecnologia Agora você pode gerar imagens diretamente a partir de chatgpt e sora,...

Agora você pode gerar imagens diretamente a partir de chatgpt e sora, ele funciona muito melhor e é grátis

9
0

O ChatGPT está recebendo um facelift: Sora chega com imagens mais bonitas e inteligentes.

Desde o seu lançamento, o ChatGPT sempre foi reconhecido para escrever textos ou responder a perguntas. Mas no lado das imagens, ele estava um pouco com Dall-e, seu gerador de imagens que estava fazendo o trabalho, mas sem realmente impressionar. Acabou! O Openai anunciou uma novidade: Sora, uma ferramenta de imagem integrada diretamente ao ChatGPT graças ao GPT-4O, o modelo “Omnimodal“Quem pode fazer tudo. Outra boa notícia: é você? 🙂 O mundo pode aproveitar, mesmo os usuários gratuitos.

Sora: o novo mecanismo visual chatgpt

Antes, para gerar uma imagem, você tinha que passar pelo site de Sora ou ficar satisfeito com Dall-e, que era limitado e às vezes difícil. Agora, tudo é feito na interface ChatGPT e é muito mais fluido. O segredo? GPT-4O, um modelo de IA capaz de fazer malabarismos com texto, imagens, som e até vídeo (mesmo que, no momento, Sora se concentre em imagens fixas).

Um dos grandes progressos é chamado de “vinculativo”No jargão técnico. Basicamente, é a capacidade da IA ​​não misturar os pincéis ao pedir várias coisas em uma imagem. Por exemplo, se você quiser uma estrela azul e um triângulo vermelho, os modelos antigos podem levar uma estrela vermelha e o triangle.

E isso não é tudo: o texto nas imagens finalmente se torna legível. Não há mais letras distorcidas ou palavras incompreensíveis que vimos com Dall-e. Seja para um menu de restaurante, um pôster ou um quadrinho, Sora está fazendo isso de maneira brilhante. As equipes do Openai trabalharam ” meses Para refinar isso, e mesmo que ainda não seja perfeito para personagens muito pequenos, já é um grande salto para a frente.

Com Sora, o ChatGPT não se contenta mais em desenhar desenhos básicos. Você pode pedir coisas mais complexas, como uma experiência científica, uma história em quadrinhos com personagens consistentes ou até um logotipo com um fundo transparente para seus adesivos.

No lado técnico, Sora usa um método “auto -regressivo”. Ao contrário de Dall-E, que gera uma imagem repentinamente com um modelo de difusão (um pouco como se tivéssemos jogado a tinta em uma tela e depois ajustado), Sora “desenha” a imagem passo a passo, da esquerda para a direita e da parte superior à parte inferior. Demora um pouco mais de tempo – mais alguns segundos – mas o resultado é mais preciso, especialmente para o texto e os detalhes. Para o OpenAI, esse pequeno prazo vale o golpe, dada a qualidade obtida.

Exemplo

E há um bônus: você pode fazer upload de suas próprias fotos e pedir chatgpt para modificá -las. Por exemplo, adicione um animal a uma configuração de videogame ou altere a cor de um objeto. Com sua “memória”, o GPT-4O pode manter o fio de suas idéias e transformar suas imagens em alguns cliques.

Obviamente, com uma ferramenta tão poderosa, fazemos perguntas sobre possíveis desvios. O OpenAI afirma ter colocado salvaguardas sólidas: sem dúvidas, sem remoção de marca d’água e filtra contra conteúdo inadequado. As imagens geradas não têm uma marca visível, mas embarcam metadados (C2PA) para provar que eles vêm do OpenAI. Não é perfeito, mas a equipe promete melhorá -lo com o tempo.

No momento, o SORA é gratuito para todos os usuários do ChatGPT, mesmo sem assinatura. Os regulares do Dall-E ainda podem acessá-lo por meio de um modo especial, mas Sora o colocou diretamente no armário. No futuro, o Openai planeja integrar esses avanços à sua API para desenvolvedores, e já estamos falando de um GPT-5 que ainda pode ultrapassar os limites.


Quer ingressar em uma comunidade de entusiastas? Nossa discórdia recebe você, é um lugar de ajuda mútua e paixão em torno da tecnologia.

Fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui