Topo

Novidade do Google converte descrições de texto em imagens; veja resultados

Foto criada no Imagen, protótipo do Google que cria imagens baseadas em texto. Neste caso, "um cachorro corgi andando de bicicleta na Times Square, usando óculos de sol e chapéu de praia" - Divulgação/Google
Foto criada no Imagen, protótipo do Google que cria imagens baseadas em texto. Neste caso, "um cachorro corgi andando de bicicleta na Times Square, usando óculos de sol e chapéu de praia" Imagem: Divulgação/Google

Ellen Alves

Colaboração para Tilt

24/05/2022 15h41

Imagine abrir uma caixinha do Google, digitar lá uma descrição qualquer ("dois macacos abraçados tomando refrigerante"), e receber como resultado uma ilustração perfeita do que você queria. No futuro, isso pode ser possível.

O Google Research, braço de pesquisa da empresa, apresentou alguns resultados do protótipo Imagen, uma inteligência artificial capaz de transformar texto em imagens.

O sistema pode combinar uma variedade de estilos, desde pinturas a óleo a renderizações CGI e até fotografias. Confira alguns resultados surpreendentes:

Imagen - Divulgação/Google - Divulgação/Google
"Um pássaro azul numa cesta cheia de macaroons nas cores do arco-íris"
Imagem: Divulgação/Google
Imagen - Divulgação/Google - Divulgação/Google
"Um polvo alienígena flutua por um portal lendo um jornal"
Imagem: Divulgação/Google
Imagen - Divulgação/Google - Divulgação/Google
"Uma caneca de morango cheia de gergelim branco, em um mar de chocolate escuro"
Imagem: Divulgação/Google
Imagen - Divulgação/Google - Divulgação/Google
"Uma parede no Palácio Real, com uma pintura do Rei Guaxinim à esquerda e da Rainha Guaxinim à direita"
Imagem: Divulgação/Google

Nova tendência em IA

O Imagen faz parte de uma tendência que vem crescendo no mundo da inteligência artificial. Até o momento, o precursor no campo foi o DALL-E, um programa criado pelo laboratório de pesquisa em inteligência artificial da OpenAI.

Para alguns analistas da área tecnologia, porém, estes primeiros resultados gráficos do Imagen já superam o DALL-E, atualmente em sua segunda versão

O Google afirma montou seu próprio sistema para tentar avaliar sua qualidade: ele ofereceu cerca de 200 descrições em texto iguais para o Imagen e seus concorrentes. Os resultados foram julgados por avaliadores humanos. Entre as métricas avaliadas foram relações espaciais na imagem criada, compreensão de textos longos, de palavras raras e de comandos complexos.

Imagen - Divulgação/Google - Divulgação/Google
"Um pequeno cacto usando chapéu de palha e óculos de sol neon no deserto do Saara"
Imagem: Divulgação/Google
Imagen - Divulgaçao/Google - Divulgaçao/Google
"Um casal de robôs em um jantar chique com a Torre Eiffel no fundo"
Imagem: Divulgaçao/Google
Imagen - Divulgação/Google - Divulgação/Google
"Cachorro olhando curiosamente no espelho e vendo um gato"
Imagem: Divulgação/Google

Limitações e impacto social

Por enquanto, ainda não há planos de oferecer o Imagen ao grande público. A empresa avalia que, embora a ferramenta tenha um potencial criativo, também pode ter aplicações problemáticas.

Muito disso se deve à forma como a inteligência artificial por trás do Imagen é programada e alimentada.

O Google não entra em detalhes sobre o conteúdo gerado pelo Imagen, mas observa que o modelo "codifica vários preconceitos e estereótipos sociais, incluindo um viés geral para gerar imagens de pessoas com tons de pele mais claros e uma tendência para imagens retratando diferentes profissões para se alinhar com os estereótipos de gênero ocidentais".

Coincidência ou não, a empresa evitou imagens humanas nos exemplos apresentados. São sempre animais, objetos ou comidas.

A conclusão do Google é que o Imagen "não é adequado para uso público no momento". A empresa diz que planeja desenvolver uma nova maneira de avaliar o "viés social e cultural em trabalhos futuros" e testar futuras iterações.