Nesta semana, usuários de redes sociais vêm se divertindo com um emprego específico de inteligência artificial para processamento de imagens: transformar a si mesmo e a amigos em personagens de olhos expressivos, pele de porcelana e grandes sorrisos dignos de um longa do estúdio Pixar, criado por ex-funcionários da Apple e famoso por clássicos da computação gráfica que vão de Toy Story a Frozen.
Como fazer?
Guias online geralmente sugerem usar o Bing, plataforma de buscas da Microsoft. Para tanto, é preciso acessar o link Bing.com/create. O endereço leva ao criador de imagens da companhia, baseado na plataforma DALL.E 3, que gera resultados visuais baseados no que o usuário pede por escrito.
Significa portanto que é preciso ser bem claro e detalhado sobre o que você deseja criar (no caso, sair parecido com um personagem Pixar). O pedido (ou prompt, nos termos techies) precisa incluir uma descrição da pessoa, quantas pessoas estão na imagem e o que elas estão fazendo, sem esquecer de incluir algo como “Imagem Disney Pixar” logo no começo do texto.
O prompt que foi usado para criar a imagem abaixo, por exemplo, é este:
Imagem disney pixar homem negro de cabelo curto andando de bicicleta ao por do sol
Veja o resultado:
A plataforma é gratuita, mas é preciso entrar em uma conta Microsoft e se conformar com um limite de 15 prompts por dia. A criação da imagem também pode demorar alguns minutos.
Vale manter esses limites em mente já que o sistema é imperfeito e pode ser necessário fazer e refazer um mesmo prompt para obter um resultado preciso. Veja esse exemplo, no qual o descritivo “negro” é juntado ao “idoso” do mesmo exemplo acima:
Imagem disney pixar homem idoso negro de cabelo curto andando de bicicleta ao por do sol
O resultado é um tanto discrepante, e os mesmos senhorzinhos de tez clara apareceram em três tentativas seguidas:
O programa, nesse caso, foi entender o intuito do pedido apenas depois de trocada a ordem dos adjetivos, priorizando cor da pele e depois faixa etária do personagem.
No geral, é importante se ater às boas práticas de interagir com IAs generativas como o DALL.E 3 ou o ChatGPT: seja específico, simples e conciso. Quanto mais detalhes escritos sem muito vai e volta, melhor. Entender que não se trata de um diálogo com uma outra pessoa, mas com uma máquina, também pode gerar bons resultados: a ordem de elementos do texto e de frases pode afetar o resultado de uma maneira diferente da conversa com uma pessoa.
É também válido manter expectativas baixas: notou como as mãos dos exemplos acima saem com um dedo a mais ou parecendo luvas? Ou que nem sempre os pés se encaixam nos pedais?