Traduzido por Julio Batista
Original de Brendan Paul Murphy para The Conversation
Ele faz isso por apenas uma pequena taxa e pelo esforço de carregar de 10 a 20 fotos diferentes de você mesmo. 2022 foi o ano em que a tecnologia de texto para mídia da Inteligência Artificial deixou os laboratórios e começou a colonizar nossa cultura visual, e o Lensa pode ser a aplicação comercial mais inteligente dessa tecnologia até hoje.
Isso viralizou entre os influenciadores de mídia social que procuram se destacar – mas gerou um debate quente na comunidade artística. O artista australiano Kim Leutwyler disse ao The Guardian que reconheceu os estilos de artistas específicos – incluindo seu próprio estilo – nos retratos de Lensa.
Desde que o Midjourney, o Dall-E da OpenAI e a Stable Diffusion do grupo CompVis entraram em cena no início deste ano, a facilidade com que os estilos de artistas individuais podem ser emulados soou um sinal de alerta.
Os artistas sentem que sua propriedade intelectual – e talvez um pouco de sua alma – foi comprometida. Mas isso é mesmo o caso?
Bem, não tanto segundo a lei de direitos autorais existente.
A IA de texto para mídia é inerentemente muito complexa, mas é possível para nós, os que não são cientistas da computação, entender conceitualmente.
Para realmente entender os pontos positivos e negativos do Lensa, vale a pena ir passo a passo para entender como os estilos individuais dos artistas podem entrar e sair das caixas pretas que alimentam sistemas como o Lensa. O Lensa é essencialmente um front-end simplificado e personalizado para o modelo de aprendizado profundo Stable Diffusion disponível gratuitamente. É assim chamado porque usa um sistema chamado difusão latente para alimentar sua produção criativa.
A palavra “latente” é a chave aqui. Na ciência de dados, uma variável latente é uma qualidade que não pode ser medida diretamente, mas pode ser inferida a partir de coisas que podem ser medidas.
Quando a Stable Diffusion estava sendo construída, os algoritmos de aprendizado de máquina foram alimentados com um grande número de imagens associadas a texto e aprenderam bilhões de maneiras diferentes pelas quais essas imagens e legendas poderiam ser conectadas.
Isso formou uma base de conhecimento complexa, nenhuma das quais é diretamente inteligível para os humanos. Podemos ver “modernismo” ou “tinta espessa” em suas saídas, mas a Stable Diffusion vê um universo de números e conexões.
E tudo isso decorre de uma matemática complexa que envolve os números gerados a partir das imagens associadas a textos originais.
Como o sistema ingeriu descrições e dados de imagem, ele nos permite traçar um caminho através do enorme mar de saídas possíveis, digitando prompts significativos.
Tome a imagem abaixo como exemplo. O prompt de texto incluía os termos “arte digital” e “artstation” – um site que abriga muitos artistas digitais contemporâneos.
Durante seu treinamento, Stable Diffusion aprendeu a associar essas palavras com certas qualidades que identificou nas várias obras de arte em que foi treinado. O resultado é uma imagem que caberia bem no ArtStation.
Portanto, se a Stable Diffusion é um sistema de texto para imagem em que navegamos por diferentes possibilidades, o Lensa parece bem diferente, pois aceita imagens, não palavras. Isso porque uma das maiores inovações do Lensa é agilizar o processo de inversão textual.
O Lensa obtêm fotos fornecidas pelo usuário e as insere na base de conhecimento existente da Stable Diffusion, ensinando o sistema a “capturar” os recursos do usuário para que possa estilizá-los. Embora isso possa ser feito com a Stable Diffusion regular, está longe de ser um processo simplificado.
Embora você não possa enviar as imagens no Lensa em nenhuma direção específica desejada, a compensação é uma ampla variedade de opções que quase sempre são impressionantes. Essas imagens emprestam ideias do trabalho de outros artistas, mas não contêm nenhum elemento real de seu trabalho.
O Australian Arts Law Center deixa claro que, embora as obras de arte individuais estejam sujeitas a direitos autorais, os elementos estilísticos e as ideias por trás delas não estão. Da mesma forma, o caso Dave Grossman Designs Inc. v Bortin nos EUA estabeleceu que a lei de direitos autorais não se aplica a um estilo de arte.
No entanto, o fato de que os estilos e técnicas de arte são agora transferíveis dessa maneira é imensamente perturbador para os artistas. À medida que tecnologias como o Lensa se tornam mais populares e os artistas se sentem cada vez mais roubados de sua propriedade intelectual, pode haver pressão para que a legislação se adapte a ela.
Para artistas que trabalham em obras de pequena escala, como criar ilustrações digitais para influenciadores ou outras empresas da web, o futuro parece desafiador.
No entanto, embora seja fácil fazer uma obra de arte com boa aparência usando IA, ainda é difícil criar um trabalho muito específico, com um tema e contexto específicos. Portanto, independentemente de como aplicativos como o Lensa abalam a maneira como a arte é feita, a personalidade do artista continua sendo um contexto importante para seu trabalho.
Pode ser que os próprios artistas precisem se tornar cada vez mais influenciadores e investir mais esforço em se divulgar.
Ainda é cedo e será uma década tumultuada para produtores e consumidores de arte. Mas uma coisa é certa: o gênio saiu da garrafa.