As imagens geradas pela inteligência artificial podem ser consideradas falsas? Como podemos pensar esse novo momento de abundância e dita facilidade de criação?
A fotografia digital e a inteligência artificial (IA) trouxeram novos conceitos para a produção de imagens, tirando todo o lastro material de simulacros de objetos físicos, e colocando uma nova perspectiva de entendimento: imagens construídas por algoritmos. Antes de serem interpretadas como aberrações fotográficas ou falsidades ideológicas, elas são também meios de expressão e significação, e nos cabe encontrar seu lugar na produção da imagem contemporânea. Esse é o objetivo deste artigo.
A historiografia dos suportes de informação, notadamente naquilo que convencionou chamar de mídia, permite determinadas abordagens que contam com
ajustes técnicos para diferenciar sua produção, permitindo uma correta categorização de tecnologias que mudam radicalmente os resultados da informação. Tal condição parece ser bastante característica de alguns suportes que utilizam a informação não apenas como registro, mas também como expressão poética, caso esse em que se encontra o suporte fotográfico.
Em sua cronologia, a fotografia de composição físico-química, a primeira a ser desenvolvida em meados do séc.XIX, teve diferentes usos e atributos, mas todos igualmente caracterizados pelo fator de fotossensibilidade do suporte, que permitia o registro da luz sob certas condições, quer como originais obtidos na câmara escura, quer como cópias ou a partir de técnicas adjacentes (rayografia ou fotograma, cianotipia, goma bicromatada, etc.).
O advento de uma nova técnica fotográfica a partir de um processamento eletrônico, na qual o suporte físico-químico foi substituído pelo impulso elétrico (e sua consequente necessidade de armazenamento como informação binária, a chamada fotografia digital), em muito pouco alterou os resultados finais dos processos profissionais de registro nas áreas do fotojornalismo, fotografia documental, publicitária e/ou de moda.
Nestas áreas mencionadas, os ganhos com agilidade e economia de tempo no fluxo de trabalho ficaram evidentes, de forma que para tais aplicações, a fotografia migrou do analógico para o digital sem maiores questionamentos. Mas no quesito poético, a fotografia digital se mostrou altamente diferenciada por conta de sua extrema flexibilidade: em função de um suporte imaterial, uma base numérica codificando formas, a manipulação da imagem se tornou um anátema da credibilidade que anteriormente a fotografia gozava.
Em função disso, muitos teóricos se propuseram a rever paradigmas fundamentais que sustentavam a imagem fotográfica em sua essência para identificar novas razões e novos usos. De certa forma, foi um passo importante porém precipitado: a fotografia digital apenas facilita a prática de alteração/manipulação do resultado, este que sempre foi possível e necessário à configuração final de uma imagem de suporte fotográfico, quer seja digital ou físico-químico. A única grande diferença em relação ao suporte químico estava no fluxo de informações otimizado, permitindo alterações profundas na estrutura da imagem em um tempo muito menor (e em consequência, em maior quantidade).
A visualização digital, item igualmente otimizado, permitiu disseminação e compartilhamento exponencialmente maiores que os suportes físicos permitiam. A
essa otimização de processos e fluxos foi considerada por muitos autores como uma nova fotografia ou uma fotografia ‘2.0’. Entretanto, ainda podíamos falar de ‘fotografia’ na mesma razão original que o séc.XIX a conhecia, ou seja, seus princípios ainda eram baseados na captura da luz através de câmera escura, que gerava os originais que podiam, por sua vez, ser manipulados à vontade.
Esses princípios ainda são válidos e ainda estão em uso; muito provavelmente nunca deixarão de existir fisicamente, pois mesmo que a tecnologia avance e se torne cada vez mais simples obter uma imagem de excelência, ainda se faz necessária uma obtenção de formas através de câmeras obscuras que simulam nosso olho, ou eventualmente que até usem o próprio olho como câmera.
Em resumo: ainda precisamos obter imagens a partir da luz ordenada. Mas o que se apresenta atualmente, através da tecnologia de Inteligência Artificial, é a possibilidade de obtenção de imagens que não são oriundas de câmeras escuras, mas sim do imenso depósito de imagens da rede web: combinações a partir de algoritmos instruídos para obedecer a um comando, uma ordem, um prompt.
A partir dessa ordem, uma descrição, ainda que vaga, a IA, através de sua programação ‘monta’ a imagem, pixel a pixel, para que se pareçam com imagens fotográficas. Neste ponto, nos deparamos com o problema de diferenciar o que é de origem ‘fotográfica’ (neste contexto: veio de uma captura de luz ordenada) do que é origem ‘pixelgráfica’ (construída digitalmente a partir de imagens pré-existentes de qualquer natureza). E assim, surge a necessidade de uma terminologia específica que permita tal diferenciação, sem que ela tenha a intenção de ser limitante ou inibidora em termos de criatividade e expressão.
Sugerimos, nesse ponto, o uso da nomenclatura ‘pixelgrafia’ para construir pixelgráficos, no sentido que podem ser simulacros inclusive de imagens fotográficas, mas que não se utilizam da câmara escura para obtenção de seus
originais E assim, surge a necessidade de uma terminologia específica que permita tal diferenciação, sem que ela tenha a intenção de ser limitante ou inibidora em termos de criatividade e expressão.
A necessidade de uma nomenclatura específica para a imagem oriunda da construção através de algoritmos é sem dúvida de ordem morfológica: um eventual observador poderá não perceber diferença entre duas imagens de origens diferentes, no entanto, é importante delimitar o uso de tal imagem, no sentido de que ela é legítima. Se não houver tal uso diferenciado, uma imagem construída por inteligência artificial terá sempre o estigma de uma fotografia falsa.
No entanto, ela não deixa de ser uma imagem, e pode ser utilizada igualmente como tal, inclusive para fins publicitários, estéticos e/ou artísticos. Entretanto, em se tratando de temas na fotografia documental e jornalística, tal imagem teria que ser rejeitada – como fotografia. Mas, uma vez que sabemos ser uma pixelgrafia, torna-se uma licença poética – como a Noite de São Bartolomeu de Goya, ou a Guernica de Picasso, – e tantas outras (são muitas) obras pictóricas inspiradas em fatos históricos. Assim, um tratamento honesto para fins de legitimação de seu uso, seria justamente o de um novo conceito, e uma nova nomenclatura.
A imagem da fotografia e da IA
Mas o problema não é novo, tem sido discutido ao longo de todo o século XX e já envolveu inclusive a própria fotografia em seus primórdios. Bem sabemos das inúmeras posturas críticas em relação à ‘novidade’ da imagem fotográfica (ainda àquele tempo tratada como Daguerreótipos, Calótipos, Ambrótipos ou Heliografias), em que sua posição como imagem de potencial estético foi duramente combatida.
A razão por trás reside em grande parte num problema que remonta a questões psicológicas imemoriais, tais como a concepção artística medieval das chamadas Artes Servis e Artes Liberais, na qual incidia uma classificação pejorativa sobre as Artes manuais que tivessem conotações braçais e servis, o estigma do ‘artesão’ não-intelectual. Essa mesma razão (com as polaridades invertidas) norteou os críticos do séc.XIX tratando a fotografia como uma espécie de imagem automática, capaz de ser registrada sem nenhum conhecimento de desenho, e, portanto, nenhum esforço. Indignas. Baudelaire irá dizer: ‘o refúgio dos pintores fracassados’ (alusão ao próprio Daguerre).
A fotografia então era vista como uma imagem magicamente construída, sem o esforço de conhecimento técnico, na prática imediatamente mais próxima que se conhecia (para efeitos comparativos): a pintura e o desenho. Foi preciso muito tempo para que críticos e teóricos percebessem que se tratava de outro suporte, com outras atribuições e uma estética particular, e que não cabia uma comparação técnica entre os dois meios. Ora, agora é essa mesma fotografia, antes rejeitada, que rejeita, uma imagem igualmente construída ‘sem esforço’ ou sem técnica nenhuma, a partir de uma construção colaborativa entre algoritmo e usuário do programa.
O fato de não haver um fotógrafo diretamente por trás da realização da imagem implica na mesma ideia do séc.XIX de que não há um pintor ou um artista realizando a imagem, é ‘apenas’ alguém apertando um botão. O caso da pixelgrafia reside exatamente no mesmo paradigma. É só alguém apertando um botão, e a imagem ‘sai’ pronta.
Com certeza, essa era uma das mais fortes impressões dos primeiros críticos em relação à fotografia, e é essa também a reação de grande parte das pessoas em relação às construções imagéticas feitas pela IA. Mas, da mesma forma que (hoje reconhecemos) há uma técnica fotográfica, e que o fotógrafo ‘escolhe’ ângulos, enquadramentos, tipos de luz, exposição, texturas, contrastes etc., hoje essa mesma técnica pode ser aplicada através de descrições de modelos em entradas de informação – prompts de comando.
Aplicações de imagens
Mudam as formas, mas ainda temos uma construção de imagens, eventualmente de maneira mais colaborativa (diversos algoritmos diferentes darão resultados diferentes ao mesmo prompt), embora seja possível igualmente fazer modificações radicais em imagens previamente capturadas por técnica fotográfica convencional, o que implicaria, também em processos híbridos – meio fotografia, meio pixelgrafia.
Devemos considerar também que, mesmo que consideremos aspectos de facilidade técnica, o fato é que temos que encarar uma realidade tecnológica patente: dispositivos móveis hoje apresentam imagens fotográficas digitais de qualidade incrivelmente elaborada, justamente por agregarem elementos de IA em sua programação.
O uso de tais ferramentas é disseminado e cada vez mais constante, fazendo com que literalmente qualquer usuário sem conhecimento técnico possa ter como resultante uma imagem de espantoso apuro. Para grande parte do público isso significa um ganho de qualidade oriundo de tecnologias à nossa disposição, facilitando a representação objetiva e direta de modelos de pensamento sem precisar de conhecimentos específicos profundos. Uma espécie de WYSIWYG (What you see is what you get) invertido, em que a viabilidade tecnológica se torna aliado de nossas necessidades visuais mais diversas (e que, propositadamente, não entrarei aqui em nenhum julgamento crítico sobre o valor ou o uso de tais imagens).
E, mais do que qualquer coisa, a questão é que tais imagens também significam. Isso as legitima como imagens, independente de como é chamada.
Alguns exemplos de como essa tecnologia tem sido explorada, ainda de forma muito rudimentar e experimental, como todas as novas tecnologias:
No caso da figura 1, a reportagem informa que a imagem eleita se trata na realidade de uma imagem construída por IA (portanto, de uma pixelgrafia), mas essa diferenciação não estava no regulamento, provavelmente por conta da falta de nomenclatura para diferenciação de tais imagens. A figura 2 também é bastante característica, e nos deixa em dúvida sobre a real natureza da imagem. Ao saber que se trata de uma pixelgrafia, o paradigma clássico barthesiano (1984), o ‘isso foi’, bem como a análise de Sontag (1981) ‘a fotografia fornece provas’ deixa de existir, nos abrindo para uma nova interação e interpretação de tais imagens.
Imagens do tipo da figura 2 tem um enorme potencial estético a ser explorado, e por conta disso podemos dizer que são legítimas, já que expressam e significam, apenas a partir de outros paradigmas de enunciação.
A figura 3 também sintetiza uma tendência específica que tem diversas aplicações, principalmente na área da publicidade e da moda: contratar modelos talvez deixe de ser uma atividade primordial nesse meio, e até mesmo atores e dubladores já estão se organizando em termos de legislação para proteger seus trabalhos.
E mais, num mundo imerso por realidades mediadas pelas telas e interações sociais remotas, uma aplicação já em pleno desenvolvimento é o uso de IA para criar acompanhantes virtuais, em que a figura do empresário de prostituição (o gigolô ou cafetão em linguagem corrente) passa a ser um administrador de sites. Não estamos falando de realidades futuras, e sim de casos presentes em número cada vez maior.
Nota-se que esse comportamento também não é, à luz de uma análise psicológica, totalmente inédito. Pelo contrário, lembramo-nos de animais de estimação virtuais, febre dos Tamagoshis na década de 90, e também da ‘indústria da solidão’ japonesa, em que jovens namoravam e até se casavam com assistentes virtuais holográficas. O jornal Folha de S.Paulo publicou reportagem assinada por Sílvia Corrêa em 28/08/2019 sobre esse tema.
Outro caso interessante é o de uma câmera, chamada de Paragraphica, que não fotografa com lentes, mas com construções de locais a partir de IA, conforme reportagem capturada na figura 4 abaixo.
A imagem além da fotografia
Teóricos da imagem proeminentes no final do séc.XX, como Vilém Flusser ou Roland Barthes, talvez tivessem síncopes com essas novidades, mas o fato é que elas existem e estão sendo disseminadas num ritmo vertiginoso. Já pertencem ao nosso cotidiano, mas ainda não estão devidamente estabelecidas, principalmente enquanto conceituação acadêmica e histórica.
E, assim como o cinema precisou encontrar sua linguagem além do teatro, e a fotografia além da pintura, a pixelgrafia com certeza também encontrará seu espaço, no devido tempo necessário para a assimilação completa de que uma imagem pode não ser criada a partir de modelos e objetos materiais.