O Google está testando sua nova ferramenta, o SynthID utilizando a técnica de marca d’água para marcas imagens geradas por inteligência artificial.
Antes de entrarmos nos detalhes, vamos entender o básico: SynthID é o mais recente projeto do Google, inicialmente disponível para os usuários do seu gerador de imagens de inteligência artificial, o Imagen. Os mais familiarizados sabem que o Imagen opera na plataforma Vertex do Google Cloud.
A grande novidade está na decisão dos usuários de usar ou não a marca d’água na imagem gerada pelo Imagen, com o objetivo de facilitar a identificação de conteúdos produzidos por IA, para que fique claro se são produzidos por esses sistemas inteligentes e servindo também para a proteção de direitos autorais.
No último ano, vimos um aumento expressivo dos “gêmeos malignos” da inteligência artificial: deepfakes, pornografia criada por essa tecnologia e algumas sérias violações de direitos autorais. Por isso surge a marca d’água, sinalizando se uma imagem foi criada por bots ou por humanos legítimos.
Julho foi um mês movimentado em relação a essas questões de segurança, chegando a agitar até a Casa Branca, que conseguiu compromissos voluntários de gigantes da tecnologia, incluindo OpenAI, Google e a sempre inovadora Meta, para desenvolverem ferramentas de marcação d’água. Tudo em nome do combate ao uso indevido de conteúdo gerado por inteligência artificial.
A parceria dessas gigantes resultou no Frontier Model Forum, um compromisso firmado em busca de mais segurança no uso da inteligência artificial. Clica aqui para conferir mais detalhes!
No evento anual I/O do Google, Sundar Pichai, o CEO da gigante da tecnologia disse que a empresa está em missão para integrar a marca d’água desde o início em seus modelos de IA. E agora o Google DeepMind se coloca como o primeiro a se apresentar com uma ferramenta pública.
Tradicionalmente, a marca d’água é como colocar um adesivo visível ou inserir algumas informações inseridas nos metadados. Metadados fornecem informações sobre a natureza, qualidade, origem, localização, entre outros aspectos de determinados dados. Mas, segundo insights de Pushmeet Kohli, o VP de pesquisa do Google DeepMind, esses métodos antigos podem ser facilmente enganados. Modificar, alterar ou redimensionar uma imagem pode fazer com que a marca d’água desapareça.
SynthID, por outro lado, opera de forma bem mais sofisticada com a ajuda de duas redes neurais. A primeira trabalha sobre a imagem original, gerando uma versão quase idêntica, mas com ligeiras alterações em alguns pixels. Este processo resulta em um padrão embutido que, para nossos olhos, é invisível.
Já a segunda rede tem a tarefa de identificar esse padrão, permitindo que os usuários saibam se uma marca d’água está presente, se há apenas uma suspeita de sua presença ou se definitivamente ela não está lá.
A criptografia é uma alternativa proposta para codificar informações sobre a origem do conteúdo. Saiba mais sobre o C2PA.
O ponto alto é que o SynthID é inteligente, e foi desenvolvido para identificar a marca d’água mesmo se a imagem criada por IA passar por uma reformulação digital como acontece em capturas de tela, redimensionamentos ou rotações, esta ferramenta ainda pode identificar sua marca d’água.
O DeepMind não está sozinha nessa área, o campo da marca d’água está cheio de inovação. Pessoas como Ben Zhao, professor na Universidade de Chicago, têm trabalhado em sistemas para proteger as criações dos artistas das garras da IA.
Os entusiastas do código aberto podem reconhecer o Stable Diffusion, um gerador de imagens de IA que tem explorado águas semelhantes. Ah, e a Meta também tem pesquisado, mas ainda não lançou nada publicamente.
O DeepMind afirma que sua marca d’água é bastante resistente a interferências. Mas, como qualquer tecnologia, não é invencível. Zhao tem suas ressalvas, apontando que a história não tem sido gentil com marcas d’água – elas tendem a ser descobertas e contornadas. Especialmente com atores mal-intencionados tendo todos os motivos para interferir, o desafio é real.
Um passo importante do Google que pode abrir caminhos
O MIT também pensou na manipulação de imagens e lançou uma ferramenta que, embora ainda tenha limitações, mostra um caminho possível para a segurança das nossas fotos! Olha só que legal!
Apesar dos desafios, a entrada do Google DeepMind é promissora e pode ser o início de uma era onde a comunidade tecnológica compartilha abertamente sucessos e insucessos de iniciativas para incrementar a segurança.
Kohli é direto, admitindo que o SynthID ainda está em uma versão experimental, mas que o Google está comprometido em aprender, aprimorar o modelo para validá-lo, entender pontos fortes e fracos antes de lançar de forma mais ampla.
Mas Sasha Luccioni, investigadora de IA da startup Hugging Face, lança uma reflexão: Manter o SynthID como exclusividade do Google pode limitar seu potencial. Afinal, se apenas o Google pode jogar o jogo de incorporar e detectar, estamos realmente democratizando a marca d’água?
A IA está em franca evolução, tal qual as iniciativas para garantir um mais alto nível de segurança no seu uso. Embora a jornada esteja apenas começando, ferramentas como o novo SynthID do Google mostram um caminho possível onde o conteúdo gerado por inteligência artificial pode estar em nossa rotina com autenticidade e confiança.
Fonte: MIT Technology Review