Os efeitos da inteligência artificial na ciência vão desde artigos científicos até aplicações práticas.
E depois de um vacilo de alguns pesquisadores no uso indevido da inteligência artificial (clica aqui, você tem que ver isso!), uma nova aplicação dessa tecnologia mostrou uma eficácia surpreendente, no que tange à integridade do conteúdo acadêmico publicado.
Sholto David, um biólogo independente do Reino Unido, é um detetive de imagens em pesquisas científicas. Imagine vasculhar centenas de artigos de revistas científicas, buscando imagens duplicadas. Um trabalho digno de muita paciência, né?
David fez exatamente isso por meses, até que decidiu comparar seus resultados com os de um software de inteligência artificial com a mesma missão, e a máquina trabalhou a uma velocidade 2-3 vezes maior que a dele! O software não só detectou quase todas as 63 imagens problemáticas que David encontrou, mas também descobriu mais 41 que ele havia deixado passar despercebidas.
Esse tipo de controle é crucial. Em 2016, a renomada especialista em análise forense de imagens Elisabeth Bik , baseada em São Francisco, Califórnia, e seus colegas identificaram que quase 4% dos artigos em 40 revistas de biomedicina tinham imagens duplicadas de forma inadequada.
Vale ressaltar que nem sempre as alterações em imagens são feitas com más intenções. Às vezes, os autores ajustam as imagens acidentalmente, ou tentam deixar uma figura mais atraente ou clara, mas o fato é que, seja qual for a motivação, é essencial detectar e corrigir essas inconsistências.
Com a eficiência comprovada da IA em identificar imagens problemáticas, fica claro que as revistas e instituições acadêmicas estão olhando com mais atenção para essa tecnologia.
A IA já está sendo usada para ajudar nas pesquisas para produção de artigos cinetíficos. Tem até “ChatGPT acadêmico” e mais algumas ferramentas que já facilitam as rotinas dos pesquisadores. E incluir esses softwares inteligentes como critério de validação do conteúdo, parece ser uma boa ideia, afinal.
Inteligência Artificial a favor da ciência: Imagetwin e integridade de artigos acadêmicos
Imagetwin é uma ferramenta que já tem a adesão em cerca de 200 instituições, entre universidades, editoras e sociedades científicas. O software tem um banco de dados colossal com mais de 25 milhões de imagens de outras publicações, o que, segundo seus criadores, é o maior do gênero. É praticamente a enciclopédia de imagens do mundo acadêmico!
Bik, que mencionamos anteriormente, é fã do Imagetwin, usando-o frequentemente como um complemento à sua própria perícia. Mas como toda super ferramenta, o Imagetwin tem seus probleminhas. Por exemplo, pode falhar ao detectar duplicatas em imagens de baixo contraste.
Apesar de seus pontos fracos, o software é tão valioso que tanto Bik quanto David têm acesso gratuito a ele e ainda ajudam os desenvolvedores com feedbacks. É uma espécie de relação simbiótica no mundo da ciência.
Há outros players no jogo da investigação de artigos cinetíficos. Por exemplo, as revistas da American Association for Cancer Research na Philadelphia, Pennsylvania (Associação Americana de Pesquisa em Câncer, em tradução livre) usam uma ferramenta chamada Proofig. E a Frontiers, em Lausanne, na Suíça, decidiu ser autossuficiente e criou seu próprio software. Até mesmo a Springer Nature, a gigante por trás da revista Nature, está com as antenas ligadas, explorando novas ferramentas para verificar imagens.
Mas o que realmente faz o Imagetwin tão bom é sua abordagem de dupla checagem. Ele cria uma espécie de “impressão digital” para cada imagem, depois, como um detetive obstinado, vasculha todo o artigo em busca de repetições dessa mesma impressão. E, como se isso não fosse o suficiente, ele também verifica sua gigantesca base de dados para ver se essa “impressão digital” apareceu em outros trabalhos científicos já publicados. E todo esse processo leva apenas de 5 a 10 segundos!
A eficiência do software inteligente Imagetwin
Sholto David realizou um estudo usando essa ferramenta, analisando mais de 700 artigos da revista Toxicology Reports publicados entre 2014 e 2023. A escolha dessa revista não foi por acaso: em 2021, sua editora, a Elsevier, demonstrou preocupação sobre uma edição especial da revista. E David, como um bom detetive, decidiu investigar.
Após sua análise manual, ele decidiu usar inteligência artificial, e o software, embora tenha deixado passar quatro artigos que ele tinha marcado, segundo o próprio David, foi muito mais rápido do que ele, que ficou olhando as imagens com muito cuidado por um longo tempo. No total, cerca de 16% dos artigos analisados apresentavam imagens duplicadas.
E isso nos leva a uma comparação com Bik, que, mencionamos aqui, encontrou uma taxa de duplicação de 4%. No entanto, ela acha que os números de David fazem sentido. Segundo ela, as revistas individuais tiveram duplicações entre 0,3% e 12% dos seus artigos, e revistas de maior impacto com tendência a a ter menos duplicações.
Jana Christopher, analista de integridade de imagens da FEBS Press em Heidelberg, Alemanha, que tem acesso gratuito ao Imagetwin e o utiliza juntamente com outros softwares, acredita que é completamente possível uma revista apresentar uma taxa de duplicação de 16%. No seu trabalho, ela chega a marcar um terço dos artigos para investigações adicionais.
Vale mencionar um ponto importante: o estudo do David ainda não passou por revisão de pares, ele disponibilizou sua pesquisa na plataforma bioRxiv, e a Elsevier prontamente anunciou que está conduzindo uma investigação interna. E, embora o editor-chefe da Toxicology Reports não tenha dado muitos detalhes, está claro que o assunto é sério.
Voltando ao Imagetwin: Bik elogia especialmente sua habilidade em lidar com figuras complexas, aquelas que levariam mais de meia hora para serem avaliadas manualmente. E Jana Christopher vê o software como um “segundo par de olhos”. No entanto, ela reforça algo que já havíamos mencionado anteriormente em relação às falhas do Imagetwin, destacando que ela encontrou problemas que o software simplesmente não detectou.
O futuro do conteúdo científico
O Imagetwin e outros softwares de IA estão se tornando uma parte integrante do processo de revisão de artigos, e como o mundo da ciência está sempre evoluindo, é importante ver como a tecnologia pode estar moldando esse progresso.
Christopher, acredita que o objetivo final é integrar ferramentas de IA no processo de revisão de artigos, semelhante à forma como os editores já usam softwares para detectar plágio no texto, mas sempre com a atenção de que a inteligência artificial sozinha não dá conta do recado, embora possa ajudar muito com os alertas. Segundo ela, “Você tem que usar sua própria experiência e questionar essas coisas. Nenhuma das sinalizações que você recebe [da Imagetwin] é definitiva: ‘Isso é fraude!’“. Portanto, fica claro que a expertise humana para interpretar, avaliar e agir com base nesses alertas é fundamental e, como sempre, a IA entra no papel de mais uma ferramenta que pode, sim, ser muito útil, mas não substitui o ser humano.
As universidades estão de olho no potencial da inteligência artificial para revisão de artigos científicos. Segundo Patrick Starke, um dos desenvolvedores do Imagetwin, muitas instituições acadêmicas estão usando o software para revisar os artigos seus professores e pesquisadores estão enviando para seus periódicos, embora ele não tenha dado detalhes sobre quem são essas universidades, mas vale a atenção porque a ferramenta está ganhando espaço.
Christopher, espera que a expansão das ferramentas de IA possa democratizar o processo de revisão para as revistas. E ela defende que devemos parar de ver essas ferramentas como um luxo, e perceber que adicionam um valor à revista, como mais uma ferramenta para ajudar a garantir a integridade e a qualidade dos trabalhos acadêmicos.
Em um ambiente tão rigoroso quanto o acadêmico, seria imprudente confiar integralmente nas respostas da inteligência artificial, mas se isso pode ajudar a ciência a evoluir mais rápido, unir essas ferramentas à experiência humana pode garantir uma otimização das rotinas de revisão, tanto do ponto de vista qualitativo quanto quantitativo.
Fonte: Nature