Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors

A pesquisa científica está comprometida? Estudo alerta para dados falsos gerados por IA em revistas especializadas

A IA tem marcado presença em diversos campos, e a pesquisa científica não fica de fora, onde o potencial e os riscos são igualmente importantes de serem observados atentamente.

Uma pesquisa recente publicada na revista JAMA Ophthalmology trouxe à tona um debate crítico sobre a integridade na pesquisa científica, mostrando como a inteligência artificial, especificamente o modelo por trás do ChatGPT, pode ser usada para criar conjuntos de dados clínicos falsos, mas convincentes.

O pesquisadores utilizaram o GPT-4, a versão mais recente do modelo de linguagem em que o ChatGPT é baseado, em conjunto com uma ferramenta de Análise de Dados Avançada (ADA – do inglês Advanced Data Analysis ) que integra a linguagem de programação Python. Esta combinação foi capaz de gerar um conjunto de dados sobre dois procedimentos cirúrgicos para tratar uma condição ocular chamada ceratocone, que causa afinamento da córnea e pode levar a visão prejudicada. O dado fabricado indicava falsamente que um tratamento era superior ao outro, contradizendo evidências clínicas reais.

Essa capacidade da inteligência artificial de fabricar dados realistas adiciona uma camada de preocupação entre pesquisadores e editores de revistas científicas. Afinal, a criação de dados falsos para suportar hipóteses não verificadas pode comprometer seriamente a confiabilidade da pesquisa científica. 

Elisabeth Bik, microbiologista, pesquisadora independente e consultora de integridade em São Francisco, Califórnia, aponta como isso torna extremamente fácil para pesquisadores gerarem medidas fictícias, respostas de questionários ou conjuntos de dados grandes sobre experimentos que nunca ocorreram na pesquisa científica.

O conjunto de dados gerado pela inteligência artificial incluía 300 participantes, indicando que aqueles submetidos ao tratamento DALK (ceratoplastia lamelar anterior profunda – do inglês deep anterior lamellar keratoplasty) obtiveram melhores resultados em testes de visão e exames de imagem da córnea do que aqueles que receberam o tratamento PK (ceratoplastia penetrante – do inglês penetrating keratoplasty), o que é contrário aos de ensaios clínicos verdadeiros, como um relatório de 2010 com 77 participantes mostrou, apontando resultados semelhantes para ambos os tratamentos até dois anos após a cirurgia.

Embora à primeira vista os dados pareçam plausíveis, uma análise mais aprofundada revelou várias inconsistências. Por exemplo, houve desencontro entre o sexo designado dos “participantes” do falso experimento e o sexo que normalmente seria esperado a partir de seus nomes. Além disso, não foi encontrada correlação entre as medidas pré e pós-operatórias da capacidade visual e os testes de imagem do olho. Outra peculiaridade estava na distribuição das idades dos participantes, com uma quantidade desproporcional de idades terminando em 7 ou 8 – um padrão extremamente incomum em um conjunto de dados autêntico.

A pesquisa científica está comprometida?

O propósito do estudo não era enganar, mas sim ilustrar como pode ser fácil para alguém criar conjuntos de dados aparentemente autênticos que podem suportar a pesquisa científica, quando na verdade são completamente fictícios.

Giuseppe Giannaccare, cirurgião ocular coautor do estudo, destaca que o objetivo era mostrar que em poucos minutos é possível criar um conjunto de dados não suportado por dados originais reais e que vai na direção oposta às evidências disponíveis que são demandadas na pesquisa científica.

Essa facilidade em criar dados falsos acende um sinal vermelho para o processo de revisão por pares em publicações científicas. A realidade é que a revisão por pares muitas vezes não inclui uma reanálise completa dos dados e é improvável que violações de integridade bem elaboradas sejam detectadas, e como Bernd Pulverer, editor-chefe da EMBO Reports enfatiza, as revistas precisarão atualizar seus controles de qualidade para identificar dados sintéticos gerados por inteligência artificial.

Diante desse cenário, a comunidade científica está em busca de soluções. Jack Wilkinson, um bioestatístico da Universidade de Manchester, está liderando um projeto colaborativo para desenvolver ferramentas estatísticas e não estatísticas para avaliar estudos potencialmente problemáticos, assumindo que, assim como a inteligência artificial pode ser parte do problema, ela também pode ser parte da solução. Entretanto, há o receio de que avanços dessa tecnologia possam oferecer meios para contornar esses protocolos na pesquisa científica.

O alerta é claro: à medida que a IA avança, seu potencial para ser “armada” contra os próprios sistemas de verificação também aumenta, o que ressalta a necessidade de vigilância constante e de avanços contínuos nas ferramentas de detecção e prevenção de fraudes em pesquisa científica para acompanhar simultaneamente os avanços desses sistemas inteligentes

O estudo serve como um lembrete crucial de que, embora a IA possa ser uma ferramenta poderosa para aprimoramento do conhecimento, seu uso requer responsabilidade, ética e uma compreensão profunda de suas limitações e potenciais riscos

Ao que parece, a potencial dissonância do avanço de sistemas inteligentes para a produção de dados e os mecanismos que assegurem a veracidade dos dados é um ponto muito preocupante para a credibilidade da pesquisa científica. A despeito das inovações tecnológicas, é essencial contar com olhar crítico e questionador do ser humano, não apenas aceitando dados e conclusões como verdadeiros, mas buscando sempre validá-los e entendê-los em profundidade. A integridade da pesquisa científica não depende só dos avanços tecnológicos, mas do repertório, experiência e conhecimento humanos.

Fonte: Nature

Futuro Relativo

Futuro Relativo

Um espaço de divulgação, de diálogo, de pensar e porque não dizer, de construir o futuro 🪐
Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors

Categorias