Aprender um novo idioma é um processo complexo e desafiador, não apenas para humanos, mas também para as máquinas. No mundo da inteligência artificial, uma revolução silenciosa está tomando forma, prometendo tornar os modelos de aprendizado de máquina não apenas mais inteligentes, mas também mais adaptáveis e eficientes.
Uma equipe de cientistas da computação descobriu uma maneira inovadora de aprimorar a capacidade das máquinas de aprender línguas mais rapidamente e com maior eficácia, introduzindo o conceito de “esquecimento seletivo” no treinamento de modelos de aprendizado de máquina.

Ao contrário do que se poderia pensar, esquecer periodicamente informações chave durante o treinamento pode ser exatamente o que os modelos de IA precisam para aprender novas línguas de forma mais rápida e fácil.
Os motores de linguagem de IA de hoje são predominantemente alimentados por redes neurais artificiais compostas por “neurônios”, que nada mais são do que funções matemáticas que processam e transmitem sinais através de múltiplas camadas, aprimorando o fluxo de informações com base nos dados de treinamento.
Esse processo é crucial para o desenvolvimento de modelos bilíngues, por exemplo, onde o modelo é treinado com grandes volumes de texto em duas línguas, ajustando as conexões entre os neurônios para relacionar as palavras em uma língua com suas equivalentes na outra. No entanto, essa metodologia demanda uma quantidade significativa de poder computacional e apresenta dificuldades de adaptação quando surgem novas necessidades ou quando se deseja adicionar um idioma não contemplado inicialmente.
A novidade trazida pela equipe de pesquisa consiste em fazer com que o modelo de machine learning “esqueça” periodicamente o que aprendeu, tornando-o mais ágil e flexível. Este enfoque inovador não visa substituir os grandes modelos que sustentam os principais aplicativos de hoje, mas oferecer insights sobre como esses programas compreendem a linguagem, marcando um “avanço significativo no campo“, conforme destacado por Jea Kwon, engenheiro de IA no Instituto de Ciência Básica na Coreia do Sul.
Esquecimento e aprendizado de idiomas
A chave para essa abordagem é a redefinição periódica da camada de incorporação durante a fase inicial de treinamento. Isso habitua todo o modelo ao processo de redefinição, facilitando a inclusão de novos idiomas posteriormente, uma vez que o modelo já está acostumado a esse processo de “esquecimento e reaprendizagem”.
Essa metodologia foi aplicada a um modelo de linguagem comum chamado Roberta, que, após ser treinado com a técnica de esquecimento periódico, demonstrou ser mais adaptável e eficiente ao aprender novos idiomas, especialmente sob restrições de dados e limites computacionais.
Os testes revelaram que, embora o modelo que utiliza o esquecimento periódico tenha apresentado uma performance levemente inferior na fase inicial de treinamento em comparação com o modelo tradicional, ele superou significativamente o último quando ambos foram re-treinados em outros idiomas com conjuntos de dados menores. Mais notável ainda, foi que o modelo de esquecimento manteve uma precisão superior sob limitações computacionais durante o re-treinamento, sugerindo que essa abordagem melhora a capacidade geral de aprendizado de idiomas do modelo.
Este avanço destaca a importância de adaptar estratégias de aprendizado inspiradas em processos cognitivos humanos, como o esquecimento adaptativo, para que novos modelos de IA, mais diversificados e personalizados, possam ser explorados.
Em vez de depender de poucos modelos grandes, podemos começar a ver um ecossistema de modelos especializados que podem ser rapidamente adaptados para várias línguas e domínios, trazendo os últimos avanços da IA para idiomas com menos materiais de treinamento disponíveis, como o idioma basco, específico do nordeste da Espanha, que tradicionalmente não têm recebido tanta atenção dos grandes modelos de IA desenvolvidos pelas grandes empresas de tecnologia, democratizando o acesso a essa tecnologia.
Essa abordagem de “esquecimento seletivo” reflete como nossos próprios cérebros operam, armazenando mais efetivamente a essência das nossas experiências do que os detalhes exatos.
A flexibilidade, a capacidade de adaptar-se a novos contextos e a habilidade de aprender com eficiência, não apenas acumulando informações, mas também sabendo o que esquecer, são características fundamentais para o avanço do conhecimento. Ao incorporar processos mais humanos, como o esquecimento seletivo, na IA, já podemos identificar mais eficiência em relação a aprendizado de idiomas, e este avanço sugere uma oportunidade de aprimorar, quem sabe, outras funções na máquina… E quem sabe o esquecimento seletivo também nos ajude, de fato, a alcançar um aprendizado mais eficiente, não é mesmo?
Fonte: Quanta Magazine