Qual é a melhor forma de treinamento de máquina? No universo da inteligência artificial existem muitas iniciativas para que o aprendizado de máquina se torne cada vez mais eficiente. Recentemente, pesquisadores da Penn State desenvolveram uma abordagem inovadora que se inspira em como os bebês aprendem para treinar sistemas de IA de forma mais eficiente.
Essa nova metodologia de treinamento de máquina, que incorpora dados espaciais, resultou em uma melhoria significativa no reconhecimento de objetos, alcançando um aumento de desempenho de até 14,99%.
A técnica baseada no desenvolvimento infantil pode revolucionar a forma como treinamos IA, apresentando grandes potenciais de aplicações em ambientes extremos e até na exploração espacial.
Nos primeiros dois anos de vida, as crianças experimentam um conjunto relativamente limitado de objetos e rostos, mas de diversas perspectivas e sob diferentes condições de iluminação. Esse período é crucial para o desenvolvimento visual e cognitivo, onde a percepção espacial desempenha um papel fundamental. Inspirados por essa observação da psicologia do desenvolvimento, os pesquisadores da Penn State decidiram replicar esse processo de aprendizado no treinamento de sistemas de IA.
No começo deste ano, o treinamento de máquina inspirado em bebês também ajudou a inteligência artificial a aprender a nossa linguagem! Clica aqui para ver.
Metodologia e implementação do treinamento de máquina inspirado em bebês
A abordagem tradicional de treinamento de IA utiliza grandes conjuntos de fotografias aleatórias da internet. Em contraste, a nova estratégia desenvolvida pela equipe da Penn State é informada pela psicologia do desenvolvimento e utiliza informações sobre a posição espacial para treinamento de máquina mais eficiente dos sistemas visuais de IA.
Os pesquisadores desenvolveram um novo algoritmo de aprendizado contrastivo, um tipo de método de aprendizado auto-supervisionado. Nesse método, o sistema de IA aprende a detectar padrões visuais para identificar quando duas imagens são derivações da mesma imagem base, resultando em um par positivo. No entanto, algoritmos contrastivos tradicionais muitas vezes tratam imagens do mesmo objeto, tiradas de diferentes perspectivas, como entidades separadas em vez de pares positivos.
Ao considerar dados ambientais, incluindo localização, o novo algoritmo permite que o sistema de IA supere esses desafios e detecte pares positivos independentemente de mudanças na posição da câmera, rotação, ângulo de iluminação, condição e distância focal. Essa consideração espacial é crucial para melhorar o reconhecimento de objetos em diversos cenários.
Para testar esse novo treinamento de máquina, os pesquisadores configuraram ambientes virtuais na plataforma ThreeDWorld, um ambiente de simulação física 3D de alta fidelidade e interatividade. Esse ambiente permitiu que manipulassem e medissem a localização das câmeras de visualização como se uma criança estivesse caminhando por uma casa. Foram criados três ambientes de simulação: House14K, House100K e Apartment14K, com “14K” e “100K” referindo-se ao número aproximado de imagens amostrais tiradas em cada ambiente.
Os pesquisadores então executaram modelos de aprendizado contrastivo base e modelos com o novo algoritmo através das simulações três vezes para verificar a eficácia na classificação de imagens. Os resultados foram impressionantes: os modelos treinados com o novo algoritmo superaram consistentemente os modelos base em diversas tarefas. Por exemplo, em uma tarefa de reconhecimento de quartos no apartamento virtual, o modelo aprimorado obteve uma precisão média de 99,35%, uma melhoria de 14,99% em relação ao modelo base.
Implicações e aplicações futuras do novo aprendizado de máquina
Essa nova metodologia de treinamento de máquina tem implicações significativas para o futuro desenvolvimento de sistemas avançados de IA, especialmente aqueles destinados a navegar e aprender em novos ambientes. A capacidade de aprender de forma mais eficiente com dados limitados e em condições variadas torna essa abordagem particularmente útil para a exploração de ambientes extremos ou distantes, como no espaço.
“Nosso trabalho representa uma das primeiras tentativas de treinamento de IA mais flexível e eficiente em termos de energia usando conteúdo visual“, disse James Wang, professor de ciências da informação e tecnologia e orientador de Lizhen Zhu, a principal autora do estudo. Ele destacou que essa abordagem seria especialmente benéfica em situações onde um grupo de robôs autônomos com recursos limitados precisa aprender a navegar em um ambiente completamente desconhecido.
Para esse novo treinamento de máquina, o estudo contou com a colaboração de especialistas dos departamentos de Psicologia e de Ciência da Computação e Engenharia da Penn State. O financiamento para a pesquisa foi fornecido pela Fundação Nacional de Ciência dos EUA, bem como pelo Instituto de Ciências Computacionais e de Dados da Penn State.
Os conjuntos de dados criados para esta pesquisa estão disponíveis para outros cientistas usarem em seus próprios treinamentos de IA e podem ser acessados através do site http://www.child-view.com. Essa abertura para a comunidade científica é essencial para fomentar avanços contínuos e compartilhar conhecimentos que podem beneficiar múltiplas áreas de pesquisa e aplicação.
A inovação no treinamento de máquina, inspirada no desenvolvimento infantil, representa um avanço significativo na eficiência e eficácia dos sistemas, abrindo novas possibilidades para a exploração de ambientes complexos e a adaptação de IA a novas condições com recursos limitados.
Essa nova abordagem está abrindo caminhos para futuras aplicações em exploração espacial e robótica autônoma, sugerindo que olhar para a natureza e os processos de aprendizado humano pode oferecer insights valiosos para o desenvolvimento de tecnologias avançadas, promovendo um ciclo contínuo de inovação e descoberta.
Fonte: NeuroscienceNews