Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors

Criatividade na IA? Inovação da DeepMind traz um tipo de “brainstorming” nas máquinas

Estaríamos mais próximos da criatividade da inteligência artificial? Neste artigo vamos explorar como a DeepMind, uma das maiores referências na área, nos oferece uma nova perspectiva sobre como as máquinas podem aprender a pensar de forma mais criativa e eficaz. 

Essa história começa com uma paixão renovada pelo xadrez, um jogo antigo que continua a fascinar e desafiar a mente humana, exigindo criatividade, além do conhecimento das regras.

No início de 2020, quando a pandemia de Covid-19 alterou drasticamente nossas rotinas, o cientista da computação Tom Zahavy, cientista pesquisador do Google DeepMind, redescobriu seu amor pelo xadrez. Influenciado pelo livro “Deep Thinking”, uma memorável narrativa de Garry Kasparov sobre suas partidas contra o computador Deep Blue da IBM em 1997, Zahavy mergulhou no universo do xadrez, assistindo a vídeos no YouTube e à série “The Queen’s Gambit” na Netflix. 

Mas sua jornada não se destinava a melhorar suas habilidades no jogo, ele encontrou um fascínio particular nos quebra-cabeças de xadrez – desafios que colocam as peças em configurações improváveis, exigindo criatividade para encontrar soluções que concedam alguma vantagem, o que os torna mais do que meros passatempos, sendo também instrumentos cruciais para desvendar as limitações ocultas dos programas de xadrez.

Um desses quebra-cabeças, criado pelo matemático Sir Roger Penrose em 2017, ilustra perfeitamente uma limitação. Ele posiciona as peças pretas, como a rainha e as torres, de maneira que, embora em teoria sejam mais fortes, estejam em posições complicadas. Enquanto um enxadrista experiente, utilizando sua criatividade, poderia conduzir a partida para um empate, os poderosos programas de xadrez indicariam uma clara vantagem para as pretas. Esse cenário levantou uma questão intrigante: apesar de computadores poderem derrotar os melhores jogadores humanos, será que eles realmente compreendem e resolvem todos os tipos de problemas complexos?

A resposta a essa pergunta levou Zahavy a uma investigação mais profunda na DeepMind, a empresa conhecida por desenvolver sistemas de inteligência artificial com habilidades surpreendentes. O objetivo era criar sistemas capazes de exibir um espectro de comportamentos, indo além da execução de uma única tarefa específica.

A abordagem tradicional em inteligência artificial, focada em treinar programas para vencer, mostrava-se limitada diante dos quebra-cabeças de Penrose. Foi então que Zahavy e sua equipe decidiram inovar, integrando múltiplos sistemas de decisão, cada um otimizado e treinado para diferentes estratégias, uma abordagem multifacetada, que incluía até dez sistemas distintos, revelando-se então mais eficaz do que usar um único programa.

O diferencial foi a colaboração interna dos sistemas: quando um encontrava um obstáculo, outro sistema assumia, imitando de certa forma as sessões de brainstorming humanas. Esse método não apenas resolveu os quebra-cabeças de Penrose com mais habilidade e criatividade, mas também abriu um leque de possibilidades para a aplicação dessa técnica em outros campos além do xadrez.

Cientistas como Allison Liemhetcharat, cientista da computação da DoorDash que trabalhou com abordagens multiagentes para resolução de problemas em robótica,  e Antoine Cully, pesquisador de IA do Imperial College London que não esteve envolvido no projeto DeepMind, reconhecem o valor dessa abordagem com uma população de agentes, em vez de um único, para buscar mais maneiras de resolver problemas. A partir do que se assemelha a um brainstorming humano, onde nossa criatividade é recrutada, uma maior gama de problemas podem ser resolvidos de muito mais maneiras, com soluções mais criativas e eficazes

Desbravando os limites da inteligência artificial

Após explorar as nuances da aprendizagem profunda e do reforço na inteligência artificial, a jornada de Zahavy na DeepMind nos leva a um aspecto fascinante: o desafio de incorporar a criatividade no processo de aprendizado das máquinas. Sua investigação sobre os quebra-cabeças de xadrez, especialmente os criados por Penrose, revelou um aspecto crucial das limitações dos sistemas de inteligência artificial como o AlphaZero, que, apesar de sua competência inquestionável em jogos convencionais de xadrez, enfrentavam dificuldades significativas quando confrontados com problemas inéditos e situações fora do padrão.

O mergulho de Zahavy nesse universo do desconhecido revelou algo surpreendente sobre os erros e falhas desses sistemas. Longe de serem simples defeitos, esses ‘gaps’ representavam oportunidades de aprendizado e inovação. Ao invés de descartá-los como falhas inúteis, Zahavy começou a vê-los como indicativos de uma abordagem de aprendizado mais profunda, onde o erro se transforma em um degrau para a evolução e a adaptação. A busca por soluções que exigissem certa criatividade tornou-se então um ponto central nesse processo.

Inspirado por Garry Kasparov e sua visão sobre a criatividade como uma qualidade intrinsecamente humana, Zahavy começou a ponderar sobre como integrar essa dimensão na inteligência artificial. A habilidade de falhar, aprender com essas falhas e buscar novas direções é um pilar do pensamento criativo, e trazer essa criatividade para o mundo das máquinas tornou-se um desafio estimulante e revelador.

Criatividade do AlphaZero?

Zahavy e sua equipe então se depararam com um problema fundamental enfrentado pelos sistemas de aprendizado por reforço: a generalização. Esses sistemas, embora excepcionais em desenvolver estratégias para situações específicas, encontram dificuldades significativas ao tentar aplicar o aprendizado a problemas diferentes. E aqui, os quebra-cabeças de Penrose emergem como um campo de teste decisivo, destacando as limitações do AlphaZero, que, focada em vencer jogos do início ao fim, falhava em reconhecer e adaptar-se a configurações inusitadas das peças.

Em uma abordagem inovadora, os pesquisadores compilaram 53 quebra-cabeças de Penrose, além de 15 desafios adicionais, colocando o AlphaZero à prova. Os resultados iniciais foram modestos, com a inteligência artificial resolvendo menos de 4% dos puzzles de Penrose e cerca de 12% dos desafios adicionais, o que é justificado, porque esses quebra-cabeças foram meticulosamente desenhados por mestres do xadrez para confundir computadores.

No entanto, um salto significativo na performance foi observado quando o sistema foi treinado usando arranjos dos quebra-cabeças de Penrose como posições de partida em vez do tabuleiro completo dos jogos típicos. A melhoria foi significativa, com a IA resolvendo impressionantes 96% dos puzzles de Penrose e 76% do conjunto de desafios

Esse sucesso levou Zahavy a ponderar sobre a possibilidade de uma versão diversificada do AlphaZero, que pudesse acessar diferentes versões de si mesma, treinadas em variadas situações, aumentando assim sua capacidade de abordar novos problemas de maneira produtiva.

A equipe então desenvolveu uma nova versão do sistema, composta por múltiplos agentes de inteligência artificial treinados independentemente em uma variedade de cenários, com um algoritmo que governa o sistema geral funcionando como um “casamenteiro virtual”, identificando qual agente teria a maior probabilidade de sucesso em cada jogada. Além disso, um “bônus de diversidade” foi codificado, recompensando o sistema sempre que ele utilizasse estratégias de um vasto leque de opções.

Os resultados foram reveladores. A nova inteligência artificial diversificada experimentou aberturas novas e eficazes, além de decisões inovadoras em estratégias específicas, como o momento e local para realizar o roque (é uma jogada especial do xadrez que envolve a movimentação de duas peças em um único lance). Em muitas partidas, a nova versão superou o AlphaZero original, e foi constatado que a versão diversificada conseguia resolver o dobro de quebra-cabeças do conjunto de desafios e mais da metade do catálogo total de puzzles de Penrose.

A ideia subjacente a esse sucesso era a de “diversidade criativa”, que se trata de, em vez de buscar uma única solução ou política para vencer qualquer jogador, a nova inteligência artificial utilizava um leque de abordagens criativas. Zahavy ressaltou que, ao controlar os tipos de jogos que o modelo visualizava, era possível influenciar como ele generalizaria seus aprendizados. As recompensas intrínsecas e os movimentos associados a elas, antes vistos como limitações, agora se tornavam pontos fortes para comportamentos diversos. O sistema aprendeu a avaliar e valorizar as abordagens distintas, identificando quando elas eram mais bem-sucedidas.

As implicações dessa abordagem diversificada e colaborativa se estendem muito além do xadrez, abrindo portas para inúmeras aplicações em diferentes áreas do conhecimento e da tecnologia.

Criatividade e colaboração na inteligência artificial

Antoine Cully enfatiza que a abordagem diversificada pode beneficiar qualquer sistema de inteligência artificial, não apenas aqueles baseados em aprendizado por reforço. Ele mesmo já utiliza a diversificação aplicada a sistemas físicos, como em um robô de seis pernas, que aprendeu a se mover de maneiras variadas, e também aplicada a áreas inovadoras, como a descoberta de novos medicamentos e estratégias eficazes de negociação de ações.

O objetivo dessas abordagens é gerar milhares de soluções únicas, cada uma distinta da outra, criando um vasto leque de opções, permitindo que o sistema escolha a melhor solução para cada tipo de problema, assim como o sistema de um jogador de xadrez diversificado aprendeu a fazer. Isso mostra como o sistema global é capaz de achar a melhor solução para cada tipo específico de problema, mostrando que a busca por estratégias diversificadas ajuda a pensar fora da caixa e encontrar soluções inovadoras.

Zahavy propõe uma conexão curiosa entre humanos e máquinas, sugerindo que a inteligência pode ser apenas uma questão de poder computacional. Para um sistema de inteligência artificial, a criatividade pode se resumir à capacidade de considerar e selecionar entre um grande número de opções. À medida que o sistema recebe recompensas por selecionar uma variedade de estratégias ótimas, a resolução criativa de problemas é reforçada e fortalecida, podendo, em teoria, emular qualquer tipo de estratégia de resolução de problemas reconhecida como criativa em humanos.

Apesar desses avanços, Liemhetcharat adverte que um sistema de inteligência artificial diversificado provavelmente não resolverá completamente o problema mais amplo de generalização na aprendizagem de máquina, mas que de fato representa um passo na direção certa, mitigando uma das limitações conhecidas.

O trabalho de Zahavy também encontra paralelos no mundo humano, onde a cooperação tem levado a um desempenho melhor em tarefas complexas e que demandam certa criatividade. Um exemplo disso são as músicas mais populares da Billboard 100, frequentemente escritas por equipes de compositores, e não por uma só pessoa. 

Contudo, ainda há espaço para melhoria para essa “criatividade” das máquinas. A abordagem diversificada é atualmente cara em termos computacionais, pois considera muito mais possibilidades do que um sistema típico, mas Zahavy acredita que ainda existem maneiras para encontrar diferentes soluções e que, mesmo com todos os dados do mundo, pode não haver apenas uma resposta para cada pergunta.

A abordagem diversificada de Zahavy e sua equipe não apenas quebra paradigmas em como os sistemas de IA resolvem problemas, mas também inspira um novo pensamento sobre a natureza da inteligência e a criatividade, tanto artificial quanto humana.

Fonte: Quanta Magazine

Futuro Relativo

Futuro Relativo

Um espaço de divulgação, de diálogo, de pensar e porque não dizer, de construir o futuro 🪐
Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors

Categorias