Estaríamos mais próximos da criatividade da inteligência artificial? Neste artigo vamos explorar como a DeepMind, uma das maiores referências na área, nos oferece uma nova perspectiva sobre como as máquinas podem aprender a pensar de forma mais criativa e eficaz.
Essa história começa com uma paixão renovada pelo xadrez, um jogo antigo que continua a fascinar e desafiar a mente humana, exigindo criatividade, além do conhecimento das regras.
No início de 2020, quando a pandemia de Covid-19 alterou drasticamente nossas rotinas, o cientista da computação Tom Zahavy, cientista pesquisador do Google DeepMind, redescobriu seu amor pelo xadrez. Influenciado pelo livro “Deep Thinking”, uma memorável narrativa de Garry Kasparov sobre suas partidas contra o computador Deep Blue da IBM em 1997, Zahavy mergulhou no universo do xadrez, assistindo a vídeos no YouTube e à série “The Queen’s Gambit” na Netflix.
Mas sua jornada não se destinava a melhorar suas habilidades no jogo, ele encontrou um fascínio particular nos quebra-cabeças de xadrez – desafios que colocam as peças em configurações improváveis, exigindo criatividade para encontrar soluções que concedam alguma vantagem, o que os torna mais do que meros passatempos, sendo também instrumentos cruciais para desvendar as limitações ocultas dos programas de xadrez.
Um desses quebra-cabeças, criado pelo matemático Sir Roger Penrose em 2017, ilustra perfeitamente uma limitação. Ele posiciona as peças pretas, como a rainha e as torres, de maneira que, embora em teoria sejam mais fortes, estejam em posições complicadas. Enquanto um enxadrista experiente, utilizando sua criatividade, poderia conduzir a partida para um empate, os poderosos programas de xadrez indicariam uma clara vantagem para as pretas. Esse cenário levantou uma questão intrigante: apesar de computadores poderem derrotar os melhores jogadores humanos, será que eles realmente compreendem e resolvem todos os tipos de problemas complexos?
A resposta a essa pergunta levou Zahavy a uma investigação mais profunda na DeepMind, a empresa conhecida por desenvolver sistemas de inteligência artificial com habilidades surpreendentes. O objetivo era criar sistemas capazes de exibir um espectro de comportamentos, indo além da execução de uma única tarefa específica.
A abordagem tradicional em inteligência artificial, focada em treinar programas para vencer, mostrava-se limitada diante dos quebra-cabeças de Penrose. Foi então que Zahavy e sua equipe decidiram inovar, integrando múltiplos sistemas de decisão, cada um otimizado e treinado para diferentes estratégias, uma abordagem multifacetada, que incluía até dez sistemas distintos, revelando-se então mais eficaz do que usar um único programa.
O diferencial foi a colaboração interna dos sistemas: quando um encontrava um obstáculo, outro sistema assumia, imitando de certa forma as sessões de brainstorming humanas. Esse método não apenas resolveu os quebra-cabeças de Penrose com mais habilidade e criatividade, mas também abriu um leque de possibilidades para a aplicação dessa técnica em outros campos além do xadrez.
Cientistas como Allison Liemhetcharat, cientista da computação da DoorDash que trabalhou com abordagens multiagentes para resolução de problemas em robótica, e Antoine Cully, pesquisador de IA do Imperial College London que não esteve envolvido no projeto DeepMind, reconhecem o valor dessa abordagem com uma população de agentes, em vez de um único, para buscar mais maneiras de resolver problemas. A partir do que se assemelha a um brainstorming humano, onde nossa criatividade é recrutada, uma maior gama de problemas podem ser resolvidos de muito mais maneiras, com soluções mais criativas e eficazes.
Desbravando os limites da inteligência artificial
Após explorar as nuances da aprendizagem profunda e do reforço na inteligência artificial, a jornada de Zahavy na DeepMind nos leva a um aspecto fascinante: o desafio de incorporar a criatividade no processo de aprendizado das máquinas. Sua investigação sobre os quebra-cabeças de xadrez, especialmente os criados por Penrose, revelou um aspecto crucial das limitações dos sistemas de inteligência artificial como o AlphaZero, que, apesar de sua competência inquestionável em jogos convencionais de xadrez, enfrentavam dificuldades significativas quando confrontados com problemas inéditos e situações fora do padrão.
O mergulho de Zahavy nesse universo do desconhecido revelou algo surpreendente sobre os erros e falhas desses sistemas. Longe de serem simples defeitos, esses ‘gaps’ representavam oportunidades de aprendizado e inovação. Ao invés de descartá-los como falhas inúteis, Zahavy começou a vê-los como indicativos de uma abordagem de aprendizado mais profunda, onde o erro se transforma em um degrau para a evolução e a adaptação. A busca por soluções que exigissem certa criatividade tornou-se então um ponto central nesse processo.
Inspirado por Garry Kasparov e sua visão sobre a criatividade como uma qualidade intrinsecamente humana, Zahavy começou a ponderar sobre como integrar essa dimensão na inteligência artificial. A habilidade de falhar, aprender com essas falhas e buscar novas direções é um pilar do pensamento criativo, e trazer essa criatividade para o mundo das máquinas tornou-se um desafio estimulante e revelador.
Criatividade do AlphaZero?
Zahavy e sua equipe então se depararam com um problema fundamental enfrentado pelos sistemas de aprendizado por reforço: a generalização. Esses sistemas, embora excepcionais em desenvolver estratégias para situações específicas, encontram dificuldades significativas ao tentar aplicar o aprendizado a problemas diferentes. E aqui, os quebra-cabeças de Penrose emergem como um campo de teste decisivo, destacando as limitações do AlphaZero, que, focada em vencer jogos do início ao fim, falhava em reconhecer e adaptar-se a configurações inusitadas das peças.
Em uma abordagem inovadora, os pesquisadores compilaram 53 quebra-cabeças de Penrose, além de 15 desafios adicionais, colocando o AlphaZero à prova. Os resultados iniciais foram modestos, com a inteligência artificial resolvendo menos de 4% dos puzzles de Penrose e cerca de 12% dos desafios adicionais, o que é justificado, porque esses quebra-cabeças foram meticulosamente desenhados por mestres do xadrez para confundir computadores.
No entanto, um salto significativo na performance foi observado quando o sistema foi treinado usando arranjos dos quebra-cabeças de Penrose como posições de partida em vez do tabuleiro completo dos jogos típicos. A melhoria foi significativa, com a IA resolvendo impressionantes 96% dos puzzles de Penrose e 76% do conjunto de desafios.
Esse sucesso levou Zahavy a ponderar sobre a possibilidade de uma versão diversificada do AlphaZero, que pudesse acessar diferentes versões de si mesma, treinadas em variadas situações, aumentando assim sua capacidade de abordar novos problemas de maneira produtiva.
A equipe então desenvolveu uma nova versão do sistema, composta por múltiplos agentes de inteligência artificial treinados independentemente em uma variedade de cenários, com um algoritmo que governa o sistema geral funcionando como um “casamenteiro virtual”, identificando qual agente teria a maior probabilidade de sucesso em cada jogada. Além disso, um “bônus de diversidade” foi codificado, recompensando o sistema sempre que ele utilizasse estratégias de um vasto leque de opções.
Os resultados foram reveladores. A nova inteligência artificial diversificada experimentou aberturas novas e eficazes, além de decisões inovadoras em estratégias específicas, como o momento e local para realizar o roque (é uma jogada especial do xadrez que envolve a movimentação de duas peças em um único lance). Em muitas partidas, a nova versão superou o AlphaZero original, e foi constatado que a versão diversificada conseguia resolver o dobro de quebra-cabeças do conjunto de desafios e mais da metade do catálogo total de puzzles de Penrose.
A ideia subjacente a esse sucesso era a de “diversidade criativa”, que se trata de, em vez de buscar uma única solução ou política para vencer qualquer jogador, a nova inteligência artificial utilizava um leque de abordagens criativas. Zahavy ressaltou que, ao controlar os tipos de jogos que o modelo visualizava, era possível influenciar como ele generalizaria seus aprendizados. As recompensas intrínsecas e os movimentos associados a elas, antes vistos como limitações, agora se tornavam pontos fortes para comportamentos diversos. O sistema aprendeu a avaliar e valorizar as abordagens distintas, identificando quando elas eram mais bem-sucedidas.
As implicações dessa abordagem diversificada e colaborativa se estendem muito além do xadrez, abrindo portas para inúmeras aplicações em diferentes áreas do conhecimento e da tecnologia.
Criatividade e colaboração na inteligência artificial
Antoine Cully enfatiza que a abordagem diversificada pode beneficiar qualquer sistema de inteligência artificial, não apenas aqueles baseados em aprendizado por reforço. Ele mesmo já utiliza a diversificação aplicada a sistemas físicos, como em um robô de seis pernas, que aprendeu a se mover de maneiras variadas, e também aplicada a áreas inovadoras, como a descoberta de novos medicamentos e estratégias eficazes de negociação de ações.
O objetivo dessas abordagens é gerar milhares de soluções únicas, cada uma distinta da outra, criando um vasto leque de opções, permitindo que o sistema escolha a melhor solução para cada tipo de problema, assim como o sistema de um jogador de xadrez diversificado aprendeu a fazer. Isso mostra como o sistema global é capaz de achar a melhor solução para cada tipo específico de problema, mostrando que a busca por estratégias diversificadas ajuda a pensar fora da caixa e encontrar soluções inovadoras.
Zahavy propõe uma conexão curiosa entre humanos e máquinas, sugerindo que a inteligência pode ser apenas uma questão de poder computacional. Para um sistema de inteligência artificial, a criatividade pode se resumir à capacidade de considerar e selecionar entre um grande número de opções. À medida que o sistema recebe recompensas por selecionar uma variedade de estratégias ótimas, a resolução criativa de problemas é reforçada e fortalecida, podendo, em teoria, emular qualquer tipo de estratégia de resolução de problemas reconhecida como criativa em humanos.
Apesar desses avanços, Liemhetcharat adverte que um sistema de inteligência artificial diversificado provavelmente não resolverá completamente o problema mais amplo de generalização na aprendizagem de máquina, mas que de fato representa um passo na direção certa, mitigando uma das limitações conhecidas.
O trabalho de Zahavy também encontra paralelos no mundo humano, onde a cooperação tem levado a um desempenho melhor em tarefas complexas e que demandam certa criatividade. Um exemplo disso são as músicas mais populares da Billboard 100, frequentemente escritas por equipes de compositores, e não por uma só pessoa.
Contudo, ainda há espaço para melhoria para essa “criatividade” das máquinas. A abordagem diversificada é atualmente cara em termos computacionais, pois considera muito mais possibilidades do que um sistema típico, mas Zahavy acredita que ainda existem maneiras para encontrar diferentes soluções e que, mesmo com todos os dados do mundo, pode não haver apenas uma resposta para cada pergunta.
A abordagem diversificada de Zahavy e sua equipe não apenas quebra paradigmas em como os sistemas de IA resolvem problemas, mas também inspira um novo pensamento sobre a natureza da inteligência e a criatividade, tanto artificial quanto humana.
Fonte: Quanta Magazine