A Inteligência Artificial é universalmente aplicável? Em um mundo cada vez mais globalizado, poderíamos supor que sim, ainda mais por se tratar de uma tecnologia de ponta tão transformadora.
No entanto, quando se trata de língua e cultura, a coisa muda um pouco de figura. A crescente fama do ChatGPT, o chatbot de inteligência artificial que rapidamente capturou a atenção global, destacou um desafio interessante enfrentado pelo Japão.
O mais interessante é o que vem guiando a necessidade de superação dessas barreiras encontradas pelo Japão com o ChatGPT.
Há uma visão crescente entre os pesquisadores japoneses de que as nuances complexas da língua japonesa e seu rico mosaico cultural não podem ser adequadamente compreendidas por sistemas de IA treinados predominantemente em línguas estrangeiras.
Respondendo a essa lacuna linguística e cultural, o Japão está fazendo avanços significativos para criar seus próprios gigantes da inteligência artificial. Com grandes players de tecnologia, como NEC, Fujitsu e SoftBank, fazendo parceria com o governo, há um grande investimento em andamento para desenvolver chatbots de IA que não sejam meras traduções de seus equivalentes em inglês, mas que estejam enraizados na essência da língua japonesa.
Keisuke Sakaguchi, especialista em processamento de linguagem natural da Universidade Tohoku, menciona que, enquanto a atual safra de modelos LLM (Large Language Models, ou Modelos de Linguagem de Grande Escala, em tradução livre) como o ChatGPT se destaca no inglês, muitas vezes não são precisos com o japonês. Essa deficiência é atribuída a uma combinação de fatores, incluindo o sistema alfabético único e a disponibilidade limitada de dados.
A busca pelo “ChatGPT” perfeito
Os modelos LLM funcionam alimentando-se de enormes quantidades de dados de fontes públicas, com o principal objetivo de aprender os padrões de fala e construção narrativa naturais, prevendo a próxima palavra com base nas palavras anteriores de um texto.
Quer saber mais detalhes sobre os LLMs? É só clicar aqui e você vai ficar fera no assunto!
Este pode parecer um processo simples à primeira vista, mas considere o fato de que a maioria dos dados nos quais o GPT-3, o modelo anterior à atual versão do ChatGPT, foi treinado está em inglês. Combine essa realidade com a habilidade quase impressionante desse chatbot de manter conversas ao estilo humano, – o que, aliás, tem sido fonte de admiração e preocupação em igual medida. Enquanto alguns veem uma ferramenta potencial para aumentar produtividade, outros temem suas aplicações irresponsáveis, como a produção desonesta de trabalhos científicos.
O desafio fica ainda maior quando olhamos para o Japão. A estrutura das frases em japonês é radicalmente diferente do inglês. Isso significa que o ChatGPT tem o árduo trabalho de traduzir uma consulta em japonês para o inglês, encontrar a resposta e, em seguida, traduzi-la de volta para o japonês.
A complexidade da tarefa se torna ainda mais evidente ao considerarmos as peculiaridades da escrita japonesa. Enquanto o inglês tem apenas 26 letras, o japonês é composto por dois conjuntos de 48 caracteres básicos e mais 2.136 caracteres chineses frequentemente usados, conhecidos como kanji.
Estes kanji não são simples: a maioria tem duas ou mais pronúncias, e há ainda cerca de 50.000 kanji raramente usados. Diante dessa complexidade, não é surpreendente que o ChatGPT encontre obstáculos com a língua.
Keisuke Sakaguchi acrescenta mais à discussão, observando que, ao tentar lidar com o japonês, o ChatGPT às vezes gera caracteres extremamente raros que a maioria das pessoas nunca viu antes, resultando em palavras estranhas e desconhecidas.
Cultura e tecnologia: O futuro dos LLMs no Japão
Mais do que entender a linguagem a IA também precisa incorporar nuances culturais. Suponha que você use o ChatGPT para escrever um e-mail de candidatura a um emprego em japonês. Em vez de parecer autenticamente japonês, pode acabar soando como uma tradução direta do inglês, omitindo expressões padrão de cortesia tão valorizadas na cultura japonesa.
Com o objetivo de medir a sensibilidade dos LLMs à cultura japonesa, um grupo de pesquisadores criou o Rakuda, uma ferramenta que avalia o quão bem esses modelos respondem a perguntas abertas sobre tópicos japoneses.
E, enquanto o GPT-4 está no topo da lista do Rakuda, o melhor LLM japonês em código aberto aparece só na quarta posição. Sam Passaglia, co-fundador do Rakuda e físico na Universidade de Tóquio, observa que os LLMs japoneses têm feito progressos notáveis, mas ainda estão atrás do GPT-4, mas ele acredita que não há razão para que um modelo japonês não possa, em teoria, igualar ou até superar o GPT-4 no futuro.
Há um esforço significativo em andamento para esse modelo japonês usando o supercomputador Fugaku, um dos mais rápidos do mundo. Apoiado por instituições renomadas, como o Instituto de Tecnologia de Tóquio e a Fujitsu, este LLM será lançado no próximo ano e promete ser revolucionário. Além disso, terá seu código disponibilizado ao público, contrastando com modelos proprietários como o GPT-4.
Além disso, o Ministério da Educação do Japão está financiando um programa de inteligência artificial voltado às necessidades científicas. Esta IA se propõe a gerar hipóteses científicas a partir da aprendizagem de pesquisas já publicadas. Inicialmente, o modelo começará com impressionantes 100 bilhões de parâmetros, pouco mais da metade do tamanho do GPT-3, e esse número deverá crescer com o tempo.
Makoto Taiji, vice-diretor do Centro RIKEN para Pesquisa em Dinâmica de Biossistemas, tem grandes esperanças para este projeto, vendo o potencial para acelerar drasticamente o ciclo de pesquisa científica. No entanto, inovação tem seu preço: o desenvolvimento deste LLM poderá custar pelo menos ¥30 bilhões (204 milhões de dólares americanos) e espera-se que esteja disponível ao público em 2031.
Empresas japonesas na vanguarda da Inteligência Artificial
As empresas japonesas estão avançando a todo vapor no campo da IA, e muitas já estão comercializando ou se preparando para lançar suas próprias tecnologias baseadas em LLM.
Dentro desse panorama, a NEC, fabricante de supercomputadores, merece destaque. Desde maio, a empresa utiliza uma AI orientada para a língua japonesa, revolucionando seu modo de operar.
A tecnologia da NEC já permite reduzir pela metade o tempo necessário para criar relatórios internos ou cortar em 80% o tempo para desenvolver código-fonte de software. Além disso, em julho, eles deram um passo além, oferecendo serviços de IA personalizáveis para seus clientes.
Masafumi Oyamada, investigador principal sênior do Laboratório de Ciência de Dados da NEC, vislumbra um universo de possibilidades. Desde finanças a transporte, de produção de código à redação e revisão de artigos acadêmicos: as aplicações parecem não ter limites.
Mas a NEC não está sozinha nessa corrida. A gigante das telecomunicações, SoftBank, anunciou um investimento robusto de ¥20 bilhões em IA generativa com foco no texto japonês. Com o lançamento de seu próprio LLM previsto para o próximo ano e uma parceria sólida com a Microsoft, investidora da OpenAI, a SoftBank tem objetivos claros: querem ser a força propulsora por trás da digitalização dos negócios, visando, especialmente, universidades, instituições de pesquisa e outras organizações.
No centro de tudo isso, há uma esperança compartilhada. Os pesquisadores japoneses acreditam firmemente que um chatbot de IA preciso, eficaz e genuinamente japonês poderia não apenas acelerar a ciência, mas também ser a ponte entre o Japão e o mundo.
Shotaro Kinoshita, pesquisador em tecnologia médica na Escola de Medicina da Universidade Keio em Tóquio, destaca que se uma versão japonesa do ChatGPT for bem-sucedida e precisa, isso poderá beneficiar imensamente aqueles que desejam aprender japonês ou conduzir pesquisas sobre o Japão. E, claro, os benefícios para pesquisas colaborativas internacionais poderiam ser imensuráveis.
O que podemos aprender com o Japão?
É importante olhar como a cultura no Japão está preocupada não só em desenvolver a IA, mas desenvolvê-la em favor da educação e da ciência.
No mundo acadêmico, chatbots inteligentes já são realidade e várias instituições renomadas pelo mundo estão adotando o ChatGPT, como por exemplo, Yale. Clica aqui para ler mais.
A despeito dos problemas, o país que olhar para esses sistemas inteligentes de forma responsável pode ter um grande diferencial que proporcionará oportunidades de avanços significativos em vários campos. E talvez até, com o uso e olhar acurado sobre esses recursos seja possível, inclusive, mitigar mais rápido os problemas que enfrentamos hoje, a fim de otimizar as ferramentas para o que realmente interessa ao país, – que está bem claro ser a questão do suporte para a educação e para a ciência.
É, de fato, ignorar a inteligência artificial não parece mais ser uma opção. E mais do que não ignorar, quanto mais as diretrizes forem coerentes mais poderão colaborar para o desenvolvimento de um país.
Fonte: Nature