Novo modelo para Inteligência Artificial permite entender melhor o sentimento do consumidor

A Inteligência Artificial no mundo dos negócios é indiscutivelmente um diferencial. Por exemplo, aplicada para interpretar e classificar um sentimento de uma crítica de produto ou serviço. Isso não é novidade, mas uma nova solução visa otimizar essas avaliações.

A análise de sentimentos por inteligência artificial em nível de sentença, ou SLSA (sentence-level sentiment analysis), tem o objetivo justamente de identificar a polaridade geral de sentimentos transmitida em determinadas frases.

Os modelos de Inteligência Artificial para entender os sentimentos das avaliações

Antes de começar, vale entender as duas maneiras utilizadas para entender que no mundo dominado por comentários e avaliações online, compreender a emoção contida em cada frase tornou-se mais importante do que nunca, e isso é feito de duas maneiras: Através da análise em nível de sentença (SLSA) e em nível de aspecto (ALSA – aspect-level sentiment analysis).

Enquanto a ALSA busca entender a polaridade do sentimento direcionado a um aspecto específico, a SLSA se aprofunda na compreensão geral da emoção transmitida em toda a sentença. Em outras palavras, o SLSA analisa as opiniões e emoções expressas em uma sentença como um todo, enquanto o ALSA analisa o sentimento em relação a um aspecto ou característica particular de um produto ou serviço.

Por exemplo, em uma avaliação de um restaurante por inteligência artificial, o ALSA buscaria identificar a polaridade do sentimento expresso em relação a aspectos como qualidade da comida, serviço, ambiente, etc, enquanto o SLSA visa detectar a orientação sentimental geral de uma frase inteira, se mostrando bastante muito útil em cenários onde os comentários são frases curtas e isoladas sobre diversos temas de onde precisam ser depreendidos os sentimentos gerais.

Essas ferramentas são muito importantes para negócios de vários nichos.Em plataformas de comércio eletrônico renomadas, como por exemplo a booking.com, é crucial otimizar as estratégias de marketing, mergulhando nas preferências dos consumidores sobre sua experiência de compra. Da mesma forma, quando falamos de grandes fabricantes, como aqueles por trás dos smartphones ou computadores que usamos diariamente, eles têm a oportunidade de refinar o design dos seus produtos com base no feedback valioso que recebem dos clientes.

E, claro, não podemos esquecer das gigantes redes sociais, como Twitter e Facebook. Estas plataformas frequentemente utilizam a inteligência artificial para vasculhar e interpretar os sentimentos expressos nas postagens e comentários do público usando SLSA, dando-lhes uma janela direta para entender a opinião pública e as tendências emergentes no cenário social.

Até recentemente, os modelos mais avançados de aprendizado profundo (deep learning) estavam em destaque. No entanto, eles carregam uma particularidade: se baseiam na suposição independente e identicamente distribuída (i.i.d – independent and identically distributed). Isso quer dizer que o modelo pressupõe que os dados de treinamento e os dados-alvo são independentes e distribuídos de forma idêntica. Portanto, essa abordagem pode não ser adequada em cenários reais, onde há diferenças entre os dados de treinamento e os dados-alvo.

Vamos pensar em um cenário em que os comentários em uma plataforma digital vêm de usuários de diferentes países, com diferentes culturas e formas de expressão. Aí reside o problema: se os modelos são treinados apenas com base em uma suposição i.i.d, eles podem não se sair tão bem quando encontrarem dados que não seguem essa premissa que considera essa diversidade.

Os desafios superados pelo novo aprendizado de máquina

Para encontrar uma visão mais clara desse sentimento nas frases, os pesquisadores focaram na SLSA, propondo um diferencial para esse tipo de análise: um modelo não-i.i.d do aprendizado de máquina gradual (GML – gradual machine learning) para SLSA. Trata-se de uma abordagem que aproveita as DNNs (deep neural networks – redes neurais profundas, em tradução livre) não apenas para aprender com dados rotulados, mas também para extrair características dos dados não rotulados.

Tudo começa com observações rotuladas e o modelo vai se ajustando gradualmente com complexidade crescente, mergulhando fundo nas características dos dados para transferir informações, melhorando o desempenho do SLSA. Imagine que é como treinar um modelo de forma mais “orgânica”, permitindo-lhe adaptar-se e crescer com base nas informações que recebe ao longo do tempo

O que diferencia essa proposta é a chamada semântica binária, que ao tomar como entrada as incorporações de duas frases e fornecer um rótulo binário como saída, fica indicado se as duas frases têm a mesma polaridade ou não: basicamente uma técnica que verifica polaridades de sentimentos semelhantes ou diferentes.

Através da rede semântica binária, ao modelar essas relações como fatores binários em um gráfico de fatores, – que, de forma simples, é uma ferramenta que ajuda a representar as dependências entre as variáveis – , é possível conectar frases rotuladas e não rotuladas, transmitindo gradualmente conhecimento de observações rotuladas para instâncias não rotuladas, melhorando a precisão da análise de sentimento por SLSA.

Com isso, a análise de sentimento por inteligência artificial se torna mais precisa e ajustada ao que as pessoas realmente querem expressar, podendo capturar características mais diversificadas, que muitas vezes são difíceis de serem detectadas para os métodos tradicionais.

Os resultados dessa tecnologia

Impressionantemente, a abordagem GML proposta para SLSA supera soluções tradicionais de DNN em termos de precisão. Estudos extensivos em conjuntos de dados padrão demonstraram que o GML supera modelos tradicionais, alcançando, por exemplo, uma precisão de 93,2% no conjunto de dados SST-2, que é uma versão binária (positiva/negativa) do Stanford Sentiment Treebank, um popular conjunto de dados de análise de sentimentos, superando o modelo tradicional de DNN mais eficaz em 2,1%.

Essa performance da inteligência artificial é atribuída à habilidade de alavancar dados rotulados para aprendizado gradual supervisionado e à capacidade da rede semântica binária em capturar características mais diversificadas.

As limitações e os planos para superá-las

Os autores resumem as valiosas contribuições da sua abordagem para essa aplicação da inteligência artificial, ao mesmo tempo que apontam algumas limitações e possíveis trabalhos futuros.

Embora o GML tenha mostrado um desempenho excepcional, superando modelos de DNN tradicionais em todos os conjuntos de dados testados, há desafios. Por exemplo, a necessidade de dados rotulados pode ser um obstáculo em alguns cenários. Soluções não supervisionadas ou fracamente supervisionadas poderiam ser o foco de investigações futuras.

Além disso, o uso do modelo de gráfico de fatores pode apresentar dificuldades de escalabilidade em grandes conjuntos de dados. Portanto, modelos mais eficientes para a transmissão de conhecimento podem ser uma direção valiosa para pesquisa subsequente.

Então, se você já se perguntou como as empresas podem avaliar milhares de comentários usando inteligência artificial em questão de segundos, ou como as redes sociais podem categorizar o sentimento geral de uma publicação, a resposta está aqui: na intersecção entre aprendizado profundo, classificadores de polaridade e técnicas de aprendizado gradual.

Fonte: Nature – artigo completo disponível