Export this record: EndNote BibTex

Please use this identifier to cite or link to this item: http://tede2.pucrs.br/tede2/handle/tede/8269
Document type: Dissertação
Title: Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
Author: Becker, Willian Eduardo 
Advisor: Barros, Rodrigo Coelho
Abstract (native): A utilização de redes sociais tornou-se uma atividade cotidiana na sociedade atual. Com o enorme, e ininterrupto, fluxo de informações geradas nestes espaços, abre-se a possibilidade de explorar estes dados de diversas formas. A Análise de Sentimento (AS) é uma tarefa que visa obter conhecimento sobre a polaridade das mensagens postadas, através de diversas técnicas de Processamento de Linguagem Natural, onde a maioria das soluções lida com somente um idioma de cada vez. Entretanto, abordagens que não restringem se a explorar somente uma língua, estão mais próximas de extraírem todo o conhecimento e possibilidades destes dados. Abordagens recentes baseadas em Aprendizado de Máquina propõem-se a resolver a AS apoiando-se principalmente nas Redes Neurais Profundas (Deep Learning), as quais obtiveram bons resultados nesta tarefa. Neste trabalho são propostas três arquiteturas de Redes Neurais Convolucionais que lidam com dados multi-linguais extraídos do Twitter contendo quatro línguas. Os dois primeiros modelos propostos caracterizam-se pelo fato de possuírem um total de parâmetros muito menor que os demais baselines considerados, e ainda assim, obtêm resultados superiores com uma boa margem de diferença. O último modelo proposto é capaz de realizar uma classificação multitarefa, identificando a polaridade das sentenças e também a língua. Com este último modelo obtém-se uma acurácia de 74.43% para AS e 98.40% para Identificação da Língua em um dataset com quatro línguas, mostrando-se a melhor escolha entre todos os baselines analisados.
Abstract (english): Nowadays, the use of social media has become a daily activity of our society. The huge and uninterrupt flow of information in these spaces opens up the possibility of exploring this data in different ways. Sentiment Analysis (SA) is a task that aims to obtain knowledge about the polarity of a given text relying on several techniques of Natural Language Processing, with most of solutions dealing with only one language at a time. However, approaches that are not restricted to explore only one language are more related to extract the whole knowledge and possibilities of these data. Recent approaches based on Machine Learning propose to solve SA by using mainly Deep Learning Neural Networks have obtained good results in this task. In this work is proposed three Convolutional Neural Network architectures that deal with multilingual Twitter data of four languages. The first and second proposed models are characterized by the fact they require substantially less learnable parameters than other considered baselines while are more accurate than several other Deep Neural architectures. The third proposed model is able to perform a multitask classification by identifying the polarity of a given sentences and also its language. This model reaches an accuracy of 74.43% for SA and 98.40% for Language Identification in the four-language multilingual dataset. Results confirm that proposed model is the best choice for both sentiment and language classification by outperforming the considered baselines.
Keywords: Redes Neurais Convolucionais
Inteligência Artificial
Análise de Sentimento
Aprendizado Profundo
PLN
Convolutional Neural Networks
Artificial Intelligence
Sentiment Analysis
Deep Learning
NLP
CNPQ Knowledge Areas: CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Institution Acronym: PUCRS
Department: Escola Politécnica
Program: Programa de Pós-Graduação em Ciência da Computação
Access type: Acesso Aberto
Fulltext access restriction: Trabalho não apresenta restrição para publicação
URI: http://tede2.pucrs.br/tede2/handle/tede/8269
Issue Date: 24-Nov-2017
Appears in Collections:Programa de Pós-Graduação em Ciência da Computação

Files in This Item:
File Description SizeFormat 
WILLIAN EDUARDO BECKER_DIS.pdfWILLIAN_EDUARDO_BECKER_DIS2.09 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.