Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: https://tede2.pucrs.br/tede2/handle/tede/9049
Tipo do documento: Dissertação
Título: Análise multimodal em blogs brasileiros
Autor: Molin, Greice Pinho Dal 
Primeiro orientador: Musse, Soraia Raupp
Resumo: O uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross-media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social.
Abstract: The use of social media is increasingly present in our lives. It is through images, texts and videos that humans try to communicate on social networks and expose their opinions in the face of everyday events. Due to the increased volume of data transmitted over the Internet, it is difficult to perform a human analysis of the media without the use of computer resources. Scientific communities, with various motivations, such as: analyzing feelings in text, in images, detecting opinions in blogs, among others, feel challenged to discover characteristics to be extracted from these contents, being an example of the analysis of emotions in blogs. Although the area of classification of feelings through texts and images is under development, there are still several challenges. The main challenge is to build algorithms and methods that can infer subtle and subjective feelings as humans perceive them. This paper presents the corpus Cross-media Brazilian Blog, a dataset that was built based on BlogSet-BR. In addition, it was built the Ground Truth of these data (based on the opinions of subjects) about the feelings perceived in the texts and images of these blogs, which in this work become available for use. Some technologies used to predict sentiment in text and images have been tested in the Cross-Media Brazilian Blog corpus and compared with Ground Truth. In addition to the analyzes performed on the texts, a research was conducted specifically on contradictory posts, i.e. when the image is positive and the text is negative, or vice versa, when present on the same blog. Results indicate that methodologies for detecting feelings in blogs can be customized to detect conflicting posts and be able to better identify feelings in social media posts.
Palavras-chave: Cross-Media Blogset
Análise de Sentimentos em Texto
Análise de Sentimentos em Imagens
Corpus
Léxicos
Contradição Entre Domínios
CNN
Text Sentiment Analysis
Image Sentiment Analysis
Lexicons
Domain Contradiction
Área(s) do CNPq: CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
Idioma: por
País: Brasil
Instituição: Pontifícia Universidade Católica do Rio Grande do Sul
Sigla da instituição: PUCRS
Departamento: Escola Politécnica
Programa: Programa de Pós-Graduação em Ciência da Computação
Tipo de acesso: Acesso Aberto
Restrição de acesso: Trabalho não apresenta restrição para publicação
URI: http://tede2.pucrs.br/tede2/handle/tede/9049
Data de defesa: 30-Ago-2019
Aparece nas coleções:Programa de Pós-Graduação em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
GREICE PINHO DAL MOLIN_dis.pdfGREICE_PINHO_DAL_MOLIN_DIS6,35 MBAdobe PDFThumbnail

Baixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.