Export this record: EndNote BibTex

Please use this identifier to cite or link to this item: https://tede2.pucrs.br/tede2/handle/tede/10483
Full metadata record
DC FieldValueLanguage
dc.creatorCunha, Holisson Soares da-
dc.creator.Latteshttp://lattes.cnpq.br/5628596240762051por
dc.contributor.advisor1Ruiz, Duncan Dubugras Alcoba-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8250832800932125por
dc.date.accessioned2022-09-22T14:51:40Z-
dc.date.issued2016-04-30-
dc.identifier.urihttps://tede2.pucrs.br/tede2/handle/tede/10483-
dc.description.resumoDiariamente, milhões de usuários utilizam o Twitter para compartilhar mensagens, fornecendo um enorme volume de conteúdo opinativo sobre diversos tópicos de interesse da sociedade. Além da quantidade de mensagens, o Twitter caracteriza-se como uma rede social de Fluxo Contínuo de Dados, que gera novas mensagens em tempo real, em alta velocidade e com distribuição não estacionária. Devido a essas características, pesquisas recentes em Análise de Sentimento têm explorado o Twitter em tarefas de classificação online, considerando restrições de tempo, memória e a necessidade de adaptação às mudanças que podem ocorrer na distribuição dos dados. Chamado de Concept Drift, esse fenômeno ocorre em decorrência de potenciais mudanças na distribuição que gera novos dados dentro do fluxo, afetando diretamente a capacidade de generalização do algoritmo. Além disso, a Análise de Sentimento introduz um tipo especial de mudança, chamada de Feature Drift. Trata-se de um problema onde novos atributos relevantes são encontrados ao longo do fluxo e atributos conhecidos se tornam irrelevantes, o que sugere o uso de um espaço dimensional dinâmico. Com base nesses desafios, neste trabalho é proposto SENTIMENTSTREAM, um comitê de classificadores dinâmico, baseado em lotes de dados, e que incrementalmente processa e avalia novas instâncias ao longo do fluxo. Especializado na classificação de tweets, SENTIMENTSTREAM é composto por dois componentes principais: (i) Um detector de concept drift, capaz de detectar e reagir de forma eficiente a mudanças abruptas na distribuição dos dados e, (ii) um detector de feature drift, que utiliza uma estratégia automática para monitorar e identificar potenciais mudanças no espaço de atributos. Experimentos com dados reais do Twitter indicam que SENTIMENTSTREAM apresenta resultados efetivos, sendo eficaz no processo de classificação de tweets e no tratamento de mudanças abruptas na distribuição dos dados.por
dc.description.abstractDaily, millions of users use Twitter to share messages, providing a huge amount of opinionated content on various topics of interest to society. In addition to the volume of messages, Twitter is characterized as a social network in data streaming, that generates new messages in real-time at high speed and with a nonstationary distribution. Because of these characteristics, recent research in Sentiment Analysis has explored Twitter as an online classification task, considering constraints of time, memory, and the need to adapt to changes that may occur in the data distribution. Called concept drift, this phenomenon occurs due to potential changes in the distribution that generates new data within the stream, directly affecting the algorithm’s ability to generalize. Furthermore, the Sentiment Analysis introduces a special kind of challenge, called feature drift. In this case, new relevant attributes are found along the stream and known attributes may become irrelevant, which suggests the use of dynamic feature space. Based on these challenges, this work proposes SENTIMENTSTREAM, a dynamic ensemble classifier, which incrementally processes and analyses new instances along the stream. Specialized to process Twitter data, SENTIMENTSTREAM is composed of two main components: (i) A concept drift detector, able to detect and react efficiently to abrupt changes in the data distribution, and (ii) a feature drift detector, which uses an automatic strategy to monitor and identify potential changes in the attributes space. Experimentation with real data of Twitter indicates that Twitter SENTIMENTSTREAM presents effective results, being effective for tweets classification and treatment of potential changes in the data distribution.eng
dc.description.provenanceSubmitted by PPG Ciência da Computação ([email protected]) on 2022-09-13T14:37:06Z No. of bitstreams: 1 HOLISSON_SOARES_DA_CUNHA_DIS.pdf: 3077414 bytes, checksum: 3be370fa6634c67d0528f840a9d423fa (MD5)eng
dc.description.provenanceApproved for entry into archive by Sheila Dias ([email protected]) on 2022-09-22T14:43:54Z (GMT) No. of bitstreams: 1 HOLISSON_SOARES_DA_CUNHA_DIS.pdf: 3077414 bytes, checksum: 3be370fa6634c67d0528f840a9d423fa (MD5)eng
dc.description.provenanceMade available in DSpace on 2022-09-22T14:51:40Z (GMT). No. of bitstreams: 1 HOLISSON_SOARES_DA_CUNHA_DIS.pdf: 3077414 bytes, checksum: 3be370fa6634c67d0528f840a9d423fa (MD5) Previous issue date: 2016-04-30eng
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado do Rio Grande do Sul (FAPERGS)por
dc.formatapplication/pdf*
dc.thumbnail.urlhttps://tede2.pucrs.br/tede2/retrieve/185535/HOLISSON_SOARES_DA_CUNHA_DIS.pdf.jpg*
dc.languageporpor
dc.publisherPontifícia Universidade Católica do Rio Grande do Sulpor
dc.publisher.departmentEscola Politécnicapor
dc.publisher.countryBrasilpor
dc.publisher.initialsPUCRSpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopor
dc.rightsAcesso Abertopor
dc.subjectAnálise de Sentimentopor
dc.subjectMineração em Fluxo Contínuo de Dadospor
dc.subjectAprendizado de Máquinapor
dc.subjectEspaço Dinâmico de Atributospor
dc.subjectComitê de Classificadorespor
dc.subjectSentiment Analysiseng
dc.subjectData Stream Miningeng
dc.subjectMachine Learningeng
dc.subjectDynamic Feature Spaceeng
dc.subjectConcept Drifteng
dc.subjectFeature Drifteng
dc.subjectEnsemble Classifierseng
dc.subject.cnpqCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOpor
dc.titleSentimentstream : um comitê de classificadores adaptativo para análise de sentimento de tweetspor
dc.typeDissertaçãopor
dc.restricao.situacaoTrabalho não apresenta restrição para publicaçãopor
Appears in Collections:Programa de Pós-Graduação em Ciência da Computação

Files in This Item:
File Description SizeFormat 
HOLISSON_SOARES_DA_CUNHA_DIS.pdfHOLISSON_SOARES_DA_CUNHA_DIS3.01 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.