@MASTERSTHESIS{ 2011:973434021, title = {Agrupamento e categoriza??o de documentos jur?dicos}, year = {2011}, url = "http://tede2.pucrs.br/tede2/handle/tede/5181", abstract = "Este trabalho estuda a aplica??o de t?cnicas de aprendizado de m?quina (agrupamento e classifica??o) ? pesquisa de jurisprud?ncia, no ?mbito do processo judicial eletr?nico. Discute e implementa alternativas para o agrupamento dos documentos da jurisprud?ncia, gerando automaticamente classes que servem ao posterior processo de categoriza??o dos documentos anexados ao processo jur?dico. O algoritmo TClus de Aggarwal, Gates e Yu ? selecionado para desenvolvimento de exemplo de uso, com propostas de altera??o no descarte de documentos e grupos, e passando a incluir a divis?o de grupos. A proposta ainda introduz um paradigma "bag of terms and law references"em lugar do "bag of words", quando utiliza, na gera??o dos atributos, os tesauros do Senado Federal e da Justi?a Federal para detectar termos jur?dicos nos documentos e express?es regulares para detectar refer?ncias legislativas. No exemplo de uso, empregam-se documentos oriundos da jurisprud?ncia do Tribunal Regional Federal da 4a Regi?o. Os resultados dos agrupamentos foram avaliados pelas medidas Relative Hardness e p- e submetidos aos testes de signific?ncia de Wilcoxon e contagem de vit?rias e derrotas. Os resultados da categoriza??o foram avaliados por avaliadores humanos. A discuss?o e an?lise desses resultados abrangeu a compara??o do sucesso e falha na classifica??o em rela??o ? similaridade do documento com o centr?ide no momento da categoriza??o, ? quantidade de documentos nos grupos, ? quantidade e tipo de atributos nos centr?ides e ? coes?o dos grupos. Discute-se, ainda, a gera??o dos atributos e suas implica??es nos resultados da classifica??o. Contribui??es deste estudo: confirma??o da possibilidade de uso do aprendizado de m?quina na pesquisa jurisprudencial, evolu??o do algoritmo TClus ao eliminar os descartes de documentos e grupos e ao implementar a divis?o de grupos, proposta de novo paradigma bag of terms and law references, atrav?s de prototipa??o do processo proposto com exemplo de uso e avalia??es autom?ticas na fase de clustering, e por especialista humano na fase de categoriza??o.", publisher = {Pontif?cia Universidade Cat?lica do Rio Grande do Sul}, scholl = {Programa de P?s-Gradua??o em Ci?ncia da Computa??o}, note = {Faculdade de Inform?ca} }