Export this record: EndNote BibTex

Please use this identifier to cite or link to this item: https://tede2.pucrs.br/tede2/handle/tede/11131
Full metadata record
DC FieldValueLanguage
dc.creatorSantos Júnior, Juarez Monteiro dos-
dc.creator.Latteshttp://lattes.cnpq.br/6307746290114554por
dc.contributor.advisor1Barros, Rodrigo Coelho-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8172124241767828por
dc.date.accessioned2024-04-05T22:06:21Z-
dc.date.issued2023-08-30-
dc.identifier.urihttps://tede2.pucrs.br/tede2/handle/tede/11131-
dc.description.resumoImitation from Observation, a computational technique that instructs agents by observing expert demonstrations, suffers from considerable hurdles such as sub-optimal performance, local minima issues, and ineffective state-space exploration. Although recent strategies leverage unlabeled data to decode information self-supervisedly, persistent challenges remain. This thesis presents four novel methods for imitation learning from observation in response to those challenges. Furthermore, a comprehensive study on the resilience of imitation learning methods is provided to enable a nuanced comprehension of their robustness and performance across various scenarios. The achieved positive outcomes substantiate the merits of the proposed methods. A sampling mechanism is shown to enhance iterative learning cycles, rendering them more balanced. Integrating an exploration mechanism shows potential to surpass expert performance, establishing state-of-the-art results in the field. Moreover, the employment of reinforcement and adversarial learning mechanisms demonstrate their ability to forge more efficient policies, accomplishing good results with fewer samples. The proposed strategies boost performance and efficiency while minimizing the complexity of acquiring expert datapor
dc.description.abstractA Imitação por Observação, técnica computacional destinada ao ensino de agentes por meio da observação de demonstrações de especialistas, enfrenta desafios significativos como baixo desempenho, problemas com mínimos locais e exploração ineficaz do espaço de estados. Apesar das recentes abordagens empregarem dados não rotulados para decodificar informações de maneira auto-supervisionada, persistem os desafios a serem superados. Em resposta a tais desafios, a presente tese introduz quatro novos métodos destinados à imitação por observação. Ainda, apresenta um estudo aprofundado sobre a resiliência dos métodos de aprendizado por imitação, proporcionando uma melhor compreensão de seu desempenho e robustez em diversos contextos. As contribuições dos métodos propostos são evidenciadas pelos resultados positivos alcançados. Foi verificado que o uso de um mecanismo de amostragem pode aperfeiçoar os ciclos iterativos de aprendizado, tornandoos mais equilibrados. A inclusão de um mecanismo de exploração revelou potencial para exceder o desempenho de especialistas e estabelecer novos patamares na área. Além disso, o emprego de mecanismos de aprendizado por reforço e de aprendizado adversário mostrou-se capaz de gerar políticas mais eficientes, obtendo resultados significativos com menos amostras. As estratégias propostas melhoraram o desempenho e a eficiência dos atuais métodos, ao mesmo tempo que minimizam a complexidade da aquisição de dados de especialistaspor
dc.description.provenanceSubmitted by PPG Ciência da Computação ([email protected]) on 2024-04-04T19:43:11Z No. of bitstreams: 1 JUAREZ MONTEIRO DOS SANTOS JÚNIOR_TES.pdf: 2827525 bytes, checksum: 6a00a9f289ee5bb16383f1582087e784 (MD5)eng
dc.description.provenanceRejected by Sarajane Pan ([email protected]), reason: Devolvido, devido a falta da capa institucional on 2024-04-05T14:00:10Z (GMT)eng
dc.description.provenanceSubmitted by PPG Ciência da Computação ([email protected]) on 2024-04-05T15:01:28Z No. of bitstreams: 1 juarez_tese final.pdf: 2997770 bytes, checksum: 96818ffdf6ae9811cb9b4bea6c76cb5d (MD5)eng
dc.description.provenanceApproved for entry into archive by Sarajane Pan ([email protected]) on 2024-04-05T21:56:29Z (GMT) No. of bitstreams: 1 juarez_tese final.pdf: 2997770 bytes, checksum: 96818ffdf6ae9811cb9b4bea6c76cb5d (MD5)eng
dc.description.provenanceMade available in DSpace on 2024-04-05T22:06:21Z (GMT). No. of bitstreams: 1 juarez_tese final.pdf: 2997770 bytes, checksum: 96818ffdf6ae9811cb9b4bea6c76cb5d (MD5) Previous issue date: 2023-08-30eng
dc.formatapplication/pdf*
dc.thumbnail.urlhttps://tede2.pucrs.br/tede2/retrieve/190092/juarez_tese%20final.pdf.jpg*
dc.languageporpor
dc.publisherPontifícia Universidade Católica do Rio Grande do Sulpor
dc.publisher.departmentEscola Politécnicapor
dc.publisher.countryBrasilpor
dc.publisher.initialsPUCRSpor
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopor
dc.rightsAcesso Abertopor
dc.subjectImitation Learningeng
dc.subjectBehavioral Cloningeng
dc.subjectSelf-Supervised learningeng
dc.subjectAprendizado por Imitaçãopor
dc.subjectAprendizado por Observaçãopor
dc.subjectAprendizado Profundopor
dc.subject.cnpqCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOpor
dc.titleAdvances in imitation learning from observationpor
dc.title.alternativeAvanços em aprendizado de imitação por observaçãopor
dc.typeTesepor
dc.restricao.situacaoTrabalho não apresenta restrição para publicaçãopor
Appears in Collections:Programa de Pós-Graduação em Ciência da Computação

Files in This Item:
File Description SizeFormat 
juarez_tese final.pdfJUAREZ_MONTEIRO_DOS_SANTOS_JÚNIOR_TES2.93 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.