Export this record: EndNote BibTex

Please use this identifier to cite or link to this item: https://tede2.pucrs.br/tede2/handle/tede/11735
Document type: Tese
Title: Holistic patient representation learning and automatic annotation of electronic health records
Other Titles: Aprendizado de representações holísticas de pacientes e anotação automática de registros eletrônicos de saúde
Author: Consoli, Bernardo Scapini 
Advisor: Manssour, Isabel Harb
Abstract (native): Patient representation learning is the use of artificial intelligence technologies to reinterpret known patient data, extracted from Electronic Health Records, in a way that allows machine learning models to predict data and outcomes that could help medical professionals in diagnosis and the administration of proper care. It is important to note that medical data is tied to its place of origin. To deal with such a vital aspect to the development of national computational medicine solutions, we developed BRATECA, a collection of Brazilian tertiary care hospital data. This collection is open for credentialed access and was the largest collection of Brazilian medical data at the time of its release. Utilizing this collection in patient flow tasks, we achieved results of up to 0.88 F1 in patient Admission Prediction and up to 0.84 F1 for patient Extended Stay Prediction. We also developed an architecture for automatic annotation of social determinants of health in Electronic Health Records, which was validated on the US intensive care data collection MIMIC-III, where we achieved correlations of more than 0.8 measured in Cohen’s kappa for all annotation categories between our automatic annotation and human annotations.
Abstract (english): Aprendizado de representações de pacientes é o uso de inteligência artificial para reinterpretar dados conhecidos de pacientes, extraídos de Registros Eletrônicos de Saúde, para que modelos de aprendizado de máquinas consigam fazer previsões sobre pacientes que possam ajudar profissionais médicos no diagnóstico e na administração de cuidados adequados. É importante observar que dados médicos estão vinculados ao seu local de origem. Para lidar com este aspecto vital para o desenvolvimento das tecnologias nacionais de medicina computacional, desenvolvemos o BRATECA, uma coleção de dados de hospitais terciários brasileiros. Esta coleção for aberta para acesso credenciado e era o maior banco de dados hospitalares Brasileiros quando foi lançada. Utilizando ela em tarefas de fluxo de pacientes, atingimos resultados de até 0,88 de F1 para a tarefa de Predição de Admissão de pacientes e de até 0,84 de F1 para Predição de Estadia Longa de pacientes. Desenvolvemos também a arquitetura de anotação automática SDoH-GPT, a qual validamos nos banco de dados de UTI estadunidenses MIMIC-III e atingimos correlação medida em mais de 0,8 pontos no kappa de Cohen para todas categorias entre nossas anotações automáticas e anotações humanas.
Keywords: Patient Representation Learning
Electronic Health Records
BRATECA
Patient Flow
Automate Annotation
Deep Learning
Predictive Models
Length-of-Stay
Internet of Things
Medical Data
Patient Clinical History
Heterogeneous Data
Aprendizado de Representações de Pacientes
Registros Eletrônicos de Saúde
BRATECA
Fluxo de Pacientes
Anotação Automática
Aprendizado Profundo
Modelos Preditivos
Tempo de Estadia
Internet das Coisas
Dados Médicos
Histórico Clínico de Pacientes
Dados Heterogêneos
CNPQ Knowledge Areas: CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
Language: eng
Country: Brasil
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Institution Acronym: PUCRS
Department: Escola Politécnica
Program: Programa de Pós-Graduação em Ciência da Computação
Access type: Acesso Aberto
Fulltext access restriction: Trabalho não apresenta restrição para publicação
URI: https://tede2.pucrs.br/tede2/handle/tede/11735
Issue Date: 26-Mar-2025
Appears in Collections:Programa de Pós-Graduação em Ciência da Computação

Files in This Item:
File Description SizeFormat 
BERNARDO_SCAPINI_CONSOLI_TES.pdfBERNARDO_SCAPINI_CONSOLI_TES3.12 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.