???item.export.label??? ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: http://tede2.uefs.br:8080/handle/tede/835
???metadata.dc.type???: Dissertação
Title: Predição de mortalidade em UTI: aplicação de técnicas de mineração de dados
???metadata.dc.creator???: Barreto, Jorge Souza Azevedo Moniz 
???metadata.dc.contributor.advisor1???: Loula, Angelo Conrado
???metadata.dc.description.resumo???: A utilização de escores padronizados para identificar a severidade de estado de pacientes internados em Unidade de Terapia Intensiva - UTI, tais como Acute Physiology, Age, Chronic Health Evaluation-APACHE III e Simplified Acute Physiology Score-SAPS provém informações utilizadas pela equipe médica para tomada de decisões. Estes escores de severidade passam por constantes revisões que buscam aprimorar sua capacidade de predição. Devido à utilizar metodologias lineares para predição, e os dados utilizados para obtenção dos escores possuem características não lineares, entendemos que possam ser utilizadas outras técnicas e metodologias para melhorar a predição desses escores. Este estudo busca propor a aplicação de métodos de mineração de dados, no pré-processamento da base de dados e na identificação da severidade do estado dos pacientes, utilizando Redes Neurais Artificiais - RNA, Random Forest - RF e Regressão Logística, tendo como atributos para análise os registros das variáveis fisiológicas já registradas pela equipe médica para cálculo dos escores mencionados. Os dados utilizados para esse fim, foram obtidos do Medical Information Mart for Intensive Care-MIMIC-III , um grande repositório disponível on-line para pesquisas e que contém registro de 56.530 pacientes. Além disso, foram analisadas técnicas de imputação de valores ausentes e balanceamento de classe, na busca por uma maior qualidade nos dados. Após aplicação da metodologia descrita no estudo, a Random Forest obteve desempenho melhor que os demais, com a AUC média de 0,780 (± 0,005), sensibilidade de 0,712 (± 0,012) e especificidade de 0,701 (± 0,005) em conjunto com a técnica de imputação de valores padrões em substituição de valores ausentes, e com o balanceamento de classe usando under sampling. Mediante seleção de atributos, foi construído modelo com redução de atributos com resultados próximos da classificação com todos atributos, o que pode simplificar a coleta de dados pela equipe médica para gerar um escore de severidade.
Abstract: The use of standardized scores to identify the severity of the condition of patients admitted to the Intensive Care Unit - ICU, such as Acute Physiology, Age, Chronic Health Evaluation APACHE III and Simplified Acute Physiology Score - provides information used by the medical team to make decisions, these severity scores go through constant revisions that seek to improve their predictive capacity, due to using linear methodologies for prediction and the data used to obtain the scores have non-linear characteristics, we understand that it can be used other techniques and methodologies to improve the prediction of these scores. This study aims to propose the application of data mining methods, in the preprocessing of the entire database and in the identification of the severity of the patient’s condition using Neural Networks RNA, Random Forest - RF and Logistic Regression, having as attributes to analyze the records of the physiological variables already registered by the medical team to calculate the mentioned scores. The data used for this purpose were obtained from the Medical Information Mart for Intensive Care (MIMIC-III), a large available on-line repository for searches containing a record of 56,530 patients. In addition, we analyzed techniques of imputation of missing values and class balancing, in the search for a higher quality in the data. After application of the methodology described in the study Random Forest obtained better performance than the others, with mean AUC of 0.780 (± 0.005), sensitivity of 0.712 (± 0.012) and specificity of 0.701 (± 0.005) in conjunction with the technique of imputation of standard values in substitution of missing values, and with class balancing using under sampling. By means of attribute selection, a model with attributes reduction was created with results close to the classification with all attributes, which can simplify the data collection by the medical team to generate a severity score.
Keywords: Aprendizado de máquina
Random Forest
Mineração de dados
UTI
Redes neurais
Desbalanceamento de classe
Substituição de dados ausentes
Machine learning
Random Forest
Data mining
ICU
Neural networks
Imbalanced data
Missing values
???metadata.dc.subject.cnpq???: CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
SAUDE COLETIVA::SAUDE PUBLICA
Language: por
???metadata.dc.publisher.country???: Brasil
Publisher: Universidade Estadual de Feira de Santana
???metadata.dc.publisher.initials???: UEFS
???metadata.dc.publisher.department???: DEPARTAMENTO DE CIÊNCIAS SOCIAIS APLICADAS
???metadata.dc.publisher.program???: Mestrado em Computação Aplicada
Citation: BARRETO, Jorge Souza Azevedo Moniz. Predição de mortalidade em UTI: aplicação de técnicas de mineração de dados. 2018. 87 f. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Feira de Santana, Feira de Santana, 2018.
???metadata.dc.rights???: Acesso Aberto
URI: http://tede2.uefs.br:8080/handle/tede/835
Issue Date: 31-Aug-2018
Appears in Collections:Coleção UEFS

Files in This Item:
File Description SizeFormat 
JorgeSouzaAzevedoMonizBarreto.pdfDissertacao-Jorge5.68 MBAdobe PDFDownload/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.