Objetivos: A revisão de prontuários é o método mais usado para quantificar a segurança do paciente. Fizemos uma revisão sistemática da confiabilidade e validade da detecção de eventos adversos por meio da revisão de prontuários.
Desenho: Revisão sistemática da literatura.
Métodos: Pesquisamos as bases de dados PubMed, EMBASE, CINAHL, PsycINFO e Cochrane Library desde seu início até fevereiro de 2015. Incluímos todos os estudos cujos objetivos fossem descrever a confiabilidade e/ou validade da revisão de prontuários. Dois revisores fizeram a extração de dados. Agrupamos os valores κ e analisamos as diferenças nos subgrupos de acordo com o número de revisores, sua experiência e nível de treinamento, ajustados pela prevalência de eventos adversos.
Resultados: Em 25 estudos foram relatados dados psicométricos da Ferramenta de Rastreamento Global (Global Trigger Tool, GTT) e do Harvard Medical Practice Study (HMPS), e 24 estudos foram incluídos para o agrupamento estatístico. A confiabilidade interavaliadores da GTT e do HMPS apresentou um κ combinado de 0,65 e 0,55, respectivamente. A confiabilidade interavaliadores foi significativamente maior quando o grupo de revisão de um estudo foi formado por no máximo cinco revisores. Não encontramos estudos que relatassem a validade da GTT e do HMPS.
Conclusões: A confiabilidade da revisão de prontuários é moderada a substancial e melhorou quando um pequeno grupo de revisores realizou a revisão. A validade do método de revisão de prontuários nunca foi avaliada; os registros de dados clínicos, autópsias ou observações diretas do cuidado prestado aos pacientes são possíveis métodos de referência que podem ser usados para testar a validade concorrente.
Objectives: Record review is the most used method to quantify patient safety. We systematically reviewed the reliability and validity of adverse event detection with record review.
Design: A systematic review of the literature.
Methods: We searched PubMed, EMBASE, CINAHL, PsycINFO and the Cochrane Library and from their inception through February 2015. We included all studies that aimed to describe the reliability and/or validity of record review. Two reviewers conducted data extraction. We pooled κ values (κ) and analysed the differences in subgroups according to number of reviewers, reviewer experience and training level, adjusted for the prevalence of adverse events.
Results: In 25 studies, the psychometric data of the Global Trigger Tool (GTT) and the Harvard Medical Practice Study (HMPS) were reported and 24 studies were included for statistical pooling. The inter-rater reliability of the GTT and HMPS showed a pooled κ of 0.65 and 0.55, respectively. The inter-rater agreement was statistically significantly higher when the group of reviewers within a study consisted of a maximum five reviewers. We found no studies reporting on the validity of the GTT and HMPS.
Conclusions: The reliability of record review is moderate to substantial and improved when a small group of reviewers carried out record review. The validity of the record review method has never been evaluated, while clinical data registries, autopsy or direct observations of patient care are potential reference methods that can be used to test concurrent validity.