Entendendo os exames complementares e seus resultados

PorBrian F. Mandell, MD, PhD, Cleveland Clinic Lerner College of Medicine at Case Western Reserve University

Reviewed ByMichael R. Wasserman, MD, California Association of Long Term Care Medicine (CALTCM)

Revisado/Corrigido: jul. 2024 | modificado nov. 2024

v1123930_pt

Visão Educação para o paciente

Definindo um resultado de exame positivo
Características do exame
Exames dicotômicos
Exames contínuos
Teorema de Bayes
Exames sequenciais
Exames de rastreamento
Limiar para exames

Os resultados de exames podem auxiliar a realização de um diagnóstico em pacientes sintomáticos (exames diagnósticos) ou identificar doenças ocultas em pacientes assintomáticos (rastreamento). Se os testes foram adequadamente ordenados de acordo com as manifestações clínicas, quaisquer resultados devem ajudar a confirmar ou excluir possíveis diagnósticos. Os resultados do teste podem interferir no processo de decisão clínica se o teste discrimina mal entre pacientes com e sem a(s) doença(s) suspeita(s) ou se o resultado do teste é inadequadamente integrado ao contexto clínico.

Os exames de laboratório são imperfeitos e podem identificar erroneamente alguns indivíduos que não apresentam uma doença específica como portadores da doença (falso-positivo) ou identificar erroneamente alguns indivíduos afetados como não portadores da doença (falso-negativo). A capacidade do exame de identificar corretamente pacientes com uma doença depende da probabilidade de o indivíduo ter a doença (probabilidade prévia) bem como das características operacionais intrínsecas do teste (1).

Embora os exames diagnósticos costumem ser um fator contribuinte crucial para a tomada de decisão clínica precisa, eles podem ter consequências indesejadas ou inesperadas. Os exames devem ser realizados com deliberação e finalidade e com a expectativa de que os resultados reduzam a ambiguidade em relação ao problema do paciente e contribuam para a saúde. Além do risco de fornecer informações incorretas (retardando assim o início do tratamento ou induzindo a tratamento desnecessário), os exames laboratoriais consomem recursos limitados e podem, eles mesmos, ter efeitos adversos (p. ex., pneumotórax causado por biópsia pulmonar) ou podem levar a testes adicionais desnecessários ou estresse para o paciente.

Os resultados de uma triagem ou teste diagnóstico devem ser interpretados na situação clínica específica e no contexto de testes de referência anteriores.

Referência

1. Armstrong KA, Metlay JP: Annals Clinical Decision Making: Using a Diagnostic Test. Ann Intern Med. 2020;172(9):604-609. doi:10.7326/M19-1940

Definindo um resultado de exame positivo

Entre os exames mais comuns estão aqueles que fornecem resultados dentro de uma escala quantitativa contínua (p. ex., glicemia, contagem de leucócitos). Estes exames podem fornecer informações clínicas úteis ao longo de seus limites, mas os médicos os utilizam para diagnosticar uma condição que requer um resultado positivo ou negativo (isto é, presença ou ausência de doença) com base em comparação em algum critério estabelecido ou ponto de corte. Estes pontos de corte geralmente são selecionados com base em análise estatística e conceitual que tenta equilibrar a taxa de resultados falso-positivos (levando a exames e tratamentos desnecessários, caros e possivelmente perigosos) e resultados falso-negativos (com falha em diagnosticar uma doença tratável). A identificação de um ponto de corte também depende da obtenção de um padrão ouro para identificação da doença em questão.

Tipicamente, estes resultados quantitativos de exames (p. ex., contagem de leucócitos em casos de suspeita de pneumonia bacteriana) seguem algum tipo de curva de distribuição (não necessariamente uma curva normal, apesar de comumente ser representada desta forma). A distribuição dos resultados de exames para pacientes com doenças está centrada em um ponto diferente do ponto dos pacientes sem a doença. Alguns pacientes com a doença têm resultados de exames muito elevados ou muito baixos, mas a maioria dos pacientes tem resultados centralizados em uma média. Inversamente, alguns pacientes sem doença apresentam resultados muito elevados ou muito baixos, mas a maioria a apresenta resultados centrados em uma média distinta da média dos pacientes com a doença. Para a maioria dos exames, as distribuições se sobrepõem tanto que vários do possíveis resultados de exames ocorrem em pacientes com e sem doença; esses resultados são mais claramente ilustrados quando as curvas são retratadas no mesmo gráfico (ver figura ). Alguns pacientes acima ou abaixo do ponto de corte selecionado serão caracterizados de forma incorreta. O ajuste de um ponto de corte para identificar mais pacientes com a doença (aumentar a sensibilidade do exame) também aumenta o número de falso-positivo (baixa especificidade) e mover o ponto de corte para evitar o diagnóstico falso de pacientes como portadores de doenças aumenta o número de falso-negativos. Cada ponto de corte está associado a uma probabilidade específica de resultados positivos verdadeiros e falso-positivos.

Distribuição dos resultados de exames

Pacientes com a doença estão na distribuição superior; pacientes sem a doença estão na distribuição inferior. Para pacientes com a doença, a região abaixo da distribuição dos resultados, que fica à direita (acima) do critério de corte, corresponde à taxa de exames positivos verdadeiros (isto é, sua sensibilidade); a região que fica à esquerda (ou abaixo) do critério corresponde à taxa de falso-negativo. Para pacientes sem a doença, a região à direita do critério de ponto de corte corresponde à taxa de falso-positivos e a região à esquerda corresponde aos testes negativos verdadeiros (isto é, sua especificidade). Para as 2 distribuições que se sobrepõem (p. ex., pacientes com e sem doença), a movimentação da linha do critério de corte afeta a sensibilidade e a especificidade, porém em direções opostas; mudar o critério de corte de 1 para 2 diminui o número de falso-negativos (aumenta a sensibilidade), mas também aumenta o número de falso-positivos (diminui a especificidade).

Curvas de características operacionais do receptor (ROC)

A representação gráfica dos resultados positivos verdadeiros (número de positivos verdadeiros/número com a doença) versus a fração de resultados falso-positivos (número de falso-positivos/número de sem doença), para uma série de pontos de corte, gera uma curva conhecida como curva ROC. A curva COR representa graficamente a solução de compromisso entre a sensibilidade e a especificidade ao ajustar o ponto de corte (ver figura ). Por convenção, os resultados positivos verdadeiros são colocados no eixo Y, e os resultados falso-positivos no eixo X. Quanto maior a área sob a curva da curva ROC, melhor o exame discrimina entre pacientes com e sem a doença.

As curvas ROC permitem que os exames sejam comparados em uma variedade de pontos de corte. Por exemplo, o exame A é melhor do que o exame B em todas as circunstâncias. As curvas ROC também ajudam a seleção do ponto de corte para maximizar a utilidade do exame. Se o exame for realizado para confirmar uma doença, é selecionado um ponto de corte com maior especificidade e menor sensibilidade. Se o exame for realizado para rastrear uma doença oculta, um ponto de corte com maior sensibilidade e menor especificidade é selecionado.

Curva de característica operacional do receptor (ROC) típica

Características do exame

Algumas variáveis clínicas têm apenas 2 resultados possíveis (p. ex., vivo/morto, grávida/não grávida); estas variáveis são denominadas categóricas ou dicotômicas. Outros resultados categóricos podem ter vários valores distintos (p. ex., tipo sanguíneo, escala de coma de Glasgow) e as variáveis são denominadas nominais ou ordinárias. Variáveis nominais, como os tipos sanguíneos, não têm ordem particular. Variáveis ordinais, como a escala de coma de Glasgow, têm valores distintos que são dispostos em uma ordem particular. Outras variáveis clínicas, incluindo vários exames diagnósticos típicos, são contínuas e apresentam uma infinidade de resultados possíveis (p. ex., contagem de leucócitos, glicemia). Vários médicos escolhem um ponto de corte que possa fazer com que uma variável contínua seja tratada como uma variável dicotômica (p. ex., pacientes com glicemia de jejum > 126 mg/dL [7,0 mmol/L] são considerados diabéticos). Outros exames diagnósticos contínuos têm utilidade diagnóstica quando apresentam múltiplos pontos de corte ou quando os limites dos resultados têm valores diagnósticos distintos.

Quando os resultados dos exames podem ser definidos como positivos ou negativos, todos os desfechos possíveis podem ser registrados em uma tabela simples de 2 × 2 (ver tabela ), a partir da qual características discriminatórias importantes de teste, como sensibilidade, especificidade, valor preditivo positivo e negativo e índice de probabilidade (IP), podem ser calculadas (ver tabela ).

Tabela

Distribuição de resultados de exames hipotéticos

Tabela

Distribuição de resultados de exames hipotéticos

Distribuição de resultados de exames hipotéticos
Resultados	Presença de doença	Ausência de doença
Exame positivo	Positivo verdadeiro	Falso-positivo
Exame negativo	Falso-negativo	Negativo verdadeiro
Total de pacientes	Todos os pacientes com a doença	Todos os pacientes sem a doença

Sensibilidade, especificidade e valores preditivos

Sensibilidade e especificidade são tipicamente considerados características do exame em si, independentemente da população de pacientes.

Sensibilidade é a probabilidade de que os pacientes com a doença tenham um resultado de teste positivo (taxa de verdadeiro-positivo).

Deste modo, um exame que é positivo em 8 de 10 pacientes com a doença tem sensibilidade de 0,8 (também expressa como 80%). A sensibilidade representa o quanto o teste detecta a doença; um teste com baixa sensibilidade não identifica muitos pacientes com a doença, e um teste com alta sensibilidade é útil para excluir um diagnóstico quando os resultados são negativos. A sensibilidade é o complemento da taxa de falso-negativo (isto é, taxa de falso-negativos + sensibilidade = 100%).

Especificidade é a probabilidade de que pacientes sem a doença apresentem um resultado negativo no teste (taxa de verdadeiro-negativo).

Assim, um teste que é negativo em 9 de 10 pacientes sem a doença tem uma especificidade de 0,9 (ou 90%). A especificidade mede quão bem o exame identifica corretamente pacientes com a doença, pois os testes com alta especificidade têm baixa taxa de falso-positivo. Um exame com baixa especificidade diagnostica vários pacientes sem a doença como portadores da doença. É o complemento da taxa de falso-positivo.

Valores preditivos descrevem o comportamento do teste em uma dada população de pacientes que não sabem se têm a doença. Para um dado teste, os valores preditivos variam de acordo com a prevalência da doença na população de pacientes testada.

O valor preditivo positivo (VPP) é a proporção de pacientes com resultado do exame positivo que realmente têm a doença.

Se 9 de 10 resultados positivos de exames estão corretos (verdadeiro positivo) o VPP é 90%. Como todos os resultados de exames positivos representam um número de positivos verdadeiros e de falso-positivos, o PPV descreve a probabilidade de um resultado de exame positivo em determinada população de pacientes representar um positivo verdadeiro.

O valor preditivo negativo (VPN) é a proporção de pacientes com resultado negativo no exame que realmente não têm a doença.

Sensibilidade, especificidade e valores preditivos

VPN = valor preditivo negativo; VPP = valor preditivo positivo.

Assim, se 8 dos 10 resultados negativos do exame estão corretos (verdadeiro negativo), o VPN é 80%. Como nem todos os resultados de exames negativos são negativos verdadeiros, alguns pacientes com resultados de exames negativos, na verdade, apresentam a doença. O NPV representa a possibilidade de um resultado de exame negativo em determinada população de pacientes representar um negativo verdadeiro.

Calculadora clínica

Razões de probabilidade (LR)

Diferentemente da sensibilidade e da especificidade, que não são aplicadas às probabilidades específicas do paciente, as IP permitem aos médicos interpretarem os resultados de exames em um paciente específico, desde que exista uma possibilidade de doença pré-teste conhecida (apesar de geralmente estimada).

A razão de probabilidade (RP) descreve a mudança na probabilidade pré-teste da doença quando o resultado do teste é conhecido e responde à pergunta

Quanto a probabilidade pós-teste mudou em relação à probabilidade pré-teste agora que o resultado do teste é conhecido?

Muitos testes clínicos são dicotômicos; eles estão acima do ponto de corte (positivo) ou abaixo do ponto de corte (negativo) e há apenas 2 resultados possíveis. Outros testes fornecem resultados contínuos ou ocorrem ao longo de um intervalo em que são selecionados múltiplos pontos de corte. A probabilidade real pós-teste depende da magnitude das IP (que depende de características operacionais do exame) e da estimativa pré-teste da doença. Quando o exame realizado é dicotômico e o resultado é positivo ou negativo, a sensibilidade e especificidade podem ser utilizadas para calcular IP positiva (IP+) ou negativa (IP-).

IP+: O índice de probabilidade de um teste positivo ocorrer em pacientes com a doença (positivo verdadeiro) em relação à probabilidade de um resultado de teste positivo em um paciente sem a doença (falso-positivo)
IP:-: A probabilidade de um resultado de exame negativo em paciente com doença (falso-negativo) em relação à probabilidade de um resultado negativo em pacientes sem a doença (negativos verdadeiros)

LSSmúltiplos pontos de corte, utiliza-se a curva ROC, e não a sensibilidade e a especificidade, para calcular uma IP que não é mais descrita como IP+ ou IP-.

Uma vez que a IP é uma relação de eventos mutuamente exclusivos e não uma proporção do total, ela representa chances (odds) mais que probabilidade. Para um determinado exame, a IP é diferente para resultados positivos e negativos.

Por exemplo, se um resultado de exame for positivo, uma IP de 2,0 indica que a chance é de 2:1 (positivo verdadeiro:falso-positivo) para um resultado de exame positivo representar um paciente com a doença. De 3 exames positivos, 2 ocorreriam em pacientes com a doença (positivo verdadeiro) e 1 ocorreria em uma paciente sem a doença (falso-positivo). Como os positivos verdadeiros e falso-positivos são componentes dos cálculos de sensibilidade e especificidade, a IP+ pode também ser calculada como sensibilidade/(1 − especificidade). Quanto maior a IP+, mais informações um teste positivo fornece; um resultado positivo de um teste com IP+ > 10 é considerado forte evidência em favor do diagnóstico. Em outras palavras, a estimativa de probabilidade pré-teste se move fortemente em direção a 100% quando um exame positivo tem IP+ elevada.

Para um resultado de exame negativo, uma IP- de 0,25 indica que a chance é 1:4 (falso-negativo:negativo verdadeiro) para que um resultado de exame negativo represente um paciente com a doença. De 5 resultados de exames negativos, 1 ocorreria em um paciente com doença (falso-negativo) e 4 ocorreriam em pacientes sem a doença (negativos verdadeiros). A IP- também pode ser calculada como (1 −sensibilidade)/especificidade. Quanto menor a IP-, mais informações um resultado de exame negativo fornece; um resultado negativo de exame com IP < 0,1 é considerado forte evidência contra o diagnóstico. Em outras palavras, a estimativa de probabilidade pré-teste se move fortemente em direção a 0% de probabilidade, quando o exame tem uma IP- baixa.

Resultados de teste com RP de 1,0 não contêm informações e não afetam a probabilidade pós-teste da doença.

LR são convenientes para testes de comparação e também são utilizadas em análises bayesianas para interpretar resultados de exames. Assim como a sensibilidade e a especificidade se modificam na medida em que o ponto de corte muda, o mesmo ocorre com LR. Como um exemplo hipotético, um ponto de corte alto para contagem de leucócitos (p. ex., 30.000/mcL) em um possível caso de apendicite aguda com perfuração é mais específico e teria IP+ mais elevada, mas também IP- elevada (e assim não muito informativa), escolher um ponto de corte muito mais baixo e muito sensível (p. ex., 12.000/mcL) teria uma IP- baixa, mas também uma IP+ mais baixa.

Calculadora clínica

Exames dicotômicos

Um exame dicotômico ideal não teria falso-negativos nem falso-positivos; todos os pacientes com resultados de exames positivos teriam a doença (PPV 100%) e todos os pacientes com resultados de exames negativos não teriam a doença (NPV 100%).

Na realidade, todos os exames têm falso-positivo e falso-negativo, alguns exames mais que outros. Para ilustrar as consequências da imperfeição da sensibilidade e da especificidade dos resultados de exames, considere resultados hipotéticos (ver tabela ) de um teste com fita reagente para esterase leucocitária em um grupo de 1000 mulheres, 300 (30%) das quais com uma infecção do trato urinário (conforme determinado por um exame "padrão ouro" como a cultura de urina). Este cenário assume com finalidade ilustrativa que o teste de fita tem sensibilidade de 71% e especificidade de 85%.

Sensibilidade de 71% significa que apenas 213 (71% de 300) mulheres com uma ITU teriam um resultado de teste positivo. As demais 87 teriam um resultado de exame negativo. A especificidade de 85% significa que 595 (85% de 700) mulheres sem uma ITU apresentariam um resultado de exame negativo. As demais 105 teriam resultado positivo. Assim, de 213 + 115 = 318 resultados de testes positivos, apenas 213 estariam corretos (213/318 = 67% PPV); um resultado de exame positivo torna o diagnóstico de infecção do trato urinário mais provável do que não, mas não certo. Também haveria 87 + 595 = 682 exames negativos dos quais 595 estão corretos (595/682 = 87% NPV), tornando o diagnóstico de uma ITU muito menos provável mais ainda possível; 13% das pacientes com resultado negativo na verdade apresentam uma ITU.

Tabela

Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com prevalência assumida de 30% de uma infecção do trato urinário

Tabela

Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com prevalência assumida de 30% de uma infecção do trato urinário

Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com prevalência assumida de 30% de uma infecção do trato urinário
Resultados	Presença de doença	Ausência de doença	Total de pacientes
Exame positivo	Positivos verdadeiros (PV) 213 pacientes (71% de 300)	Falso-positivos (FP) 105 pacientes (700 − 595)	318 pacientes com um teste positivo
Exame negativo	Falso-negativo (FN) 87 pacientes (300 − 213)	Negativos verdadeiros (TN) 595 pacientes (85% de 700)	682 pacientes com um teste negativo
Total de pacientes	300 pacientes com uma ITU (presumido)	700 pacientes sem uma ITU (presumido)	1.000 pacientes
Valor preditivo positivo (VPP) = PV/(todos os pacientes com exame positivo) = PV/(PV+FP) = 213/(213 + 105) = 67%. Valor preditivo negativo (NPV) = TN/(todos os pacientes com exame negativo) = TN/(TN + FN) = 595/(595 + 87) = 87%. Taxa de probabilidade positiva (IP+) = sensibilidade/(1 − especificidade) = 0,71/(1 − 0,85) = 4,73. Taxa de probabilidade negativa (IP-) = (1 − sensibilidade)/especificidade = (1 − 0,71)/0,85 = 0,34. ITU = infecção do trato urinário

Valor preditivo positivo (VPP) = PV/(todos os pacientes com exame positivo) = PV/(PV+FP) = 213/(213 + 105) = 67%.

Valor preditivo negativo (NPV) = TN/(todos os pacientes com exame negativo) = TN/(TN + FN) = 595/(595 + 87) = 87%.

Taxa de probabilidade positiva (IP+) = sensibilidade/(1 − especificidade) = 0,71/(1 − 0,85) = 4,73.

Taxa de probabilidade negativa (IP-) = (1 − sensibilidade)/especificidade = (1 − 0,71)/0,85 = 0,34.

ITU = infecção do trato urinário

Entretanto, o PPV e NPV derivados na coorte de pacientes não pode ser utilizado para interpretar resultados do mesmo exame quando a incidência subjacente da doença (probabilidade pré-teste ou probabilidade prévia) é diferente. Observe os efeitos da alteração da incidência da doença para 5% (ver tabela ). Agora, a maioria dos resultados positivos é falsa e a PPV é de apenas 20%; a paciente com resultado positivo na verdade tem maior probabilidade de não apresentar uma ITU. Entretanto, o NPV agora é muito elevado (98%) e um resultado negativo essencialmente exclui uma ITU.

Tabela

Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com prevalência presumida de 5% de uma infecção do trato urinário

Tabela

Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com prevalência presumida de 5% de uma infecção do trato urinário

Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com prevalência presumida de 5% de uma infecção do trato urinário
Resultados	Presença de doença	Ausência de doença	Total de pacientes
Exame positivo	Positivos verdadeiros (PV) 36 pacientes (71% de 50)	Falso-positivos (FP) 144 pacientes (950 −806)	180 pacientes com um teste positivo
Exame negativo	Falso-negativo (FN) 14 pacientes (50 −36)	Negativos verdadeiros (TN) 806 pacientes (85% de 950)	820 pacientes com um teste negativo
Total de pacientes	50 pacientes com uma ITU (presumido)	950 pacientes sem uma ITU (presumido)	1.000 pacientes
Valor preditivo positivo (VPP) = PV/(todos os pacientes com exame positivo) = PV/(PV + FP) = 36/(36 + 144) = 20%. Valor preditivo negativo (NPV) = TN/(todos os pacientes com exame negativo) = TN/(TN + FN) = 806/(806 + 14) = 98%. Taxa de probabilidade positiva (IP+) = sensibilidade/(1 − especificidade) = 0,71/(1 − 0,85) = 4,73. Taxa de probabilidade negativa (IP-) = (1 − sensibilidade)/especificidade = (1 − 0,71)/0,85 = 0,34. ITU = infecção do trato urinário

Valor preditivo positivo (VPP) = PV/(todos os pacientes com exame positivo) = PV/(PV + FP) = 36/(36 + 144) = 20%.

Valor preditivo negativo (NPV) = TN/(todos os pacientes com exame negativo) = TN/(TN + FN) = 806/(806 + 14) = 98%.

Taxa de probabilidade positiva (IP+) = sensibilidade/(1 − especificidade) = 0,71/(1 − 0,85) = 4,73.

Taxa de probabilidade negativa (IP-) = (1 − sensibilidade)/especificidade = (1 − 0,71)/0,85 = 0,34.

ITU = infecção do trato urinário

Observe que, em ambas as coortes de pacientes, mesmo quando PPV e NPV são diferentes, as LR não se alteram, pois elas são determinadas apenas pela sensibilidade e especificidade do exame.

Claramente, um resultado de exame não fornece um diagnóstico específico, mas estima apenas a probabilidade de a doença estar presente ou ausente, e esta probabilidade pós-teste (probabilidade da doença dado um resultado específico de exame) varia muito, com base na probabilidade pré-teste da doença, assim como na sensibilidade e especificidade do exame (e assim sua IP).

Calculadora clínica

Probabilidade pré-teste

Probabilidade pré-teste não é uma medida precisa; baseia-se no julgamento clínico de quão forte é a sugestão da presença de doença com base nos sinais e sintomas clínicos, quais fatores na história do paciente e nos fatores de risco favorecem o diagnóstico e o quão comum é a doença em uma população representativa. Vários sistemas clínicos de classificação foram estabelecidos para estimar a probabilidade pré-teste e o acréscimo de pontos para as diversas características clínicas facilita o cálculo da classificação. Esses exemplos ilustram a importância da estimativa da prevalência exata anterior ao exame porque a prevalência da doença na população considerada influencia drasticamente a utilidade do teste. Deve-se utilizar ferramentas validadas publicadas para estimar a prevalência quando disponíveis. Por exemplo, existem critérios para prever a probabilidade pré-teste de embolia pulmonar. Classificações calculados mais elevados levam a probabilidades estimadas maiores. Na prática, a determinação da probabilidade pré-teste é facilitada por informações objetivas, mas também pode ser influenciada pela habilidade e experiência do médico.

Exames contínuos

Vários resultados de exames são contínuos e podem fornecer informações clínicas úteis em uma ampla gama de resultados. Os médicos geralmente selecionam um ponto de corte para maximizar a utilidade do exame. Por exemplo, uma contagem de leucócitos > 15.000/mcL pode ser caracterizada como positiva e valores < 15.000/mcL como negativos. Quando um exame fornece resultados contínuos, mas é selecionado um certo ponto de corte, o exame passa a funcionar como um exame dicotômico. Também podem ser selecionados múltiplos pontos de corte. Pode-se calcular sensibilidade, especificidade, PPV, NPV, IP+ e IP- para um único ou para múltiplos pontos de corte. A tabela ilustra o efeito de mudar o ponto de corte da contagem de leucócitos em pacientes com suspeita de apendicite.

Tabela

Efeito da alteração no ponto de corte da contagem de leucócitos em pacientes com suspeita de apendicite

Tabela

Efeito da alteração no ponto de corte da contagem de leucócitos em pacientes com suspeita de apendicite

Efeito da alteração no ponto de corte da contagem de leucócitos em pacientes com suspeita de apendicite
Ponto de corte de contagem de leucócitos*	Sensibilidade	Especificidade	IP+	RP-
> 10,500	84%	53,13%	1,79	0,3
> 11,500	78%	62,5%	2,13	0,32
> 12,850	68%	75%	2,72	0,43
> 13,400	61,33%	78,12%	2,86	0,45
> 14,300	56,67%	81,25%	3,2	0,49
* Vários pontos de corte são selecionados para uma variável contínua como contagem de leucócitos; resultados acima do ponto de corte são considerados positivos e aqueles abaixo são considerados negativos. Os valores listados são por microlitro de sangue.
LR = índice de probabilidade; LEU = leucócitos.
Adapted from Keskek M, Tez M, Yoldas O, et al: Receiver operating characteristic analysis of leukocyte counts in operations for suspected appendicitis. American Journal of Emergency Medicine 26:769–772, 2008.

* Vários pontos de corte são selecionados para uma variável contínua como contagem de leucócitos; resultados acima do ponto de corte são considerados positivos e aqueles abaixo são considerados negativos. Os valores listados são por microlitro de sangue.

LR = índice de probabilidade; LEU = leucócitos.

Adapted from Keskek M, Tez M, Yoldas O, et al: Receiver operating characteristic analysis of leukocyte counts in operations for suspected appendicitis. American Journal of Emergency Medicine 26:769–772, 2008.

Alternativamente, pode ser útil agrupar os resultados de exames contínuos em níveis. Neste caso os resultados não são caracterizados como positivos ou negativos, pois há múltiplos resultados possíveis, assim, apesar da IP ser determinada para cada nível de resultado, não há mais IP+ ou IP-. Por exemplo, a tabela ilustra as relações entre a contagem de leucócitos e bacteremia em crianças febris. Como a IP consiste na probabilidade de um determinado resultado em pacientes com a doença dividida pela probabilidade deste resultado em pacientes sem a doença, a IP para cada grupo de contagem de leucócitos é a probabilidade da bacteremia neste grupo, dividida pela probabilidade de ausência de bacteremia.

Tabela

Uso de grupos de contagem de leucócitos para determinar a razão de probabilidade de bacteremia em crianças febris*

Tabela

Uso de grupos de contagem de leucócitos para determinar a razão de probabilidade de bacteremia em crianças febris*

Uso de grupos de contagem de leucócitos para determinar a razão de probabilidade de bacteremia em crianças febris*
Contagem de leucócitos	Número de crianças com bacteremia N = 127 (%)	Número de crianças com bacteremia N = 8.629 (%)	IP (% com bacteremia/% sem bacteremia)
0–5000	0 (0,0%)	543 (6,3%)	0,00
5.001–10.000	3 (2,4%)	3291 (38,1%)	0,06
10.001–15.000	15 (11,8%)	2767 (32,1%)	0,37
15.001–20.000	48 (37,8%)	1337 (15,5%)	2,4
20.001–25.000	34 (26,8%)	469 (5,4%)	4,9
25.001–30.000	12 (9,4%)	155 (1,8%)	5,3
> 30.001	15 (11,8%)	67 (0,8%)	15,2
* Incidência de bacteremia em 8.756 crianças febris agrupadas pela contagem de leucócitos (os valores listados são por microlitro de sangue). IP para cada grupo é calculada pela divisão de probabilidade de bacteremia, pela probabilidade da ausência de bacteremia.
LR = índice de probabilidade; LEU = leucócitos.
Adapted from Lee GM, Harper MB: Risk of bacteremia for febrile young children in the post-Haemophilus influenzae type b era. Archives of Pediatric and Adolescent Medicine 152:624–628, 1998.

* Incidência de bacteremia em 8.756 crianças febris agrupadas pela contagem de leucócitos (os valores listados são por microlitro de sangue). IP para cada grupo é calculada pela divisão de probabilidade de bacteremia, pela probabilidade da ausência de bacteremia.

LR = índice de probabilidade; LEU = leucócitos.

Adapted from Lee GM, Harper MB: Risk of bacteremia for febrile young children in the post-Haemophilus influenzae type b era. Archives of Pediatric and Adolescent Medicine 152:624–628, 1998.

O agrupamento de variáveis contínuas permite um uso maior dos resultados de exames do que quando um único ponto de corte é estabelecido. Com análises bayesianas, as RPs da tabela podem ser utilizadas para calcular a probabilidade pós-teste.

Para resultados contínuos de exames, se a curva COR for conhecida, os cálculos mostrados na não precisam ser feitos; as RPs podem ser encontradas em vários pontos ao longo de uma gama de resultados utilizando a inclinação da curva COR no ponto desejado.

Teorema de Bayes

O processo que utiliza a probabilidade pré-teste de doença e as características dos exames para cálculo da probabilidade pós-teste é denominado teorema de Bayes ou revisão bayesiana. Para utilização clínica de rotina, a metodologia bayesiana tipicamente assume várias formas:

Forma de cálculo de chance-probabilidade (cálculo ou nomograma)
Abordagem tabular

Cálculo de chance-probabilidade

Se a pro- babilidade de pré-teste de uma doença é expressa como suas chances (odds) e a IP de um exame representa chances, o produto das 2 representa as chances pós-teste da doença (análogo à multiplicação de 2 probabilidades juntas para cálculo da probabilidade simultânea da ocorrência de 2 eventos):

Chance pré-teste × IP = chance pós-teste

Como os médicos tipicamente raciocinam em termos de probabilidades e não de chances, a probabilidade pode ser convertida em chance (e vice-versa) com esta fórmula:

Chance (odds) = probabilidade/1 − probabilidade

Probabilidade = chance/chance + 1

Considere o exemplo da uma infecção do trato urinário na tabela , na qual a probabilidade pré-teste da uma infecção do trato urinário é de 0,3 e o exame utilizado tem uma IP+ de 4,73 e uma IP- de 0,34. Uma probabilidade pré-teste de 0,3 corresponde a uma chance de 0,3/(1 − 0,3) = 0,43. Assim, a chance pós-teste de uma ITU estar presente em um paciente com resultado de exame positivo é igual ao produto das chances pré-teste e IP+, 4,73 × 0,43 = 2,03, que representa uma probabilidade pós-teste de 2,03/(1 + 2,03) = 0,67. Deste modo, os cálculos bayesianos mostram que o resultado positivo do exame aumenta a probabilidade pré-teste de 30% para 67%, o mesmo valor obtido no cálculo do VPP na tabela.

Um cálculo semelhante é realizado para um exame negativo com chance pré-teste = 0,34 × 0,43 = 0,15, correspondendo à probabilidade de 0,15/(1 + 0,15) = 0,13. Assim, o resultado negativo de teste diminui a probabilidade pós-teste de 30% para 13%, novamente o mesmo valor obtido no cálculo do VPN na tabela.

Vários programas de cálculo médico estão disponíveis em aparelhos portáteis para calcular a probabilidade pós-teste a partir da LSS.

Calculadora clínica

Nomograma de probabilidade

Utilizar um nomograma é particularmente conveniente por evitar a conversão entre chances e probabilidades ou criação de tabelas 2 × 2.

Para utilizar o traçar uma linha da probabilidade pré-teste à IP. A probabilidade pós-teste é o ponto em que ocorre intersecção desta linha com a linha de probabilidade pós-teste. Linhas de exemplo na figura são traçadas utilizando os dados do exame de uma infecção do trato urinário na tabela . A linha A representa um resultado de exame positivo, ela é traçada de uma probabilidade pré-teste de 0,3 até IP+ de 4,73 e fornece um valor de pós-teste ligeiramente < 0,7, semelhante à probabilidade calculada de 0,67. A linha B representa um resultado de exame negativo, é traçada de uma probabilidade pré-teste de 0,3 até um valor IP- de 0,34 e fornece um valor pós-teste discretamente > 0,1, semelhante à probabilidade calculada de 13%.

Apesar do nomograma parecer menos preciso do que os cálculos, os valores típicos de probabilidade pré-teste geralmente são estimativos; assim, a precisão aparente dos cálculos é geralmente enganosa.

Nomograma de Fagan

Linhas ilustrativas na figura são traçadas utilizando os dados do exame de uma infecção do trato urinário na tabela Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com 30% de prevalência presumida de uma infecção do trato urinário. A linha A representa os resultados de exames positivos; é desenhada a partir de uma probabilidade pré-teste de 0,3 até IP+ de 4,73 com uma probabilidade pós-teste resultante discretamente < 0,7, semelhante à probabilidade calculada de 0,67. A linha B representa um resultado de exame negativo é traçada a partir de uma probabilidade pré-teste de 0,3 até IP- de 0,34 com um valor de probabilidade pós-teste ligeiramente > 0,1, semelhante à probabilidade calculada de 13%.

IP+= índice de probabilidade de um resultado positivo; IP- = índice de probabilidade de um resultado negativo.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Abordagem tabular

Em geral, o LR de um teste não é conhecido, mas a sensibilidade e especificidade são conhecidas e a probabilidade pré-teste pode ser estimada. Nesse caso, pode-se definir a metodologia bayesiana utilizando uma tabela 2 × 2 ilustrada na tabela o exemplo da tabela . Observe que este método mostra que um resultado de exame positivo aumenta a probabilidade de uma ITU para 67% e um resultado negativo diminui para 13%, os mesmos resultados obtidos por cálculo utilizando LR.

Tabela

Interpretação de resultado hipotético de um exame de esterase leucocitária em uma coorte de 1.000 mulheres supondo uma prevalência de 30% de uma ITU (probabilidade pré-teste), sensibilidade do exame 71% e especificidade 85%*

Tabela

Interpretação de resultado hipotético de um exame de esterase leucocitária em uma coorte de 1.000 mulheres supondo uma prevalência de 30% de uma ITU (probabilidade pré-teste), sensibilidade do exame 71% e especificidade 85%*

Interpretação de resultado hipotético de um exame de esterase leucocitária em uma coorte de 1.000 mulheres supondo uma prevalência de 30% de uma ITU (probabilidade pré-teste), sensibilidade do exame 71% e especificidade 85%*
Resultados	Infecção do trato urinário presente	Infecção do trato urinário ausente
Resultados	300 pacientes com uma ITU	700 pacientes sem uma ITU
Exame LE positivo	213 pacientes (PV)	105 pacientes (FP)
Exame LE negativo	87 pacientes (FN)	595 pacientes (NV)
*O teorema de Bayes pode ser simplificado para permitir o cálculo da probabilidade depois do exame quando a probabilidade anterior ao exame é conhecida: Probabilidade pós-teste quando o teste é positivo = PV/(todos os pacientes com exame positivo) = PV/(PV+FP) = 213/(213 + 105) = 67%. Probabilidade pós-teste quando o teste é negativo = TN/(todos os pacientes com exame negativo) = FN/(FN + TN) = 87/(87 + 595) = 13%.
FN = falso-negativo; FP = falso-positivo; VN = verdadeiro-negativo; VP = verdadeiro-positivo; ITU = infecção do trato urinário.

*O teorema de Bayes pode ser simplificado para permitir o cálculo da probabilidade depois do exame quando a probabilidade anterior ao exame é conhecida:

Probabilidade pós-teste quando o teste é positivo = PV/(todos os pacientes com exame positivo) = PV/(PV+FP) = 213/(213 + 105) = 67%.
Probabilidade pós-teste quando o teste é negativo = TN/(todos os pacientes com exame negativo) = FN/(FN + TN) = 87/(87 + 595) = 13%.

FN = falso-negativo; FP = falso-positivo; VN = verdadeiro-negativo; VP = verdadeiro-positivo; ITU = infecção do trato urinário.

Exames sequenciais

Os médicos geralmente realizam exames em sequência durante várias avaliações diagnósticas. Se a chance pré-teste antes do teste sequencial é conhecida e o IP de cada teste em sequência é conhecido, as chances pós-teste podem ser calculadas utilizando a seguinte fórmula:

Chance pré-teste × LR1 × LR2 × LR3 = chance pós-teste

Este método é limitado pela importante presunção de que cada exame é condicionalmente independente do outro.

Exames de rastreamento

Os pacientes frequentemente consideram se devem ou não realizar um rastreamento para doenças ocultas. As premissas dos programas de rastreamento bem-sucedidos são que a detecção precoce melhora os desfechos clinicamente significativos em pacientes com doença oculta e que os resultados falso-positivos que podem ocorrer no rastreamento não representem um ônus (p. ex., custos e efeitos adversos de exames confirmatórios, ansiedade provocada pelos testes, tratamentos injustificáveis) que excede esse benefício. Para minimizar esta possível carga, os médicos devem escolher o teste de rastreamento adequado. O rastreamento pode não ser apropriado quando tratamentos ou medidas preventivas são ineficazes, a menos que o diagnóstico possa impactar decisões futuras de vida para o paciente ou sua família. Se a doença for muito incomum, a menos que uma subpopulação possa ser identificada e a prevalência seja maior, o rastreamento pode não ser eficaz em termos de custo; há exceções, como em várias doenças genéticas que podem ser diagnosticadas e tratadas no neonato.

Teoricamente, o melhor exame, tanto para rastreamento como para diagnóstico, é aquele com sensibilidade e especificidade mais elevadas. Entretanto, estes exames altamente precisos geralmente são complexos, caros e invasivos (p. ex., angiografia coronariana); sendo assim, não são práticos para rastreamento de grandes números de indivíduos assintomáticos. Caracteristicamente deve ser feita alguma opção em sensibilidade, especificidade ou ambas ao selecionar um exame de rastreamento.

Um médico escolhe um exame que otimize a sensibilidade ou especificidade, dependendo das consequências de um resultado de exame falso-positivo ou falso-negativo, assim como da probabilidade de doença pré-teste. Um exame de rastreamento ideal é aquele que é sempre positivo em quase todos os pacientes com a doença, de forma que o resultado negativo exclua com confiança a doença em indivíduos saudáveis. Por exemplo, em um exame para doenças graves para as quais há tratamento eficaz disponível (p. ex., doença coronariana), os médicos poderiam tolerar mais resultados falso-positivos do que falso-negativos (menor especificidade e maior sensibilidade). Apesar de alta sensibilidade ser um atributo muito importante para exames de rastreamento, a especificidade também é importante em certas estratégias de rastreamento. Entre populações com prevalências mais elevadas de doenças, o PPV de um exame de rastreamento aumenta; na medida em que a prevalência diminui, a probabilidade pós-teste ou probabilidade posterior de um resultado positivo diminui. Consequentemente, quando rastreamos uma doença em populações de alto risco, os exames com maior sensibilidade são preferíveis em relação àqueles com maior especificidade, pois são melhores para excluir a doença (menos falso-negativos). Por outro lado, em populações de baixo risco ou para doenças incomuns, nas quais o tratamento tem menor benefício e maior risco, são preferíveis exames com maior especificidade.

Múltiplos exames de triagem

Com a expansão do arsenal de exames de rastreamento disponíveis, os médicos devem considerar as implicações de um painel destes exames. Por exemplo, painéis de 8, 12 ou algumas vezes 20 exames de sangue frequentemente são realizados quando um paciente é admitido no hospital ou quando é examinado pela primeira vez por um novo médico. Apesar deste tipo de teste talvez seja útil para rastrear pacientes com certas doenças, a utilização de um grande painel de exames tem consequências potencialmente negativas. Por definição, um exame com especificidade de 95% resulta em 5% de falso-positivo em pacientes saudáveis normais. Se 2 exames diferentes com estas características são realizados, cada um para uma doença oculta diferente, um paciente que na verdade não apresenta nenhuma doença tem chance de ambos os resultados serem negativos de 95% × 95% ou cerca de 90%; sendo assim, há uma chance de 10% de pelo menos um dos exames ter resultado falso-positivo. Para 3 exames deste tipo, a chance de todos os 3 serem negativos é 95% × 95% ×95% ou 86%, correspondendo a 14% de chance de pelo menos um resultado falso-positivo. Se forem realizados 12 exames diferentes para 12 doenças diferentes, a chance de obter pelo menos um resultado falso-positivo é de 46%. Esta alta probabilidade ressalta a necessidade de cautela ao decidir pela realização de um painel de exames e ao interpretar seus resultados.

O mesmo princípio se aplica ao solicitar vários testes sensíveis, mas inespecíficos (p. ex., "sorologias autoimunes", incluindo anticorpos antinucleares, ribonucleoproteína antinuclear [anti-RNP], fator reumatoide) na avaliação de pacientes com sintomas não localizados e não específicos de longa duração, como fadiga e dor generalizada na ausência de achados ao exame físico ou características históricas sugerindo um diagnóstico reumatológico mais específico.

Limiar para exames

O exame de laboratório deve ser realizado apenas se o seu resultado afetar o tratamento; caso contrário, a despesa e o risco para o paciente são inúteis. Os médicos podem, algumas vezes, fazer determinação de quando realizar o exame por meio de comparação de estimativa de probabilidade pré-teste e pós-teste com certos limiares. Acima de determinado limiar de probabilidade, os benefícios do tratamento superam os riscos (incluindo o risco de tratar erroneamente um indivíduo sem a doença) e o tratamento é indicado. Esse ponto é chamado limiar terapêutico, sendo determinado como descrito nas Estratégias de tomada de decisão clínica: estimativas de probabilidade e o limiar terapêutico. Por definição, o exame é desnecessário quando a probabilidade pré-teste é superior ao limiar terapêutico. Mas indica-se o exame se a probabilidade pré-teste for inferior ao limiar terapêutico, desde que o resultado positivo do exame aumente a probabilidade pós-teste acima do limiar terapêutico. A menor probabilidade pré-teste em que isto ocorre depende das características do exame (p. ex., IP+) e é denominada limiar para teste.

Conceitualmente, se o melhor exame para uma doença grave tem baixa IP+ e alto limiar terapêutico, é compreensível que o resultado positivo do exame possa não mover a probabilidade pós-teste acima do limiar de tratamento de um paciente com probabilidade pré-teste baixa, porém preocupante (p. ex., talvez de 10% ou 20%).

Como ilustração numérica, considere o caso descrito anteriormente de um possível infarto do miocárdio no qual o equilíbrio entre risco e benefício determinou um limiar terapêutico de 25%. Quando a probabilidade de IM excede 25%, administra-se terapia trombolítica. Quando deve ser realizado um ecocardiograma de urgência antes de se administrar tratamento trombolítico? Considerando uma sensibilidade hipotética de 60% e especificidade de 70% para ecocardiografia no diagnóstico do IM, estas porcentagens corresponderiam a IP+ de 60/(100 − 70) = 2 e IP- de (100 −60)/70 = 0,57.

Essa questão pode ser abordada matematicamente (chance pré-teste × IP = chance pós-teste) ou graficamente de forma mais intuitiva com o . No nomograma, uma linha conectando o limiar terapêutico (25%) da probabilidade pós-teste pela linha IP+ (2,0) no meio da linha IP faz interseção com uma probabilidade pré-teste de cerca de 0,14. Claramente, um resultado positivo de um exame de um paciente com possibilidade pré-teste < 14% ainda resulta em uma probabilidade pós-teste inferior ao limiar terapêutico. Nesse caso, o ecocardiograma seria inútil porque mesmo um resultado positivo não levaria à decisão de tratar; portanto, 14% de probabilidade pré-teste é o limiar do teste para esse exame em particular (ver figura ). Outro exame com IP+ diferente levará a um limiar de teste diferente.

Nomograma de Fagan utilizado para determinar a necessidade de um exame

Neste exemplo assume-se um limiar de tratamento de 25% para o tratamento do paciente com infarto agudo do miocárdio. Quando a probabilidade de IM excede 25%, administra-se terapia trombolítica. Os médicos podem utilizar nomograma de Fagan para determinar quando deve ser realizado um ecocardiograma rápido antes da administração do tratamento trombolítico. Assumindo que a sensibilidade hipotética do ecocardiograma seja de 60% e especificidade de 70% para novo IAM, estas porcentagens corresponderiam a uma índice de probabilidade (IP) de resultado positivo de exame (IP+) de 60/(100 − 70) = 2. Uma linha conectando um limiar de tratamento pós-teste de 25% na linha de probabilidade pós-teste à IP+ (2,0) no meio da linha IP faz interseção com a linha da probabilidade pré-teste perto de 0,14. O resultado positivo do exame de um paciente com probabilidade pré-teste < 14% ainda leva a uma probabilidade pós-teste inferior ao limiar terapêutico.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Nomograma de Fagan utilizado para determinar a necessidade de um exame

Representação dos limiares para exame e tratamento

A linha horizontal representa probabilidade pós-teste.

Como 14% ainda representa um risco significativo de IM, fica claro que a probabilidade de uma doença abaixo do limiar de teste (ou, p. ex., uma probabilidade pré-teste de 10%) não significa necessariamente que a doença foi excluída; apenas que um resultado positivo do exame particular em questão não modificaria a abordagem e, assim, este exame não seria indicado. Nesta situação, o médico observaria no paciente mais dados que poderiam elevar a probabilidade de pré-teste acima do limiar de teste. Na prática, como geralmente há múltiplos exames disponíveis para uma determinada doença, poderiam ser utilizados testes sequenciais.

Este exemplo considera que o exame em si não traz riscos ao paciente. Se o exame tiver risco grave (p. ex., cateterismo cardíaco), o limiar de teste deve ser mais elevado e os cálculos quantitativos podem ser realizados, porém são complexos. Assim, a redução da sensibilidade e especificidade de um exame, ou o aumento de seu risco, reduz a gama de probabilidades de doença em que o exame é a melhor estratégia. Aprimorar a capacidade de discriminação do teste ou reduzir seu risco restringe a amplitude de probabilidades em que o teste constitui a melhor estratégia.

Uma exceção possível à exclusão do exame quanto à probabilidade pré-teste está abaixo do limiar de teste (mais ainda é preocupante) poderia ser se um resultado negativo do exame pudesse reduzir a probabilidade pós-teste abaixo do ponto em que a doença pode ser considerada excluída. Esta determinação requer um julgamento subjetivo do grau de certeza necessário para excluir uma doença e devido ao envolvimento de probabilidades baixas, atenção particular aos riscos do exame.

Test your KnowledgeTake a Quiz!