Entendendo os exames complementares e seus resultados

PorBrian F. Mandell, MD, PhD, Cleveland Clinic Lerner College of Medicine at Case Western Reserve University
Revisado/Corrigido: mai 2021
Visão Educação para o paciente

Os resultados de exames podem auxiliar a realização de um diagnóstico em pacientes sintomáticos (exames diagnósticos) ou identificar doenças ocultas em pacientes assintomáticos (rastreamento). Se os testes foram adequadamente ordenados de acordo com as manifestações clínicas, quaisquer resultados devem ajudar a confirmar ou excluir possíveis diagnósticos. Os resultados do teste podem interferir no processo de decisão clínica se o teste discrimina mal entre pacientes com e sem a(s) doença(s) suspeita(s) ou se o resultado do teste é inadequadamente integrado ao contexto clínico.

Os exames de laboratório são imperfeitos e podem identificar erroneamente alguns indivíduos que não apresentam uma doença específica como portadores da doença (falso-positivo) ou identificar erroneamente alguns indivíduos afetados como não portadores da doença (falso-negativo). A capacidade do exame de identificar corretamente pacientes com uma doença depende da probabilidade de o indivíduo ter a doença (probabilidade prévia) bem como das características operacionais intrínsecas do teste.

Embora os exames diagnósticos costumem ser um fator contribuinte crucial para a tomada de decisão clínica precisa, eles podem ter consequências indesejadas ou inesperadas. Os exames devem ser realizados com deliberação e finalidade e com a expectativa de que os resultados reduzam a ambiguidade em relação ao problema do paciente e contribuam para a saúde. Além do risco de fornecer informações enganadoras (retardando o início do tratamento ou induzindo a tratamento desnecessário), os exames de laboratório consomem recursos limitados e podem expor o paciente a riscos de efeitos adversos do próprio exame.

Definindo um resultado de exame positivo

Entre os exames mais comuns estão aqueles que fornecem resultados dentro de uma escala quantitativa contínua (p. ex., glicemia, contagem de leucócitos). Estes exames podem fornecer informações clínicas úteis ao longo de seus limites, mas os médicos os utilizam para diagnosticar uma condição que requer um resultado positivo ou negativo (isto é, presença ou ausência de doença) com base em comparação em algum critério estabelecido ou ponto de corte. Estes pontos de corte geralmente são selecionados com base em análise estatística e conceitual que tenta equilibrar a taxa de resultados falso-positivos (levando a exames e tratamentos desnecessários, caros e possivelmente perigosos) e resultados falso-negativos (com falha em diagnosticar uma doença tratável). A identificação de um ponto de corte também depende da obtenção de um padrão ouro para identificação da doença em questão.

Tipicamente, estes resultados quantitativos de exames (p. ex., contagem de leucócitos em casos de suspeita de pneumonia bacteriana) seguem algum tipo de curva de distribuição (não necessariamente uma curva normal, apesar de comumente ser representada desta forma). A distribuição dos resultados de exames para pacientes com doenças está centrada em um ponto diferente do ponto dos pacientes sem a doença. Alguns pacientes com a doença têm resultados de exames muito elevados ou muito baixos, mas a maioria dos pacientes tem resultados centralizados em uma média. Inversamente, alguns pacientes sem doença apresentam resultados muito elevados ou muito baixos, mas a maioria a apresenta resultados centrados em uma média distinta da média dos pacientes com a doença. Para a maioria dos exames, as distribuições se sobrepõem tanto que vários do possíveis resultados de exames ocorrem em pacientes com e sem doença; esses resultados são mais claramente ilustrados quando as curvas são retratadas no mesmo gráfico (ver figura Distribuição dos resultados de exames). Alguns pacientes acima ou abaixo do ponto de corte selecionado serão caracterizados de forma incorreta. O ajuste de um ponto de corte para identificar mais pacientes com a doença (aumentar a sensibilidade do exame) também aumenta o número de falso-positivo (baixa especificidade) e mover o ponto de corte para evitar o diagnóstico falso de pacientes como portadores de doenças aumenta o número de falso-negativos. Cada ponto de corte está associado a uma probabilidade específica de resultados positivos verdadeiros e falso-positivos.

Distribuição dos resultados de exames

Pacientes com a doença estão na distribuição superior; pacientes sem a doença estão na distribuição inferior. Para pacientes com a doença, a região abaixo da distribuição dos resultados, que fica à direita (acima) do critério de corte, corresponde à taxa de exames positivos verdadeiros (isto é, sua sensibilidade); a região que fica à esquerda (ou abaixo) do critério corresponde à taxa de falso-negativo. Para pacientes sem a doença, a região à direita do critério de ponto de corte corresponde à taxa de falso-positivos e a região à esquerda corresponde aos testes negativos verdadeiros (isto é, sua especificidade). Para as 2 distribuições que se sobrepõem (p. ex., pacientes com e sem doença), a movimentação da linha do critério de corte afeta a sensibilidade e a especificidade, porém em direções opostas; mudar o critério de corte de 1 para 2 diminui o número de falso-negativos (aumenta a sensibilidade), mas também aumenta o número de falso-positivos (diminui a especificidade).

Curvas de características operacionais do receptor (ROC)

A representação gráfica dos resultados positivos verdadeiros (número de positivos verdadeiros/número com a doença) versus a fração de resultados falso-positivos (número de falso-positivos/número de sem doença), para uma série de pontos de corte, gera uma curva conhecida como curva ROC. A curva COR representa graficamente a solução de compromisso entre a sensibilidade e a especificidade ao ajustar o ponto de corte (ver figura Curva de característica de operação do receptor (COR) típica). Por convenção, os resultados positivos verdadeiros são colocados no eixo Y, e os resultados falso-positivos no eixo X. Quanto maior a área sob a curva da curva ROC, melhor o exame discrimina entre pacientes com e sem a doença.

As curvas ROC permitem que os exames sejam comparados em uma variedade de pontos de corte. Por exemplo, o exame A é melhor do que o exame B em todas as circunstâncias. As curvas ROC também ajudam a seleção do ponto de corte para maximizar a utilidade do exame. Se o exame for realizado para confirmar uma doença, é selecionado um ponto de corte com maior especificidade e menor sensibilidade. Se o exame for realizado para rastrear uma doença oculta, um ponto de corte com maior sensibilidade e menor especificidade é selecionado.

Curva de característica operacional do receptor (ROC) típica

Características do exame

Algumas variáveis clínicas têm apenas 2 resultados possíveis (p. ex., vivo/morto, grávida/não grávida); estas variáveis são denominadas categóricas ou dicotômicas. Outros resultados categóricos podem ter vários valores distintos (p. ex., tipo sanguíneo, escala de coma de Glasgow) e as variáveis são denominadas nominais ou ordinárias. Variáveis nominais, como os tipos sanguíneos, não têm ordem particular. Variáveis ordinais, como a escala de coma de Glasgow, têm valores distintos que são dispostos em uma ordem particular. Outras variáveis clínicas, incluindo vários exames diagnósticos típicos, são contínuas e apresentam uma infinidade de resultados possíveis (p. ex., contagem de leucócitos, glicemia). Vários médicos escolhem um ponto de corte que possa fazer com que uma variável contínua seja tratada como uma variável dicotômica (p. ex., pacientes com glicemia de jejum > 126 mg/dL [7,0 mmol/L] são considerados diabéticos). Outros exames diagnósticos contínuos têm utilidade diagnóstica quando apresentam múltiplos pontos de corte ou quando os limites dos resultados têm valores diagnósticos distintos.

Quando os resultados dos exames podem ser definidos como positivos ou negativos, todos os desfechos possíveis podem ser registrados em uma tabela simples de 2 × 2 (ver tabela Distribuição de resultados de exames hipotéticos), a partir da qual características discriminatórias importantes de teste, como sensibilidade, especificidade, valor preditivo positivo e negativo e índice de probabilidade (IP), podem ser calculadas (ver tabela Distribuição dos resultados dos testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com 30% de prevalência presumida de uma ITU).

Tabela

Sensibilidade, especificidade e valores preditivos

Sensibilidade e especificidade são tipicamente considerados características do exame em si, independentemente da população de pacientes.

  • Sensibilidade é a probabilidade de que os pacientes com a doença tenham um resultado de teste positivo (taxa de verdadeiro-positivo)

Deste modo, um exame que é positivo em 8 de 10 pacientes com a doença tem sensibilidade de 0,8 (também expressa como 80%). A sensibilidade representa o quanto o teste detecta a doença; um teste com baixa sensibilidade não identifica muitos pacientes com a doença, e um teste com alta sensibilidade é útil para excluir um diagnóstico quando os resultados são negativos. A sensibilidade é o complemento da taxa de falso-negativo (isto é, taxa de falso-negativos + sensibilidade = 100%).

  • Especificidade é a probabilidade de que os pacientes sem a doença terão um resultado de teste negativo (taxa de verdadeiro-negativo)

Assim, um teste que é negativo em 9 de 10 pacientes sem a doença tem uma especificidade de 0,9 (ou 90%). A especificidade mede quão bem o exame identifica corretamente pacientes com a doença, pois os testes com alta especificidade têm baixa taxa de falso-positivo. Um exame com baixa especificidade diagnostica vários pacientes sem a doença como portadores da doença. É o complemento da taxa de falso-positivo.

Valores preditivos descrevem o comportamento do teste em uma dada população de pacientes que não sabem se têm a doença. Para um dado teste, os valores preditivos variam de acordo com a prevalência da doença na população de pacientes testada.

  • O valor preditivo positivo (VPP) é a proporção de pacientes com resultado do exame positivo que realmente têm a doença

Se 9 de 10 resultados positivos de exames estão corretos (verdadeiro positivo) o VPP é 90%. Como todos os resultados de exames positivos representam um número de positivos verdadeiros e de falso-positivos, o PPV descreve a probabilidade de um resultado de exame positivo em determinada população de pacientes representar um positivo verdadeiro.

  • O valor preditivo negativo (VPN) é a proporção de pacientes com resultado negativo no exame que realmente não têm a doença

Assim, se 8 dos 10 resultados negativos do exame estão corretos (verdadeiro negativo), o VPN é 80%. Como nem todos os resultados de exames negativos são negativos verdadeiros, alguns pacientes com resultados de exames negativos, na verdade, apresentam a doença. O NPV representa a possibilidade de um resultado de exame negativo em determinada população de pacientes representar um negativo verdadeiro.

Calculadora clínica
Calculadora clínica

Razões de probabilidade (LR)

Diferentemente da sensibilidade e da especificidade, que não são aplicadas às probabilidades específicas do paciente, as IP permitem aos médicos interpretarem os resultados de exames em um paciente específico, desde que exista uma possibilidade de doença pré-teste conhecida (apesar de geralmente estimada).

A razão de probabilidade (RP) descreve a mudança na probabilidade pré-teste da doença quando o resultado do teste é conhecido e responde à pergunta

  • Quanto a probabilidade pós-teste mudou em relação à probabilidade pré-teste agora que o resultado do teste é conhecido?

Muitos testes clínicos são dicotômicos; eles estão acima do ponto de corte (positivo) ou abaixo do ponto de corte (negativo) e há apenas 2 resultados possíveis. Outros testes fornecem resultados contínuos ou ocorrem ao longo de um intervalo em que são selecionados múltiplos pontos de corte. A probabilidade real pós-teste depende da magnitude das IP (que depende de características operacionais do exame) e da estimativa pré-teste da doença. Quando o exame realizado é dicotômico e o resultado é positivo ou negativo, a sensibilidade e especificidade podem ser utilizadas para calcular IP positiva (IP+) ou negativa (IP-).

  • IP+: O índice de probabilidade de um teste positivo ocorrer em pacientes com a doença (positivo verdadeiro) em relação à probabilidade de um resultado de teste positivo em um paciente sem a doença (falso-positivo)

  • IP:-: A probabilidade de um resultado de exame negativo em paciente com doença (falso-negativo) em relação à probabilidade de um resultado negativo em pacientes sem a doença (negativos verdadeiros)

LSSmúltiplos pontos de corte, utiliza-se a curva ROC, e não a sensibilidade e a especificidade, para calcular uma IP que não é mais descrita como IP+ ou IP-.

Uma vez que a IP é uma relação de eventos mutuamente exclusivos e não uma proporção do total, ela representa chances (odds) mais que probabilidade. Para um determinado exame, a IP é diferente para resultados positivos e negativos.

Por exemplo, se um resultado de exame for positivo, uma IP de 2,0 indica que a chance é de 2:1 (positivo verdadeiro:falso-positivo) para um resultado de exame positivo representar um paciente com a doença. De 3 exames positivos, 2 ocorreriam em pacientes com a doença (positivo verdadeiro) e 1 ocorreria em uma paciente sem a doença (falso-positivo). Como os positivos verdadeiros e falso-positivos são componentes dos cálculos de sensibilidade e especificidade, a IP+ pode também ser calculada como sensibilidade/(1 especificidade). Quanto maior a IP+, mais informações um teste positivo fornece; um resultado positivo de um teste com IP+ > 10 é considerado forte evidência em favor do diagnóstico. Em outras palavras, a estimativa de probabilidade pré-teste se move fortemente em direção a 100% quando um exame positivo tem IP+ elevada.

Para um resultado de exame negativo, uma IP- de 0,25 indica que a chance é 1:4 (falso-negativo:negativo verdadeiro) para que um resultado de exame negativo represente um paciente com a doença. De 5 resultados de exames negativos, 1 ocorreria em um paciente com doença (falso-negativo) e 4 ocorreriam em pacientes sem a doença (negativos verdadeiros). A IP- também pode ser calculada como (1 sensibilidade)/especificidade. Quanto menor a IP-, mais informações um resultado de exame negativo fornece; um resultado negativo de exame com IP < 0,1 é considerado forte evidência contra o diagnóstico. Em outras palavras, a estimativa de probabilidade pré-teste se move fortemente em direção a 0% de probabilidade, quando o exame tem uma IP- baixa.

Resultados de teste com RP de 1,0 não contêm informações e não afetam a probabilidade pós-teste da doença.

LR são convenientes para testes de comparação e também são utilizadas em análises bayesianas para interpretar resultados de exames. Assim como a sensibilidade e a especificidade se modificam na medida em que o ponto de corte muda, o mesmo ocorre com LR. Um exemplo hipotético, um ponto de corte alto para contagem de leucócitos (p. ex., 20.000/μl) em um caso de possível apendicite aguda é mais específi- co e terá IP+ mais elevada, mas também IP- elevada (e assim não é muito informativo). Escolher um ponto de corte muito mais baixo e muito sensível (p. ex., 10.000/μl) apresenta uma baixa IP-, mas também uma IP+ baixa.

Exames dicotômicos

Um exame dicotômico ideal não teria falso-negativos nem falso-positivos; todos os pacientes com resultados de exames positivos teriam a doença (PPV 100%) e todos os pacientes com resultados de exames negativos não teriam a doença (NPV 100%).

Na realidade, todos os exames têm falso-positivo e falso-negativo, alguns exames mais que outros. Para ilustrar as consequências da imperfeição da sensibilidade e da especificidade dos resultados de exames, considere resultados hipotéticos (ver tabela Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1000 mulheres com 30% de prevalência presumida de uma infecção do trato urinário) de um teste com fita reagente para esterase leucocitária em um grupo de 1000 mulheres, 300 (30%) das quais com uma infecção do trato urinário (conforme determinado por um exame "padrão ouro" como a cultura de urina). Este cenário assume com finalidade ilustrativa que o teste de fita tem sensibilidade de 71% e especificidade de 85%.

Sensibilidade de 71% significa que apenas 213 (71% de 300) mulheres com uma ITU teriam um resultado de teste positivo. As demais 87 teriam um resultado de exame negativo. A especificidade de 85% significa que 595 (85% de 700) mulheres sem uma ITU apresentariam um resultado de exame negativo. As demais 105 teriam resultado positivo. Assim, de 213 + 115 = 318 resultados de exames positivos, apenas 213 estariam corretos (213/318 = 67% PPV); um resultado de exame positivo torna a possibilidade de uma ITU maiores, porém sem certeza. Também haveria 87 + 595 = 682 exames negativos dos quais 595 estão corretos (595/682 = 87% NPV), tornando o diagnóstico de uma ITU muito menos provável mais ainda possível; 13% das pacientes com resultado negativo na verdade apresentam uma ITU.

Tabela

Entretanto, o PPV e NPV derivados na coorte de pacientes não pode ser utilizado para interpretar resultados do mesmo exame quando a incidência subjacente da doença (probabilidade pré-teste ou probabilidade prévia) é diferente. Observe os efeitos da alteração da incidência da doença para 5% (ver tabela Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com 5% de prevalência presumida de uma ITU). Agora, a maioria dos resultados positivos é falsa e a PPV é de apenas 20%; a paciente com resultado positivo na verdade tem maior probabilidade de não apresentar uma ITU. Entretanto, o NPV agora é muito elevado (98%) e um resultado negativo essencialmente exclui uma ITU.

Tabela

Observe que, em ambas as coortes de pacientes, mesmo quando PPV e NPV são diferentes, as LR não se alteram, pois elas são determinadas apenas pela sensibilidade e especificidade do exame.

Claramente, um resultado de exame não fornece um diagnóstico específico, mas estima apenas a probabilidade de a doença estar presente ou ausente, e esta probabilidade pós-teste (probabilidade da doença dado um resultado específico de exame) varia muito, com base na probabilidade pré-teste da doença, assim como na sensibilidade e especificidade do exame (e assim sua IP).

Probabilidade pré-teste

Probabilidade pré-teste não é uma medida precisa; baseia-se no julgamento clínico de quão forte é a sugestão da presença de doença com base nos sinais e sintomas clínicos, quais fatores na história do paciente e nos fatores de risco favorecem o diagnóstico e o quão comum é a doença em uma população representativa. Vários sistemas clínicos de classificação foram estabelecidos para estimar a probabilidade pré-teste e o acréscimo de pontos para as diversas características clínicas facilita o cálculo da classificação. Esses exemplos ilustram a importância da estimativa da prevalência exata anterior ao exame porque a prevalência da doença na população considerada influencia drasticamente a utilidade do teste. Deve-se utilizar ferramentas validadas publicadas para estimar a prevalência quando disponíveis. Por exemplo, existem critérios para prever a probabilidade pré-teste de embolia pulmonar. Classificações calculados mais elevados levam a probabilidades estimadas maiores.

Exames contínuos

Vários resultados de exames são contínuos e podem fornecer informações clínicas úteis em uma ampla gama de resultados. Os médicos geralmente selecionam um ponto de corte para maximizar a utilidade do exame. Por exemplo, uma contagem de leucócitos > 15.000 pode ser caracterizada como positiva e valores < 15.000 como negativos. Quando um exame fornece resultados contínuos, mas é selecionado um certo ponto de corte, o exame passa a funcionar como um exame dicotômico. Também podem ser selecionados múltiplos pontos de corte. Pode-se calcular sensibilidade, especificidade, PPV, NPV, IP+ e IP- para um único ou para múltiplos pontos de corte. A tabela Efeito da alteração do ponto de corte da contagem de leucócitos em pacientes com suspeita de apendicite ilustra o efeito de mudar o ponto de corte da contagem de leucócitos em pacientes com suspeita de apendicite.

Tabela

Alternativamente, pode ser útil agrupar os resultados de exames contínuos em níveis. Neste caso os resultados não são caracterizados como positivos ou negativos, pois há múltiplos resultados possíveis, assim, apesar da IP ser determinada para cada nível de resultado, não há mais IP+ ou IP-. Por exemplo, a tabela Uso de grupos de contagem de leucócitos para determinar a razão de probabilidade de bacteremia em crianças febris ilustra as relações entre a contagem de leucócitos e bacteremia em crianças febris. Como a IP consiste na probabilidade de um determinado resultado em pacientes com a doença dividida pela probabilidade deste resultado em pacientes sem a doença, a IP para cada grupo de contagem de leucócitos é a probabilidade da bacteremia neste grupo, dividida pela probabilidade de ausência de bacteremia.

Tabela

O agrupamento de variáveis contínuas permite um uso maior dos resultados de exames do que quando um único ponto de corte é estabelecido. Com análises bayesianas, as RPs da tabela Uso de grupos de contagem de leucócitos para determinar a razão da probabilidade de bacteremia em crianças febris podem ser utilizadas para calcular a probabilidade pós-teste.

Para resultados contínuos de exames, se a curva COR for conhecida, os cálculos mostrados na tabela não precisam ser feitos; as RPs podem ser encontradas em vários pontos ao longo de uma gama de resultados utilizando a inclinação da curva COR no ponto desejado.

Teorema de Bayes

O processo que utiliza a probabilidade pré-teste de doença e as características dos exames para cálculo da probabilidade pós-teste é denominado teorema de Bayes ou revisão bayesiana. Para utilização clínica de rotina, a metodologia bayesiana tipicamente assume várias formas:

  • Forma de cálculo de chance-probabilidade (cálculo ou nomograma)

  • Abordagem tabular

Cálculo de chance-probabilidade

Se a pro- babilidade de pré-teste de uma doença é expressa como suas chances (odds) e a IP de um exame representa chances, o produto das 2 representa as chances pós-teste da doença (análogo à multiplicação de 2 probabilidades juntas para cálculo da probabilidade simultânea da ocorrência de 2 eventos):

Chance pré-teste × IP = chance pós-teste

Como os médicos tipicamente raciocinam em termos de probabilidades e não de chances, a probabilidade pode ser convertida em chance (e vice-versa) com esta fórmula:

Chance (odds) = probabilidade/1 probabilidade

Probabilidade = chance/chance + 1

Considere o exemplo da uma ITUna tabela Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com 30% de prevalência presumida de uma ITU, na qual a probabilidade pré-teste da uma ITU é de 0,3 e o exame utilizado tem uma IP+ de 4,73 e uma IP- de 0,34. Uma probabilidade pré-teste de 0,3 corresponde a uma chance de 0,3/(1 0,3) = 0,43. Assim, a chance pós-teste de uma ITU estar presente em um paciente com resultado de exame positivo é igual ao produto das chances pré-teste e IP+, 4,73 × 0,43 = 2,03, que representa uma probabilidade pós-teste de 2,03/(1 + 2,03) = 0,67. Deste modo, os cálculos bayesianos mostram que o resultado positivo do exame aumenta a probabilidade pré-teste de 30% para 67%, o mesmo valor obtido no cálculo do VPP na tabela.

Um cálculo semelhante é realizado para um exame negativo com chance pré-teste = 0,34 × 0,43 = 0,15, correspondendo à probabilidade de 0,15/(1 + 0,15) = 0,13. Assim, o resultado negativo de teste diminui a probabilidade pós-teste de 30% para 13%, novamente o mesmo valor obtido no cálculo do VPN na tabela.

Vários programas de cálculo médico estão disponíveis em aparelhos portáteis para calcular a probabilidade pós-teste a partir da LSS.

Calculadora clínica

Nomograma de probabilidade

Utilizar um nomograma é particularmente conveniente por evitar a conversão entre chances e probabilidades ou criação de tabelas 2 × 2.

Para utilizar o nomograma de Fagan traçar uma linha da probabilidade pré-teste à IP. A probabilidade pós-teste é o ponto em que ocorre intersecção desta linha com a linha de probabilidade pós-teste. Linhas de exemplo na figura são traçadas utilizando os dados do exame de uma ITU na tabela Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com 30% de prevalência presumida de uma ITU. A linha A representa um resultado de exame positivo, ela é traçada de uma probabilidade pré-teste de 0,3 até IP+ de 4,73 e fornece um valor de pós-teste ligeiramente < 0,7, semelhante à probabilidade calculada de 0,67. A linha B representa um resultado de exame negativo, é traçada de uma probabilidade pré-teste de 0,3 até um valor IP- de 0,34 e fornece um valor pós-teste discretamente > 0,1, semelhante à probabilidade calculada de 13%.

Apesar do nomograma parecer menos preciso do que os cálculos, os valores típicos de probabilidade pré-teste geralmente são estimativos; assim, a precisão aparente dos cálculos é geralmente enganosa.

Nomograma de Fagan

Linhas ilustrativas na figura são traçadas utilizando os dados do exame de uma ITU na tabela Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com 30% de prevalência presumida de uma ITU. A linha A representa os resultados de exames positivos; é desenhada a partir de uma probabilidade pré-teste de 0,3 até IP+ de 4,73 com uma probabilidade pós-teste resultante discretamente < 0,7, semelhante à probabilidade calculada de 0,67. A linha B representa um resultado de exame negativo é traçada a partir de uma probabilidade pré-teste de 0,3 até IP- de 0,34 com um valor de probabilidade pós-teste ligeiramente > 0,1, semelhante à probabilidade calculada de 13%.

IP+= índice de probabilidade de um resultado positivo; IP- = índice de probabilidade de um resultado negativo.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Abordagem tabular

Em geral, o LR de um teste não é conhecido, mas a sensibilidade e especificidade são conhecidas e a probabilidade pré-teste pode ser estimada. Nesse caso, pode-se definir a metodologia bayesiana utilizando uma tabela 2 × 2 ilustrada na tabela Interpretação de um resultado hipotético de exame de esterase leucocitária utilizando o exemplo da tabela Distribuição dos resultados de testes de um exame hipotético de esterase leucocitária em uma coorte de 1.000 mulheres com 30% de prevalência presumida de uma ITU. Observe que este método mostra que um resultado de exame positivo aumenta a probabilidade de uma ITU para 67% e um resultado negativo diminui para 13%, os mesmos resultados obtidos por cálculo utilizando LR.

Tabela

Exames sequenciais

Os médicos geralmente realizam exames em sequência durante várias avaliações diagnósticas. Se a chance pré-teste antes do teste sequencial é conhecida e o IP de cada teste em sequência é conhecido, as chances pós-teste podem ser calculadas utilizando a seguinte fórmula:

Chance pré-teste × LR1 × LR2 × LR3 = chance pós-teste

Este método é limitado pela importante presunção de que cada exame é condicionalmente independente do outro.

Exames de triagem

Os pacientes frequentemente consideram se devem ou não realizar uma triagem para doenças ocultas. As premissas dos programas de rastreamento bem-sucedidos são que a detecção precoce melhora os desfechos clinicamente significativos em pacientes com doença oculta e que os resultados falso-positivos que podem ocorrer no rastreamento não representem um ônus (p. ex., custos e efeitos adversos de exames confirmatórios, ansiedade provocada pelos testes, tratamentos injustificáveis) que excede esse benefício. Para minimizar esta possível carga, os médicos devem escolher o teste de rastreamento adequado. O rastreamento não é apropriado quando os tratamentos ou medidas preventivas são ineficazes ou a doença é muito rara (a menos que possa ser identificada uma subpopulação em que a prevalência é mais elevada).

Teoricamente, o melhor exame, tanto para rastreamento como para diagnóstico, é aquele com sensibilidade e especificidade mais elevadas. Entretanto, estes exames altamente precisos geralmente são complexos, caros e invasivos (p. ex., angiografia coronariana); sendo assim, não são práticos para rastreamento de grandes números de indivíduos assintomáticos. Caracteristicamente deve ser feita alguma opção em sensibilidade, especificidade ou ambas ao selecionar um exame de rastreamento.

Um médico escolhe um exame que otimize a sensibilidade ou especificidade, dependendo das consequências de um resultado de exame falso-positivo ou falso-negativo, assim como da probabilidade de doença pré-teste. Um exame de rastreamento ideal é aquele que é sempre positivo em quase todos os pacientes com a doença, de forma que o resultado negativo exclua com confiança a doença em indivíduos saudáveis. Por exemplo, em um exame para doenças graves para as quais há tratamento eficaz disponível (p. ex., doença coronariana), os médicos poderiam tolerar mais resultados falso-positivos do que falso-negativos (menor especificidade e maior sensibilidade). Apesar de alta sensibilidade ser um atributo muito importante para exames de rastreamento, a especificidade também é importante em certas estratégias de rastreamento. Entre populações com prevalências mais elevadas de doenças, o PPV de um exame de rastreamento aumenta; na medida em que a prevalência diminui, a probabilidade pós-teste ou probabilidade posterior de um resultado positivo diminui. Consequentemente, quando rastreamos uma doença em populações de alto risco, os exames com maior sensibilidade são preferíveis em relação àqueles com maior especificidade, pois são melhores para excluir a doença (menos falso-negativos). Por outro lado, em populações de baixo risco ou para doenças incomuns, nas quais o tratamento tem menor benefício e maior risco, são preferíveis exames com maior especificidade.

Múltiplos exames de triagem

Com a expansão do arsenal de exames de rastreamento disponíveis, os médicos devem considerar as implicações de um painel destes exames. Por exemplo, painéis de 8, 12 ou algumas vezes 20 exames de sangue frequentemente são realizados quando um paciente é admitido no hospital ou quando é examinado pela primeira vez por um novo médico. Apesar deste tipo de teste talvez seja útil para rastrear pacientes com certas doenças, a utilização de um grande painel de exames tem consequências potencialmente negativas. Por definição, um exame com especificidade de 95% resulta em 5% de falso-positivo em pacientes saudáveis normais. Se 2 exames diferentes com estas características são realizados, cada um para uma doença oculta diferente, um paciente que na verdade não apresenta nenhuma doença tem chance de ambos os resultados serem negativos de 95% × 95% ou cerca de 90%; sendo assim, há uma chance de 10% de pelo menos um dos exames ter resultado falso-positivo. Para 3 exames deste tipo, a chance de todos os 3 serem negativos é 95% × 95% ×95% ou 86%, correspondendo a 14% de chance de pelo menos um resultado falso-positivo. Se forem realizados 12 exames diferentes para 12 doenças diferentes, a chance de obter pelo menos um resultado falso-positivo é de 46%. Esta alta probabilidade ressalta a necessidade de cautela ao decidir pela realização de um painel de exames e ao interpretar seus resultados.

Limiar para exames

O exame de laboratório deve ser realizado apenas se o seu resultado afetar o tratamento; caso contrário, a despesa e o risco para o paciente são inúteis. Os médicos podem, algumas vezes, fazer determinação de quando realizar o exame por meio de comparação de estimativa de probabilidade pré-teste e pós-teste com certos limiares. Acima de determinado limiar de probabilidade, os benefícios do tratamento superam os riscos (incluindo o risco de tratar erroneamente um indivíduo sem a doença) e o tratamento é indicado. Esse ponto é chamado limiar terapêutico, sendo determinado como descrito nas Estratégias de tomada de decisão clínica: estimativas de probabilidade e o limiar terapêutico. Por definição, o exame é desnecessário quando a probabilidade pré-teste é superior ao limiar terapêutico. Mas indica-se o exame se a probabilidade pré-teste for inferior ao limiar terapêutico, desde que o resultado positivo do exame aumente a probabilidade pós-teste acima do limiar terapêutico. A menor probabilidade pré-teste em que isto ocorre depende das características do exame (p. ex., IP+) e é denominada limiar para teste.

Conceitualmente, se o melhor exame para uma doença grave tem baixa IP+ e alto limiar terapêutico, é compreensível que o resultado positivo do exame possa não mover a probabilidade pós-teste acima do limiar de tratamento de um paciente com probabilidade pré-teste baixa, porém preocupante (p. ex., talvez de 10% ou 20%).

Como ilustração numérica, considere o caso descrito anteriormente de um possível infarto do miocárdio no qual o equilíbrio entre risco e benefício determinou um limiar terapêutico de 25%. Quando a probabilidade de IAM excede 25%, administra-se terapia trombolítica. Quando deve ser realizado um ecocardiograma de urgência antes de se administrar tratamento trombolítico? Considerando uma sensibilidade hipotética de 60% e especificidade de 70% para ecocardiografia no diagnóstico do IAM, estas porcentagens corresponderiam a IP+ de 60/(100 70) = 2 e IP- de (100 60)/70 = 0,57.

Essa questão pode ser abordada matematicamente (chance pré-teste × IP = chance pós-teste) ou graficamente de forma mais intuitiva com o nomograma de Fagan. No nomograma, uma linha conectando o limiar terapêutico (25%) da probabilidade pós-teste pela linha IP+ (2,0) no meio da linha IP faz interseção com uma probabilidade pré-teste de cerca de 0,14. Claramente, um resultado positivo de um exame de um paciente com possibilidade pré-teste < 14% ainda resulta em uma probabilidade pós-teste inferior ao limiar terapêutico. Nesse caso, o ecocardiograma seria inútil porque mesmo um resultado positivo não levaria à decisão de tratar; portanto, 14% de probabilidade pré-teste é o limiar do teste para esse exame em particular (ver figura Representação dos limiares de exame e terapêuticos). Outro exame com IP+ diferente levará a um limiar de teste diferente.

Nomograma de Fagan utilizado para determinar a necessidade de um exame

Neste exemplo assume-se um limiar de tratamento de 25% para o tratamento do paciente com infarto agudo do miocárdio. Quando a probabilidade de IAM excede 25%, administra-se terapia trombolítica. Os médicos podem utilizar nomograma de Fagan para determinar quando deve ser realizado um ecocardiograma rápido antes da administração do tratamento trombolítico. Assumindo que a sensibilidade hipotética do ecocardiograma seja de 60% e especificidade de 70% para novo IAM, estas porcentagens corresponderiam a uma índice de probabilidade (IP) de resultado positivo de exame (IP+) de 60/(100 70) = 2. Uma linha conectando um limiar de tratamento pós-teste de 25% na linha de probabilidade pós-teste à IP+ (2,0) no meio da linha IP faz interseção com a linha da probabilidade pré-teste perto de 0,14. O resultado positivo do exame de um paciente com probabilidade pré-teste < 14% ainda leva a uma probabilidade pós-teste inferior ao limiar terapêutico.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Representação dos limiares para exame e tratamento

A linha horizontal representa probabilidade pós-teste.

Como 14% ainda representa um risco significativo de IAM, fica claro que a probabilidade de uma doença abaixo do limiar de teste (ou, p. ex., uma probabilidade pré-teste de 10%) não significa necessariamente que a doença foi excluída; apenas que um resultado positivo do exame particular em questão não modificaria a abordagem e, assim, este exame não seria indicado. Nesta situação, o médico observaria no paciente mais dados que poderiam elevar a probabilidade de pré-teste acima do limiar de teste. Na prática, como geralmente há múltiplos exames disponíveis para uma determinada doença, poderiam ser utilizados testes sequenciais.

Este exemplo considera que o exame em si não traz riscos ao paciente. Se o exame tiver risco grave (p. ex., cateterismo cardíaco), o limiar de teste deve ser mais elevado e os cálculos quantitativos podem ser realizados, porém são complexos. Assim, a redução da sensibilidade e especificidade de um exame, ou o aumento de seu risco, reduz a gama de probabilidades de doença em que o exame é a melhor estratégia. Aprimorar a capacidade de discriminação do teste ou reduzir seu risco restringe a amplitude de probabilidades em que o teste constitui a melhor estratégia.

Uma exceção possível à exclusão do exame quanto à probabilidade pré-teste está abaixo do limiar de teste (mais ainda é preocupante) poderia ser se um resultado negativo do exame pudesse reduzir a probabilidade pós-teste abaixo do ponto em que a doença pode ser considerada excluída. Esta determinação requer um julgamento subjetivo do grau de certeza necessário para excluir uma doença e devido ao envolvimento de probabilidades baixas, atenção particular aos riscos do exame.

quizzes_lightbulb_red
Test your KnowledgeTake a Quiz!
Baixe o aplicativo  do Manual MSD!ANDROID iOS
Baixe o aplicativo  do Manual MSD!ANDROID iOS
Baixe o aplicativo  do Manual MSD!ANDROID iOS