Capire i test medici e i risultati dei test

DiBrian F. Mandell, MD, PhD, Cleveland Clinic Lerner College of Medicine at Case Western Reserve University

Reviewed ByMichael R. Wasserman, MD, California Association of Long Term Care Medicine (CALTCM)

Revisionato/Rivisto lug 2024 | Modificata nov 2024

v1123930_it

Visualizzazione l’educazione dei pazienti

Definizione di un risultato positivo di un test
Caratteristiche del test
Test dicotomici
Test continui
Teorema di Bayes
Test sequenziale
Test di screening
Soglie per l'esecuzione di test

I risultati dei test possono aiutare a fare una diagnosi in pazienti sintomatici (test diagnostici) o a identificare una malattia occulta in pazienti asintomatici (screening). Se i test sono stati adeguatamente prescritti sulla base della presentazione clinica, qualsiasi risultato deve aiutare ad avvalorare o escludere possibili diagnosi. I risultati dei test possono interferire con il processo decisionale clinico se i test distinguono male tra i pazienti con e senza la malattia sospetta o se i risultati del test sono integrati in modo improprio nel contesto clinico.

I test di laboratorio sono imperfetti e possono identificare erroneamente le persone sane come malate (un risultato falso positivo) o possono erroneamente identificare come sani alcuni pazienti malati (un risultato falso negativo). La capacità di un esame di identificare correttamente i pazienti con una malattia dipende dalle probabilità che ha un soggetto di avere quella patologia (probabilità a priori) così come dalle caratteristiche operative intrinseche del test stesso (1).

Sebbene i test diagnostici siano spesso un fattore critico per il processo decisionale clinico accurato, essi possono avere delle conseguenze indesiderate o non intenzionali. Il test deve essere effettuato con attenta considerazione, con uno scopo, e con l'aspettativa che il suo risultato riduca l'ambiguità dei problemi del paziente e contribuisca alla sua salute. Oltre al rischio di fornire informazioni errate (e quindi di ritardare l'inizio del trattamento o di indurre trattamenti non necessari), gli esami di laboratorio consumano le già limitate risorse e possono essi stessi avere effetti avversi (p. es., pneumotorace causato da biopsia polmonare) o possono richiedere ulteriori esami o stress inutili.

I risultati di uno screening o di un test diagnostico devono essere interpretati nella specifica situazione clinica e nel contesto di precedenti test di base.

Riferimento

1. Armstrong KA, Metlay JP: Annals Clinical Decision Making: Using a Diagnostic Test. Ann Intern Med. 2020;172(9):604-609. doi:10.7326/M19-1940

Definizione di un risultato positivo di un test

Tra i test più diffusi ci sono quelli che forniscono risultati lungo una scala quantitativa continua (p. es., glicemia, conta leucocitaria). Tali test possono fornire utili informazioni cliniche su un ampio range di valori, ma i medici spesso li usano per diagnosticare una condizione richiedendo che il risultato sia classificato come positivo o negativo (ossia, malattia presente o assente) in base al confronto con un criterio prestabilito o punto limite. Tali punti limite sono generalmente selezionati sulla base di analisi statistiche e teoriche che tentano di bilanciare il tasso di falsi positivi (che richiedono prove inutili, costose, e possono consistere in test o trattamenti pericolosi) e quello di falsi negativi (mancata diagnosi di una malattia curabile). L'individuazione di un punto limite dipende anche dall'avere uno standard di riferimento per l'identificazione della malattia in questione.

In genere, gli esiti delle prove quantitative (p. es., conta leucocitaria nei casi di sospetta polmonite batterica) seguono un certo tipo di curva di distribuzione (non necessariamente una curva normale, anche se comunemente raffigurata come tale). La distribuzione dei risultati dei test per i pazienti con malattia è centrata su un punto diverso da quello per i pazienti sani. Alcuni pazienti con malattia hanno un risultato molto alto o molto basso, ma la maggior parte ha un risultato centrato su un valore medio. Al contrario, alcuni pazienti senza malattia hanno un risultato molto alto o molto basso, ma la maggior parte ha un risultato centrato su una media diversa da quella dei pazienti con la malattia. Per la maggior parte dei test, le distribuzioni si sovrappongono in maniera tale che molti dei possibili risultati del test si verificano in pazienti con e senza malattia; tali risultati sono illustrati più chiaramente quando le curve vengono riportate sullo stesso grafico (vedi figura ). Alcuni pazienti con dei risultati al di sopra e al di sotto del punto soglia selezionato saranno classificati in modo errato. La regolazione di un punto soglia per identificare più pazienti con malattia (aumentare la sensibilità del test) aumenta anche il numero di falsi positivi (scarsa specificità), mentre spostando il punto soglia nella direzione opposta per evitare la falsa diagnosi di malattia, aumenta il numero di falsi negativi. Ciascun punto soglia è associato a una specifica probabilità di risultati veri positivi e falsi positivi.

Distribuzioni dei risultati del test

I pazienti con la malattia sono mostrati nella distribuzione superiore; i pazienti sani sono mostrati nella distribuzione inferiore. Per i pazienti con malattia, la regione sotto la distribuzione dei risultati che si trova a destra (sopra) rispetto al valore del punto limite corrisponde alla percentuale dei veri positivi (ossia, la sua sensibilità); l'area che si trova al di sotto a sinistra del valore limite corrisponde alla percentuale di falsi negativi. Per i pazienti sani, la regione a destra del criterio soglia corrisponde alla percentuale di falsi positivi, e la regione a sinistra corrisponde invece alla percentuale di veri negativi (ossia, la sua specificità). Per le 2 parti sovrapposte delle distribuzioni (p. es., pazienti con e senza malattia), la variazione della linea del valore limite influenza la sensibilità e la specificità, ma in direzioni opposte; cambiando il valore limite da 1 a 2 si riduce il numero di falsi negativi (maggiore sensibilità), ma aumenta anche il numero di falsi positivi (minore specificità).

Curve ROC (receiver operating characteristic)

Riportando graficamente la frazione di veri positivi (numero di veri positivi/numero di malattie) contro la frazione di falsi positivi (numero di falsi positivi/numero senza malattia) per una serie di valori soglia si crea ciò che è noto come una curva ROC (receiver operating characteristic). La curva ROC (receiver operating characteristic) rappresenta graficamente la relazione funzionale tra la sensibilità e la specificità al variare del valore limite (vedi figura ). Per convenzione, la frazione di veri positivi viene posizionata sull'asse y, e la frazione di falsi positivi viene posizionata sull'asse x. Maggiore è l'area sotto la curva ROC (receiver operating characteristic), migliore è la capacità di un test di discriminare tra pazienti con o senza malattia.

Le curve ROC (receiver operating characteristic) permettono di confrontare i test su una varietà di valori limite. Nell'esempio, il Test A si comporta meglio del Test B su tutte le fasce. Le curve ROC (receiver operating characteristic) facilitano anche la scelta del punto soglia progettato per ottimizzare l'utilità di un test. Se un test è progettato per confermare una malattia verrà selezionato un punto limite con maggiore specificità e minore sensibilità. Se il test è stato progettato per lo screening per una malattia occulta, verrà selezionato un punto soglia con una maggiore sensibilità e una minore specificità.

Tipica curva ROC (receiver operating characteristic)

Caratteristiche del test

Alcune variabili cliniche hanno solo 2 possibili risultati (p. es., vivo/morto, incinta/non incinta); tali variabili sono chiamate categoriali e dicotomiche. Altri risultati categoriali possono avere molti valori discreti (p. es., gruppo sanguigno, Scala del Coma di Glasgow) e sono chiamati nominali o ordinali. Le variabili nominali, come il gruppo sanguigno, non hanno un ordine particolare. Variabili ordinali come la Glasgow Coma Scale hanno, invece, valori discreti disposti in un ordine particolare. Altre variabili cliniche, tra cui molti test diagnostici comuni, sono continue e hanno un numero infinito di possibili risultati (p. es., conta leucocitaria, glicemia). Molti medici selezionano un valore soglia in modo tale da considerare una variabile continua come dicotomica (p. es., pazienti con una glicemia a digiuno > 126 mg/dL [7,0 mmol/L] sono da considerare come diabetici). Altri esami diagnostici continui presentano utilità diagnostica quando hanno molteplici valori soglia o quando gli intervalli di risultati hanno differente valore diagnostico.

Quando i risultati dei test possono essere definiti come positivi o negativi, tutti i possibili risultati possono essere registrati in una semplice tabella 2 × 2 (vedi tabella ) da cui possono essere calcolate importanti caratteristiche discriminative dei test, tra cui sensibilità, specificità, valore predittivo positivo e negativo e rapporto di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza) (vedi tabella ).

Tabella

Distribuzione dei risultati ipotetici dei test

Tabella

Distribuzione dei risultati ipotetici dei test

Distribuzione dei risultati ipotetici dei test
Risultati	Malattia presente	Malattia assente
Test positivo	Vero positivo	Falso positivo
Test negativo	Falso negativo	Vero negativo
Totale pazienti	Tutti i pazienti con malattia	Tutti i pazienti sani

Sensibilità, specificità e valore predittivo

I valori di sensibilità e specificità sono in genere considerati caratteristiche del test stesso, indipendenti dalla popolazione dei pazienti.

La sensibilità è la probabilità che i pazienti con la malattia avranno un risultato positivo del test (percentuale di veri positivi)

Pertanto un test che è positivo in 8 pazienti malati su 10 complessivi ha una sensibilità di 0,8 (espressa anche come 80%). La sensibilità valuta la capacità del test di individuare la malattia; un test con bassa sensibilità non identifica molti pazienti con la malattia, e un test con sensibilità elevata è utile per escludere una diagnosi quando i risultati sono negativi. La sensibilità è complementare alla percentuale di falsi negativi (ossia, percentuale di falsi negativi più sensibilità = 100%).

La specificità è la probabilità che i pazienti senza la malattia avranno un test negativo (percentuale di veri negativi)

Pertanto, un test che è negativo in 9 su 10 pazienti sani ha una specificità di 0,9 (o 90%). La specificità rappresenta quanto correttamente un test identifica i pazienti sani, in quanto i test ad alta specificità hanno un basso tasso di falsi positivi. Un test con bassa specificità descrive come malati molti pazienti sani. È, inoltre, complementare alla percentuale di falsi positivi.

I valori predittivi descrivono il comportamento del test in una data popolazione di pazienti che non sanno se hanno la malattia. Per un dato test, i valori predittivi variano a seconda della prevalenza della malattia nella popolazione di pazienti testata.

Il valore predittivo positivo è la proporzione di pazienti con un test positivo che ha realmente la malattia

Pertanto, se 9 su 10 risultati positivi sono corretti (veri positivi), il valore predittivo positivo del test è del 90%. Poiché tutti i risultati positivi hanno numerosi veri positivi e falsi positivi, il valore predittivo positivo descrive la probabilità che un risultato positivo in una certa popolazione di pazienti rappresenti una vera positività.

Il valore predittivo negativo è la proporzione di pazienti con un risultato negativo al test che in realtà sono sani.

Sensibilità, specificità e valore predittivo

VPN = valore predittivo negativo; VPP = valore predittivo positivo.

Pertanto, se 8 risultati su 10 negativi sono corretti (vero negativo), il valore predittivo negativo è dell'80%. Poiché non tutti i risultati negativi sono veri negativi, alcuni pazienti con un test negativo in realtà hanno la malattia. Il VPN descrive la probabilità che un risultato negativo del test in una data popolazione rappresenti una vera negatività.

Calcolatore Clinico

Rapporti di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza)

A differenza dei valori di sensibilità e specificità, che non si applicano alle specifiche probabilità dei pazienti, il LR (likelihood ratio, rapporto di verosimiglianza) consente ai medici di interpretare i risultati dei test in un determinato paziente a condizione che vi sia una nota (anche se spesso solo stimata) probabilità pre-test di malattia.

Il rapporto di verosimiglianza (likelihood ratio, LR) descrive la variazione della probabilità pre-test della malattia quando il risultato del test è noto e risponde alla domanda

Quanto è cambiata la probabilità post-test rispetto alla probabilità pre-test ora che il risultato del test è noto?

Molti test clinici sono dicotomici; o sono al di sopra (positivo) o al di sotto (negativo) del valore limite e ci sono, quindi, solo 2 risultati possibili. Altri test danno risultati che sono continui o si verificano entro un intervallo in cui vengono selezionati molteplici valori limite. L'effettiva probabilità post-test dipende dalla grandezza del LR (likelihood ratio, rapporto di verosimiglianza) (che dipende dalle caratteristiche operative del test) e dalla stima della probabilità pre-test della malattia. Quando il test utilizzato è dicotomico, e il suo risultato può quindi essere solo positivo o negativo, la sensibilità e la specificità possono essere utilizzate per calcolare LR positivo (LR+) o LR negativo (LR-).

LR+: (likelihood ratio, rapporto di verosimiglianza) il rapporto tra la probabilità che un test risulti positivo in pazienti con malattia (vero positivo) e la probabilità che un test risulti positivo in pazienti senza malattia (falso positivo)
LR-: (likelihood ratio, rapporto di verosimiglianza) il rapporto tra la probabilità che un test risulti negativo in pazienti con la malattia (falso negativo) e la probabilità che un test risulti negativo in pazienti sani (vero negativo)

Quando il risultato è continuo o ha molteplici valori limite, è la curva ROC (receiver operating characteristic) a essere utilizzata, e non la sensibilità e specificità, al fine di calcolare un LR che viene più descritto come LR+ o LR-.

Poiché il LR (likelihood ratio, rapporto di verosimiglianza) è un rapporto di eventi mutuamente esclusivi, piuttosto che una percentuale di un totale, esso rappresenta un odds piuttosto che una probabilità. Per un dato test, il LR (likelihood ratio, rapporto di verosimiglianza) è diverso per risultati positivi e negativi.

Per esempio, per un dato risultato positivo, un LR (likelihood ratio, rapporto di verosimiglianza) di 2,0 indica che l'odds è uguale a 2:1 (veri positivi:falsi positivi) che un test positivo rappresenti un paziente con la malattia. Di 3 test positivi, 2 si verificano in pazienti con malattia (veri positivi) e 1 si verifica in un paziente senza malattia (falsi positivi). Dato che i veri positivi e i falsi positivi sono componenti dei calcoli di sensibilità e specificità, il LR+ (likelihood ratio, rapporto di verosimiglianza) può anche essere calcolato come sensibilità/(1 − specificità). Più grande è il LR+ (likelihood ratio, rapporto di verosimiglianza), maggiore è la quantità di informazioni fornite dal risultato positivo di un test; un risultato positivo in un test con LR+ > 10 è da considerarsi una forte evidenza in favore di una diagnosi. In altre parole, la probabilità pre-test tende fortemente al 100% quando un test positivo ha un elevato LR+ (likelihood ratio, rapporto di verosimiglianza).

Per un risultato negativo, un LR- (likelihood ratio, rapporto di verosimiglianza) di 0,25 indica che l'odds è uguale a 1:4 (falsi negativi:veri negativi) che un test negativo rappresenti un paziente malato. Di 5 test negativi, 1 si verifica in un paziente con malattia (falso negativo) e 4 si verificano in pazienti senza malattia (veri negativi). Il LR- (likelihood ratio, rapporto di verosimiglianza) può anche essere calcolato come (1 −sensibilità)/specificità. Più piccolo è il LR- (likelihood ratio, rapporto di verosimiglianza), maggiore è la quantità di informazioni fornite dal risultato negativo di un test; un risultato negativo di un test con un LR < 0,1 è da considerarsi una forte evidenza contro una determinata diagnosi. In altre parole, la stima della probabilità pre-test tende fortemente allo 0% quando un test negativo ha un basso LR- (likelihood ratio, rapporto di verosimiglianza).

I test con LR (likelihood ratio, rapporto di verosimiglianza) di 1,0 non forniscono alcuna informazione e non possono influire sulla probabilità post-test di malattia.

I LR (likelihood ratio, rapporto di verosimiglianza) sono utili per confrontare i test e sono utilizzati anche nell'analisi bayesiana per interpretare i risultati dei test. I LR (likelihood ratio, rapporto di verosimiglianza) variano al modificarsi del valore limite, esattamente come la sensibilità e la specificità. Per esempio, un valore limite alto, per la conta leucocitaria (p. es., 30 000/mcL) in un caso di appendicite acuta con perforazione, è più specifico e avrebbe un elevato LR+ (likelihood ratio, rapporto di verosimiglianza) ma anche un elevato (e quindi non molto utile) LR-; la scelta di un valore limite più basso e molto sensibile (p. es., 12 000/mcL) comporterebbe, invece, un basso LR- ma anche un più basso LR+.

Calcolatore Clinico

Test dicotomici

Un test dicotomico ideale non ha falsi positivi o falsi negativi; tutti i pazienti con test positivo devono avere la malattia (100% valore predittivo positivo), e tutti i pazienti con test negativo devono non averla (100% valore predittivo negativo).

In realtà, tutti i test presentano falsi positivi e falsi negativi, e alcuni più di altri. Per illustrare le conseguenze dell'imperfezione di sensibilità e specificità sui risultati di un test, si consideri l'ipotetico risultato (vedi tabella ) di un test urinario all'esterasi leucocitaria su striscia reattiva delle urine in un gruppo di 1000 donne, 300 (30%) delle quali hanno un'infezione delle vie urinarie, come determinato dal test di riferimento cioè, l'esame colturale delle urine. Questo scenario presuppone, a scopo illustrativo, che il test con striscia reattiva delle urine abbia una sensibilità del 71% e una specificità dell'85%.

Sensibilità del 71% significa che solo 213 donne (71% di 300) con infezione delle vie urinarie avrebbero un test positivo. I restanti 87 avrebbero un risultato negativo. Specificità dell'85% significa che 595 donne (85% di 700) senza infezione delle vie urinarie avrebbero un risultato negativo. Le 105 rimanenti avrebbero un risultato positivo. Così, su 213 + 115 = 318 risultati positivi del test, solo 213 sarebbero corretti (213/318 = 67% valore predittivo positivo); un risultato positivo del test renderebbe quindi la diagnosi di infezione delle vie urinarie più probabilmente positiva che negativa, ma il risultato resterebbe incerto. Ci sarebbero anche 87 + 595 = 682 test negativi, di cui 595 corretti (595/682 = 87% valore predittivo negativo); ciò renderebbe la diagnosi di infezione delle vie urinarie molto meno probabile, ma ancora possibile; il 13% delle pazienti con un test negativo presenterebbe in realtà un'infezione delle vie urinarie.

Tabella

Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%

Tabella

Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%

Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%
Risultati	Malattia presente	Malattia assente	Totale pazienti
Test positivo	Vero positivo (VP) 213 pazienti (71% di 300)	Falso positivo (FP) 105 pazienti (700 −595)	318 pazienti con un test positivo
Test negativo	Falso negativo (FN) 87 pazienti (300 −213)	Vero negativo (VN) 595 pazienti (85% di 700)	682 pazienti con un test negativo
Totale pazienti	300 pazienti con infezione delle vie urinarie (presunte)	700 pazienti non affetti da infezione delle vie urinarie (presunte)	1000 pazienti
Valore predittivo positivo = veri positivi/(tutti i pazienti con un test positivo) = VP/(VP + FP) = 213/(213 + 105) = 67%. Valore predittivo negativo = veri negativi/(tutti i pazienti con un test negativo) = VN/(VN + FN) = 595/(595 + 87) = 87%. Rapporto di verosimiglianza positivo (LR+) (likelihood ratio, rapporto di verosimiglianza) = sensibilità/(1 − specificità) = 0,71/(1 − 0,85) = 4,73. Rapporto di verosimiglianza negativo (LR-) (likelihood ratio, rapporto di verosimiglianza) = (1 − sensibilità)/specificità = (1 − 0,71)/0,85 = 0,34.

Valore predittivo positivo = veri positivi/(tutti i pazienti con un test positivo) = VP/(VP + FP) = 213/(213 + 105) = 67%.

Valore predittivo negativo = veri negativi/(tutti i pazienti con un test negativo) = VN/(VN + FN) = 595/(595 + 87) = 87%.

Rapporto di verosimiglianza positivo (LR+) (likelihood ratio, rapporto di verosimiglianza) = sensibilità/(1 − specificità) = 0,71/(1 − 0,85) = 4,73.

Rapporto di verosimiglianza negativo (LR-) (likelihood ratio, rapporto di verosimiglianza) = (1 − sensibilità)/specificità = (1 − 0,71)/0,85 = 0,34.

Tuttavia, il valore predittivo positivo e valore predittivo negativo calcolati in questo gruppo di pazienti non possono essere utilizzati per interpretare i risultati del test stesso quando l'incidenza della malattia sottostante (pre-test o probabilità a priori) è differente. Notare gli effetti del cambiamento dell'incidenza della malattia al 5% (vedi tabella ). Adesso, la maggior parte dei risultati positivi è falsa, e il valore predittivo positivo è pari solo al 20%; un paziente con un test positivo ha, di fatto, una probabilità maggiore di non avere un'infezione delle vie urinarie. Tuttavia, il valore predittivo negativo è ora molto alto (98%); un risultato negativo esclude praticamente la diagnosi di infezione delle vie urinarie.

Tabella

Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 5%

Tabella

Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 5%

Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 5%
Risultati	Malattia presente	Malattia assente	Totale pazienti
Test positivo	Vero positivo (VP) 36 pazienti (71% di 50)	Falso positivo (FP) 144 pazienti (950 −806)	180 pazienti con un test positivo
Test negativo	Falso negativo (FN) 14 pazienti (50 −36)	Vero negativo (VN) 806 pazienti (85% di 950)	820 pazienti con un test negativo
Totale pazienti	50 pazienti con infezione delle vie urinarie (presunte)	950 pazienti non affetti da infezione delle vie urinarie (presunte)	1000 pazienti
Il valore predittivo positivo = veri positivi/(tutti quelli con un test positivo) = VP/(VP + FP) = 36/(36 + 144) = 20%. Valore predittivo negativo = veri negativi/(tutti quelli con un test negativo) = VN/(VN + FN) = 806/(806 + 14) = 98%. Rapporto di verosimiglianza positivo (LR+) (likelihood ratio, rapporto di verosimiglianza) = sensibilità/(1 − specificità) = 0,71/(1 − 0,85) = 4,73. Rapporto di verosimiglianza negativo (LR-) (likelihood ratio, rapporto di verosimiglianza) = (1 − sensibilità)/specificità = (1 − 0,71)/0,85 = 0,34.

Il valore predittivo positivo = veri positivi/(tutti quelli con un test positivo) = VP/(VP + FP) = 36/(36 + 144) = 20%.

Valore predittivo negativo = veri negativi/(tutti quelli con un test negativo) = VN/(VN + FN) = 806/(806 + 14) = 98%.

Rapporto di verosimiglianza positivo (LR+) (likelihood ratio, rapporto di verosimiglianza) = sensibilità/(1 − specificità) = 0,71/(1 − 0,85) = 4,73.

Rapporto di verosimiglianza negativo (LR-) (likelihood ratio, rapporto di verosimiglianza) = (1 − sensibilità)/specificità = (1 − 0,71)/0,85 = 0,34.

Si noti che in entrambe le coorti di pazienti, anche se il valore predittivo positivo e il valore predittivo negativo sono molto diversi, i LR (likelihood ratio, rapporto di verosimiglianza) non cambiano perché sono determinati solo dalla sensibilità e specificità del test.

Il risultato di un test non fornisce mai una diagnosi definitiva, ma solo una stima della probabilità di presenza o assenza di una malattia. Questa probabilità post-test (probabilità di malattia, dato un risultato del test specifico) varia notevolmente a seconda della probabilità pre-test della malattia così come della sensibilità e specificità del test (e quindi la sua LR, likelihood ratio, rapporto di verosimiglianza).

Calcolatore Clinico

Probabilità pre-test

La probabilità pre-test non è una misura precisa; essa si basa su quanto i segni e i sintomi clinici suggeriscano la malattia secondo il giudizio clinico, sugli elementi anamnestici che indicano la diagnosi e sull'incidenza della malattia in una determinata popolazione. Esistono molti sistemi di punteggio al fine di stimare la probabilità pre-test di malattia; assegnare dei punti sulla base della presenza di elementi clinici facilita molto il calcolo della scala a punteggio. Questi esempi illustrano l'importanza di una stima accurata della prevalenza pre-test, perché la prevalenza della malattia nella popolazione considerata influenza notevolmente l'utilità del test. Gli strumenti di stima della prevalenza validati e pubblicati devono essere utilizzati quando disponibili. Per esempio, vi sono dei criteri per stabilire la probabilità pre-test di embolia polmonare. Punteggi più alti indicano una probabilità stimata più elevata. In pratica, la determinazione della probabilità pre-test è facilitata da informazioni oggettive, ma può anche essere influenzata dall'abilità e dall'esperienza del medico.

Test continui

I risultati di molti test sono espressi come variabili continue e possono fornire utili informazioni cliniche su un'ampia gamma di risultati. I medici, spesso, selezionano un certo valore soglia per ottimizzare l'utilità dei test. Per esempio, una conta leucocitaria > 15 000/mcL può essere giudicata come positiva; valori < 15 000/mcL come negativa. Quando un test è caratterizzato da risultati continui ma viene stabilito un valore soglia, il test funzionerà come dicotomico. Può anche essere selezionato più di un valore soglia. Sensibilità, specificità, valore predittivo positivo, valore predittivo negativo, LR+ (likelihood ratio, rapporto di verosimiglianza) e LR- possono essere calcolati sia per un singolo che per più valori limite. La tabella illustra l'effetto della modifica del valore soglia per la conta leucocitaria nei pazienti con sospetto di appendicite.

Tabella

Effetto della modifica del valore soglia per la conta leucocitaria in pazienti con sospetto di appendicite

Tabella

Effetto della modifica del valore soglia per la conta leucocitaria in pazienti con sospetto di appendicite

Effetto della modifica del valore soglia per la conta leucocitaria in pazienti con sospetto di appendicite
Valore soglia dei globuli bianchi*	Sensibilità	Specificità	LR+ (likelihood ratio, rapporto di verosimiglianza)	LR- (likelihood ratio, rapporto di verosimiglianza)
> 10 500	84%	53,13%	1,79	0,3
> 11 500	78%	62,5%	2,13	0,32
> 12 850	68%	75%	2,72	0,43
> 13 400	61,33%	78,12%	2,86	0,45
> 14 300	56,67%	81,25%	3,2	0,49
*Vengono stabiliti più valori soglia per una variabile continua come la conta leucocitaria; i risultati al di sopra del valore limite sono considerati come positivi mentre quelli al di sotto come negativi. I valori elencati sono per microlitro di sangue.
LR = likelihood ratio, rapporto di verosimiglianza.
Adapted from Keskek M, Tez M, Yoldas O, et al: Receiver operating characteristic analysis of leukocyte counts in operations for suspected appendicitis. American Journal of Emergency Medicine 26:769–772, 2008.

*Vengono stabiliti più valori soglia per una variabile continua come la conta leucocitaria; i risultati al di sopra del valore limite sono considerati come positivi mentre quelli al di sotto come negativi. I valori elencati sono per microlitro di sangue.

LR = likelihood ratio, rapporto di verosimiglianza.

Adapted from Keskek M, Tez M, Yoldas O, et al: Receiver operating characteristic analysis of leukocyte counts in operations for suspected appendicitis. American Journal of Emergency Medicine 26:769–772, 2008.

In alternativa, si possono raggruppare in livelli i risultati continui di un test. In questo caso, i risultati non sono caratterizzati come positivi o negativi, perché ci sono più risultati possibili, così sebbene un LR (likelihood ratio, rapporto di verosimiglianza) possa essere determinato per ciascun livello di risultati, non c'è più un distinto LR+ o LR-. Per esempio, la tabella illustra la correlazione tra la conta leucocitaria e la batteriemia in bambini febbrili. Poiché il LR (likelihood ratio, rapporto di verosimiglianza) è il rapporto tra la probabilità di un dato risultato in pazienti malati diviso la probabilità di tale risultato in pazienti sani, il LR per ciascun raggruppamento di valori della conta leucocitaria è uguale alla probabilità di batteriemia in quel gruppo diviso la probabilità di assenza di batteriemia.

Tabella

Utilizzo dei gruppi della conta leucocitaria per determinare il rapporto di verosimiglianza della batteriemia nei bambini febbrili*

Tabella

Utilizzo dei gruppi della conta leucocitaria per determinare il rapporto di verosimiglianza della batteriemia nei bambini febbrili*

Utilizzo dei gruppi della conta leucocitaria per determinare il rapporto di verosimiglianza della batteriemia nei bambini febbrili*
Conta leucocitaria	Numero di bambini con batteriemia, n = 127 (%)	Numero di bambini senza batteriemia, N = 8629 (%)	LR (likelihood ratio, rapporto di verosimiglianza) (% con batteriemia/% senza batteriemia)
0–5000	0 (0,0%)	543 (6,3%)	0,00
5001-10 000	3 (2,4%)	3291 (38,1%)	0,06
10 001-15 000	15 (11,8%)	2767 (32,1%)	0,37
15 001-20 000	48 (37,8%)	1337 (15,5%)	2,4
20 001-25 000	34 (26,8%)	469 (5,4%)	4,9
25 001-30 000	12 (9,4%)	155 (1,8%)	5,3
> 30 001	15 (11,8%)	67 (0,8%)	15,2
* Incidenza di batteriemia in 8756 bambini febbrili raggruppati per conta leucocitaria (i valori elencati sono per microlitro di sangue). Il LR (likelihood ratio, rapporto di verosimiglianza) per ciascun gruppo viene calcolato dividendo la probabilità di batteriemia per la probabilità di assenza di batteriemia.
LR = likelihood ratio, rapporto di verosimiglianza.
Adapted from Lee GM, Harper MB: Risk of bacteremia for febrile young children in the post-Haemophilus influenzae type b era. Archives of Pediatric and Adolescent Medicine 152:624–628, 1998.

* Incidenza di batteriemia in 8756 bambini febbrili raggruppati per conta leucocitaria (i valori elencati sono per microlitro di sangue). Il LR (likelihood ratio, rapporto di verosimiglianza) per ciascun gruppo viene calcolato dividendo la probabilità di batteriemia per la probabilità di assenza di batteriemia.

LR = likelihood ratio, rapporto di verosimiglianza.

Adapted from Lee GM, Harper MB: Risk of bacteremia for febrile young children in the post-Haemophilus influenzae type b era. Archives of Pediatric and Adolescent Medicine 152:624–628, 1998.

Il raggruppamento delle variabili continue consente un utilizzo più ampio del risultato del test rispetto a quando vi è un unico valore soglia stabilito. Utilizzando le analisi bayesiane, i rapporti di verosimiglianza riportati nella tabella possono essere utilizzati per calcolare la probabilità post-test.

Per i risultati di test continui, se è nota una curva ROC (receiver operating characteristic), non sono necessari calcoli, come mostrato nella ; i LR (likelihood ratio, rapporto di verosimiglianza) possono essere calcolati, per vari punti, all'interno della gamma dei risultati possibili utilizzando la pendenza della curva ROC (receiver operating characteristic) nel punto desiderato.

Teorema di Bayes

L'utilizzo della probabilità pre-test della malattia e delle caratteristiche del test, per calcolare la probabilità post-test, è definito teorema di Bayes o revisione bayesiana. Nell'uso clinico routinario, la metodologia bayesiana si manifesta tipicamente sotto diverse forme:

Formulazione di odds-verosimiglianza (calcolo o nomogramma)
Approccio tabellare

Calcolo degli odds-verosimiglianza

Dato che il LR (likelihood ratio, rapporto di verosimiglianza) di un test, in realtà, è un odds, se la probabilità pre-test di malattia è espressa come il suo odds, il prodotto dei 2 rappresenta l'odds post-test della malattia (analogamente a quanto avviene quando si moltiplicano 2 probabilità per calcolare la probabilità del verificarsi simultaneo di 2 eventi):

Odds pre-test × LR (likelihood ratio, rapporto di verosimiglianza) = odds post-test

Dato che i medici di solito ragionano in termini di probabilità piuttosto che di odds, la probabilità può essere convertita in odds (e viceversa) con queste formule:

Odd = probabilità/1 − probabilità

Probabilità = odds/odds + 1

Si consideri l'esempio delle infezioni delle vie urinarie come indicato nella tabella , in cui la probabilità pre-test di malattia è 0,3, e il test utilizzato ha un LR+ (likelihood ratio, rapporto di verosimiglianza) di 4,73 e un LR- di 0,34. Una probabilità pre-test di 0,3 corrisponde a un odds di 0,3/(1 − 0,3) = 0,43. Così, l'odds post-test che sia presente un'infezione delle vie urinarie in una paziente con un test positivo è uguale al prodotto dell'odds pre-test e del LR+; 4,73 × 0,43 = 2,03, che è uguale a una probabilità post-test di 2,03/(1 + 2,03) = 0,67. Pertanto, i calcoli bayesiani mostrano che un risultato positivo aumenta la probabilità pre-test dal 30 al 67%, un risultato uguale a quello ottenuto nel calcolo del valore predittivo positivo nella tabella.

Un calcolo simile può essere effettuato per un test negativo; odds post-test = 0,34 × 0,43 = 0,15, corrispondente a una probabilità di 0,15/(1 + 0,15) = 0,13. Quindi, un risultato negativo diminuisce la probabilità pre-test dal 30 al 13%, di nuovo lo stesso risultato ottenuto nel calcolo del valore predittivo negativo nella tabella.

Sono disponibili molti programmi di calcolo per medici, su dispositivi portatili, per calcolare la probabilità post-test partendo dalla probabilità pre-test e dai LR (likelihood ratio, rapporto di verosimiglianza).

Calcolatore Clinico

Nomogramma odds-verosimiglianza

Utilizzare un nomogramma è particolarmente conveniente perché evita di convertire gli odds in probabilità o di creare tabelle 2×2.

Per utilizzare il , si traccia una linea a partire dalla probabilità pre-test attraverso il LR. La probabilità post-test è il punto in cui questa linea interseca quella della probabilità post-test. Linee illustrative sono tracciate utilizzando i dati del test delle infezioni delle vie urinarie nella tabella . La linea A rappresenta un risultato positivo; parte da una probabilità pre-test di 0,3 attraversa il LR+ (likelihood ratio, rapporto di verosimiglianza) di 4,73 e dà un valore post-test < 0,7, simile alla probabilità calcolata di 0,67. La linea B rappresenta, invece, un risultato negativo; essa parte da una probabilità pre-test di 0,3, attraversa la LR- (likelihood ratio, rapporto di verosimiglianza) di 0,34 e dà un valore post-test leggermente > 0,1, simile alla probabilità calcolata del 13%.

Sebbene il nomogramma appaia meno preciso dei calcoli, spesso alcuni valori tipici di probabilità pre-test sono solo stime; in tal modo, l'apparente precisione dei calcoli risulta fuorviante.

Nomogramma di Fagan

Linee illustrative sono tracciate utilizzando i dati del test delle infezioni delle vie urinarie nella tabella Distribuzione dei risultati dei test di un ipotetico test di esterasi leucocitaria in una coorte di 1000 donne con una prevalenza di infezioni del tratto urinario del 30%. La linea A rappresenta un risultato positivo, ed è tracciata da una probabilità pre-test di 0,3 attraverso un LR+ (likelihood ratio, rapporto di verosimiglianza) del 4,73 fino a un valore post-test di poco < 0,7, simile alla probabilità calcolata di 0,67. La linea B rappresenta un risultato negativo, ed è tracciata da una probabilità pre-test di 0,3 attraverso un LR- (likelihood ratio, rapporto di verosimiglianza) di 0,34 a un valore post-test leggermente > 0,1, simile alla probabilità calcolata del 13%.

LR+ = rapporto di verosimiglianza per un risultato positivo (likelihood ratio, rapporto di verosimiglianza); LR- = rapporto di verosimiglianza per un risultato negativo.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Approccio tabellare

Spesso, i LR (likelihood ratio, rapporto di verosimiglianza) di un test non sono noti, ma la sensibilità e la specificità si, e la probabilità pre-test può essere stimata. In questo caso, la metodologia bayesiana può essere eseguita utilizzando una tabella 2×2 illustrata nella tabella utilizzando l'esempio dalla tabella . Si noti che questo metodo mostra che un risultato positivo incrementa la probabilità di infezione delle vie urinarie al 67%, e un risultato negativo diminuisce tale probabilità al 13%, come già sottolineato, gli stessi risultati vengono ottenuti dai calcoli che sfruttano i LR (likelihood ratio, rapporto di verosimiglianza).

Tabella

Interpretazione del risultato di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne assumendo una prevalenza di infezioni delle vie urinarie del 30% (probabilità pre-test), una sensibilità del test pari al 71% e una specificità pari all'85%*

Tabella

Interpretazione del risultato di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne assumendo una prevalenza di infezioni delle vie urinarie del 30% (probabilità pre-test), una sensibilità del test pari al 71% e una specificità pari all'85%*

Interpretazione del risultato di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne assumendo una prevalenza di infezioni delle vie urinarie del 30% (probabilità pre-test), una sensibilità del test pari al 71% e una specificità pari all'85%*
Risultati	Infezione delle vie urinarie presente	Infezione delle vie urinarie assente
Risultati	300 pazienti con infezioni delle vie urinarie	700 pazienti non affetti da infezioni delle vie urinarie
Test positivo all'esterasi leucocitaria	213 pazienti (VP)	105 pazienti (FP)
Test negativo all'esterasi leucocitaria	87 pazienti (FN)	595 pazienti (VN)
* Il teorema di Bayes può essere semplificato per consentire il calcolo della probabilità post-test quando la probabilità pre-test è nota: Probabilità post-test quando il test è positivo = VP(tutti con un test positivo) = VP/(VP + FP) = 213/(213 + 105) = 67%. Probabilità post-test quando il test è negativo = veri negativi TN/(tutti quelli con un test negativo) = FN/(FN + TN) = 87/(87 + 595) = 13%.
FN = falso negativo; FP = falso positivo; TN = vero (true) negativo; TP = vero (true) positivo.

* Il teorema di Bayes può essere semplificato per consentire il calcolo della probabilità post-test quando la probabilità pre-test è nota:

Probabilità post-test quando il test è positivo = VP(tutti con un test positivo) = VP/(VP + FP) = 213/(213 + 105) = 67%.
Probabilità post-test quando il test è negativo = veri negativi TN/(tutti quelli con un test negativo) = FN/(FN + TN) = 87/(87 + 595) = 13%.

FN = falso negativo; FP = falso positivo; TN = vero (true) negativo; TP = vero (true) positivo.

Test sequenziale

I medici spesso eseguono dei test in sequenza durante le valutazioni diagnostiche. Se gli odds pre-test e i LR (likelihood ratio, rapporto di verosimiglianza) sono noti per ciascun test prima dell'esecuzione in sequenza dei test stessi, l'odds post-test può essere calcolato utilizzando la formula seguente:

Odds pre-test × LR1 × LR2 × LR3 = odds post-test

Questo metodo è limitato dal fondamentale presupposto che ciascuno dei test sia condizionalmente indipendente dagli altri.

Test di screening

I pazienti spesso devono considerare se essere sottoposti a esami di screening per una malattia occulta. Le premesse concettuali di uno screening di successo si basano sul fatto che la diagnosi precoce della malattia può migliorare una prognosi clinicamente significativa dei pazienti con malattia occulta e che i falsi positivi, che possono verificarsi, non comportano delle conseguenze (p. es., costi, effetti avversi dei test di conferma, ansia provocata dai test, trattamenti ingiustificati) eccedenti i benefici della diagnosi precoce. Per ridurre al minimo tali possibili conseguenze, i medici devono scegliere il test di screening più appropriato. Lo screening può non essere appropriato quando i trattamenti o le misure preventive sono inefficaci, a meno che la diagnosi non possa influenzare le decisioni di vita futura del paziente o della loro famiglia. Se la malattia è molto rara, a meno che non si possa identificare una sottopopolazione in cui la prevalenza è maggiore, lo screening può non essere conveniente; ci sono eccezioni, come in diverse malattie genetiche che possono essere diagnosticate e trattate nel neonato.

Teoricamente, il test migliore, sia per lo screening che per la diagnosi, è quello con la più alta sensibilità e specificità. Tuttavia, tali test altamente accurati sono spesso complessi, costosi e invasivi (p. es., coronarografia) e pertanto non sono pratici per lo screening di un gran numero di persone asintomatiche. Generalmente, quando si seleziona un test di screening, deve essere trovato qualche compromesso tra sensibilità e specificità.

L'utilizzo di un test che ha maggiore sensibilità o specificità dipende dalle conseguenze di un risultato falsamente positivo o negativo così come dalla probabilità pre-test della malattia. Un test di screening ideale è quello che risulta sempre positivo in quasi tutti i pazienti con malattia, in modo che un risultato negativo escluda con sicurezza la malattia nei pazienti sani. Per esempio, nei test per una grave malattia per cui è disponibile un trattamento efficace (p. es., coronaropatia), si preferisce tollerare più falsi positivi rispetto ai falsi negativi (alta sensibilità e bassa specificità). Sebbene un'elevata sensibilità sia una caratteristica molto importante per un test di screening, anche la specificità è importante in certe strategie di screening. In popolazioni con una più alta prevalenza di malattia, il valore predittivo positivo di un test di screening aumenta; con la riduzione della prevalenza, la probabilità post-test, o a posteriori, di un risultato positivo diminuisce. Pertanto, nello screening per una patologia nelle popolazioni ad alto rischio, sono da preferirsi i test con maggiore sensibilità rispetto a quelli con più alta specificità, in quanto più adatti per escludere la malattia. Di converso, nelle popolazioni a basso rischio o nello screening per malattie poco comuni per cui la terapia è caratterizzata da un beneficio più basso e/o da rischio più alto, sono da preferirsi i test con una specificità più alta.

Test di screening multipli

Con la continua disponibilità di nuovi test di screening, i medici devono prendere in considerazione le implicazioni di una batteria di tali test. Per esempio, batterie di test contenenti 8, 12, o 20 esami del sangue vengono spesso effettuati quando un paziente viene ricoverato in ospedale o viene visitato per la prima volta da un medico che non lo conosce. Sebbene questo tipo di test possa essere utile nello screening di pazienti per alcune malattie, l'utilizzo di ampie batterie di test ha conseguenze potenzialmente negative. Per definizione, un test con una specificità del 95% dà risultati falsamente positivi nel 5% dei pazienti sani. Eseguendo 2 test di screening con queste caratteristiche, ciascuno per una malattia occulta diversa, in un paziente che in realtà non ne ha nessuna, la probabilità che entrambi i test siano negativi è del 95% × 95% o circa 90%; inoltre, ci sarebbe un 10% di probabilità di ottenere almeno un risultato falsamente positivo. Per 3 test, la possibilità che tutti e 3 siano negativi è del 95% × 95% ×95%, o 86%, corrispondente a una probabilità del 14% di ottenere almeno un falso positivo. Se si effettuano 12 diversi test per 12 diverse malattie, la possibilità di ottenere almeno un falso positivo è del 46%. Questa alta probabilità sottolinea la necessità di cautela nel decidere di richiedere una serie di test di screening e nell'interpretazione dei risultati.

Lo stesso principio si applica quando si ordinano molti test sensibili ma non specifici (p. es., "sierologie autoimmuni" tra cui anticorpi antinucleo (ANA), ribonucleoproteina antinucleo [anti-RNP], fattore reumatoide) per la valutazione di pazienti con sintomi non localizzanti e non specifici di lunga data, come stanchezza e dolore generalizzato in assenza di reperti fisici o di caratteristiche storiche che suggeriscano una diagnosi reumatologica più specifica.

Soglie per l'esecuzione di test

Un test di laboratorio deve essere effettuato solo se il suo risultato influirà sulla gestione clinica; in caso contrario la spesa e il rischio per il paziente sono vani. I medici, a volte, possono valutare quando eseguire un test confrontando le stime di probabilità pre-test e post-test rispetto a determinati valori soglia. Al di sopra di un certo valore limite di probabilità, i benefici della terapia superano i rischi (compreso il rischio di errato trattamento di un paziente senza malattia); di conseguenza, il trattamento risulta indicato. Questo punto è definito come soglia di trattamento ed è determinato come descritto nelle Strategie decisionali cliniche: stime di probabilità e soglia di trattamento. Per definizione, il test non è necessario quando la probabilità pre-test è già al di sopra della soglia di trattamento. Quando la probabilità pre-test è, invece, al di sotto della soglia di trattamento, l'esecuzione del test risulta indicata fino a quando un risultato positivo potrebbe aumentare la probabilità post-test al di sopra della soglia di trattamento. La più bassa probabilità pre-test a cui ciò può verificarsi dipende dalle caratteristiche del test (p. es., lR+) e viene definita soglia per l'esecuzione di un test.

Teoricamente, se il test migliore per una grave malattia ha un basso LR+ (likelihood ratio, rapporto di verosimiglianza), e la soglia di trattamento è alta, risulta dunque che un risultato positivo non può spostare la probabilità post-test al di sopra della soglia di trattamento in un paziente con una bassa, ma preoccupante, probabilità pre-test (p. es., 10% o 20%).

Come esempio numerico, consideriamo il caso precedentemente descritto di un possibile infarto del miocardio acuto in cui l'equilibrio tra rischio e beneficio determina una soglia di trattamento del 25%. Quando la probabilità di infarto del miocardio supera il 25%, viene somministrata la terapia trombolitica. Quando è necessario eseguire un ecocardiogramma rapido prima di dare la terapia trombolitica? Si suppone, per l'ecocardiografia, una sensibilità ipotetica del 60% e una specificità del 70% nella diagnosi di infarto del miocardio; queste percentuali corrispondono a un LR+ (likelihood ratio, rapporto di verosimiglianza) di 60/(100 − 70) = 2 e un LR- di (100 − 60)/70 = 0,57.

La questione può essere affrontata matematicamente (odds pre-test × LR = odds post-test) o graficamente, in modo più intuitivo, utilizzando il . Nel nomogramma, una linea collega la soglia di trattamento (25%) sulla linea della probabilità post-test, attraversa la linea centrale a livello di LR+ (2,0) e interseca una probabilità pre-test di circa 0,14. Ovviamente, un test positivo in un paziente con una probabilità pre-test < 14%, risulterebbe ancora in una probabilità post-test inferiore alla soglia di trattamento. In questo caso, l'ecocardiografia sarebbe inutile, perché persino un risultato positivo non porterebbe a una giustificazione, almeno teorica, del trattamento; di conseguenza, una probabilità pre-test del 14% risulta essere la soglia di esecuzione per questo particolare test (vedi figura ). Un altro test con un diverso LR+ (likelihood ratio, rapporto di verosimiglianza) avrebbe una soglia diversa.

Utilizzo del nomogramma di Fagan per determinare la necessità del test

In questo esempio, si suppone una soglia di trattamento del 25% per un paziente con un infarto del miocardio acuto. Quando la probabilità di infarto del miocardio supera il 25%, viene somministrata la terapia trombolitica. I medici possono utilizzare il nomogramma Fagan per determinare quando eseguire un'ecocardiografia rapida prima di somministrare la terapia trombolitica. Supponendo che l'ecocardiografia abbia una sensibilità ipotetica del 60% e una specificità del 70% per un nuovo infarto del miocardio, tali percentuali corrispondono a un rapporto di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza) per un test positivo (LR+) di 60/(100 − 70) = 2. Una linea parte da una soglia di trattamento del 25% sulla linea delle probabilità post-test, interseca un LR+ (2,0) sulla linea centrale e termina su una probabilità pre-test di circa 0,14. Un risultato positivo, in un paziente con una probabilità pre-test di < 14%, risulterebbe ancora in una probabilità post-test inferiore alla soglia di trattamento.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Utilizzo del nomogramma di Fagan per determinare la necessità del test

Descrizione delle soglie per l'esecuzione di test e di trattamento

La linea orizzontale rappresenta la probabilità post-test.

Poiché il 14% rappresenta ancora un rischio significativo di infarto del miocardio, è chiaro che una probabilità di malattia al di sotto della soglia per il test (p. es., un 10% di probabilità pre-test) non significa necessariamente che la malattia sia esclusa, ma soltanto che un risultato positivo del test non cambierebbe la gestione clinica e, quindi, che la prova non è indicata. In questa situazione, il medico deve tenere in osservazione il paziente per rilevare, eventualmente, altri elementi clinici che potrebbero elevare la probabilità pre-test al di sopra della soglia del test. In pratica, poiché sono spesso disponibili più test per una determinata malattia, potrebbero essere effettuati dei test in sequenza.

Questo esempio considera un test che di per sé non presenta rischi per il paziente. Se un test è gravato da gravi rischi (p. es., cateterismo cardiaco), la soglia per la sua esecuzione deve essere più elevata; i calcoli quantitativi possono essere effettuati, ma sono complessi. Pertanto, l'effetto della riduzione della sensibilità e della specificità di un test o dell'aumento dei rischi connessi è quello di restringere il range di probabilità della malattia al di sopra del quale l'esecuzione del test risulta la strategia migliore. Migliorando la capacità discriminativa di un test, o facendo diminuire il suo rischio, si aumenterà il range di probabilità al di sopra del quale il test risulta essere giustificato.

Una possibile eccezione al non effettuare un test nel caso in cui la probabilità pre-test sia al di sotto della soglia per l'esecuzione (ma è ancora preoccupante) si può verificare nel caso in cui un risultato negativo possa ridurre la probabilità post-test al di sotto del punto in cui la malattia può essere considerata esclusa. Questa determinazione richiede un giudizio soggettivo sia del grado di certezza necessario per dire che una malattia è esclusa, sia dei rischi connessi all'esecuzione dei test, dato che le probabilità coinvolte sono basse.

Test your KnowledgeTake a Quiz!