Manuale Msd

Please confirm that you are a health care professional

Caricamento in corso

Capire i test medici e i risultati dei test

Di

Douglas L. McGee

, DO,

  • Emergency Medicine Residency Program, Albert Einstein Medical Center
  • Albert Einsterin Healthcare Network

Ultima modifica dei contenuti nov 2018
Clicca qui per l’educazione dei pazienti
Risorse sull’argomento



I risultati dei test possono aiutare a fare una diagnosi in pazienti sintomatici (test diagnostici) o a identificare una malattia occulta in pazienti asintomatici (screening). Tuttavia, i risultati dei test possono interferire con le decisioni cliniche se i test distinguono malamente i pazienti con la malattia da quelli senza malattia, se i risultati dei test non sono compatibili con il quadro clinico o se i risultati dei test sono integrati impropriamente nel contesto medico.

I test di laboratorio sono imperfetti e possono identificare erroneamente le persone sane come malate (un falso positivo) o possono erroneamente identificare come sani alcuni pazienti malati (un falso-negativo). La capacità di un esame di identificare correttamente i pazienti con una malattia dipende dalle probabilità che ha un soggetto di avere quella patologia (probabilità a priori) e dalle caratteristiche operative intrinseche del test stesso.

Sebbene i test diagnostici siano spesso un fattore critico per il processo decisionale clinico, essi possono avere delle conseguenze indesiderate o non intenzionali. Il test deve essere effettuato con attenta considerazione, con uno scopo, e con l'aspettativa che il suo risultato riduca l'ambiguità dei problemi del paziente e contribuisca alla sua salute. Oltre al rischio di fornire informazioni errate (e quindi di ritardare l'inizio del trattamento o di indurre trattamenti non necessari), gli esami di laboratorio consumano le già limitate risorse e possono essi stessi avere effetti avversi (p. es., pneumotorace causato da biopsia polmonare) o possono richiedere ulteriori esami inutili.

Definire un risultato positivo di un test

Tra i test più diffusi ci sono quelli che forniscono risultati lungo una scala quantitativa continua (p. es., glicemia, conta leucocitaria). Tali test possono fornire utili informazioni cliniche su un ampio range di valori, ma i medici spesso li usano per diagnosticare una condizione richiedendo che il risultato sia classificato come positivo o negativo (ossia, malattia presente o assente) in base al confronto con un criterio prestabilito o punto limite. Tali punti limite sono generalmente selezionati sulla base di analisi statistiche e teoriche che tentano di bilanciare il tasso di falsi positivi (che richiedono prove inutili, costose, e possono consistere in test o trattamenti pericolosi) e quello di falsi negativi (mancata diagnosi di una malattia curabile). L'individuazione di un punto limite dipende anche dall'avere un metodo di riferimento per l'identificazione della malattia in questione.

In genere, gli esiti delle prove quantitative (p. es., conta leucocitaria nei casi di sospetta appendicite) seguono un certo tipo di curva di distribuzione (non necessariamente una curva normale, anche se comunemente raffigurata come tale). La distribuzione dei risultati dei test per i pazienti con malattia è centrata su un punto diverso da quello per i pazienti sani. Alcuni pazienti con malattia hanno un risultato molto alto o molto basso, ma la maggior parte ha un risultato centrato su un valore medio. Al contrario, alcuni pazienti senza malattia hanno un risultato molto alto o molto basso, ma la maggior parte ha un risultato centrato su una media diversa da quella dei pazienti con la malattia. Per la maggior parte dei test, le distribuzioni si sovrappongono in maniera tale che molti dei possibili risultati del test si verificano in pazienti con e senza malattia; tali risultati sono illustrati più chiaramente quando le curve vengono riportate sullo stesso grafico (vedi figura Distribuzioni dei risultati del test). Alcuni pazienti con dei risultati al di sopra e al di sotto del punto soglia selezionato saranno classificati in modo errato. La regolazione di un punto soglia per identificare più pazienti con malattia (aumentare la sensibilità del test) aumenta anche il numero di falsi positivi (scarsa specificità), mentre spostando il punto soglia nella direzione opposta per evitare la falsa diagnosi di malattia, aumenta il numero di falsi negativi. Ciascun punto soglia è associato a una specifica probabilità di risultati veri positivi e falsi positivi.

Distribuzioni dei risultati del test

I pazienti con la malattia sono mostrati nella distribuzione superiore; i pazienti sani sono mostrati nella distribuzione inferiore. Per i pazienti con malattia, la regione sotto la distribuzione dei risultati che si trova a destra (sopra) rispetto al valore del punto limite corrisponde alla percentuale dei veri positivi (ossia, la sua sensibilità); l'area che si trova al di sotto a sinistra del valore limite corrisponde alla percentuale di falsi negativi. Per i pazienti sani, la regione a destra del valore del punto limite corrisponde alla percentuale di falsi positivi, e la regione a sinistra corrisponde invece alla percentuale di veri negativi (ossia, la sua specificità). Per le 2 parti sovrapposte delle distribuzioni (p. es., pazienti con e senza malattia), la variazione della linea del valore limite influenza la sensibilità e la specificità, ma in direzioni opposte; cambiando il valore limite da 1 a 2 si riduce il numero di falsi negativi (maggiore sensibilità), ma aumenta anche il numero di falsi positivi (minore specificità).

Distribuzioni dei risultati del test

Curve ROC (receiver operating characteristic)

Riportando graficamente la frazione di veri positivi (numero di veri positivi/numero di malattie) contro la frazione di falsi positivi (numero di falsi positivi/numero senza malattia) per una serie di valori soglia si crea ciò che è noto come una curva ROC (receiver operating characteristic). La curva ROC (receiver operating characteristic) rappresenta graficamente la relazione funzionale tra la sensibilità e la specificità al variare del valore limite (vedi figura Tipica curva ROC (receiver operating characteristic)). Per convenzione, la frazione di veri positivi viene effettuata sull'asse y, e la frazione di falsi positivi viene effettuata sull'asse x. Maggiore è l'area sotto la curva ROC (receiver operating characteristic), migliore è la capacità di un test di discriminare tra pazienti con o senza malattia.

Le curve ROC (receiver operating characteristic) permettono di confrontare i test su una varietà di valori limite. Nell'esempio, il test A rende meglio del test B su tutte le gamme. Le curve ROC (receiver operating characteristic) facilitano anche la scelta del punto soglia progettato per ottimizzare l'utilità di un test. Se un test è progettato per confermare una malattia verrà selezionato un punto limite con maggiore specificità e minore sensibilità. Se il test è stato progettato per lo screening per una malattia occulta, verrà selezionato un punto soglia con una maggiore sensibilità e una minore specificità.

Tipica curva ROC (receiver operating characteristic)

Tipica curva ROC (receiver operating characteristic)

Caratteristiche

Alcune variabili cliniche hanno solo 2 possibili risultati (p. es., vivo/morto, incinta/non incinta); tali variabili sono chiamate categoriali e dicotomiche. Altri risultati categoriali possono avere molti valori discreti (p. es., gruppo sanguigno, scala del coma di Glasgow) e sono chiamati nominali o ordinali. Le variabili nominali, come il gruppo sanguigno, non hanno un ordine particolare. Variabili ordinali come la scala del coma di Glasgow hanno, invece, valori discreti disposti in un ordine particolare. Altre variabili cliniche, tra cui molti test diagnostici comuni, sono continue e hanno un numero infinito di possibili risultati (p. es., conta leucocitaria, glicemia). Molti medici selezionano un valore soglia in modo tale da considerare una variabile continua come dicotomica (p. es., pazienti con una glicemia a digiuno > 126 mg/dL [7,0 mmol/L] sono da considerare come diabetici). Altri esami diagnostici continui presentano utilità diagnostica quando hanno molteplici valori soglia o quando gli intervalli di risultati hanno differente valore diagnostico.

Quando i risultati dei test possono essere definiti come positivi o negativi, tutti i possibili risultati possono essere registrati in una semplice tabella 2 × 2 (vedi tabella Distribuzione degli ipotetici risultati dei test) da cui possono essere calcolate importanti caratteristiche dei test discriminativi, tra cui sensibilità, specificità, valore predittivo positivo e negativo e rapporto di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza) (vedi tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%).

Tabella
icon

Distribuzione degli ipotetici risultati dei test

Risultati

Malattia presente

Malattia assente

Test positivo

Vero positivo

Falso-positivo

Test negativo

Falso-negativo

Vero negativo

Totale pazienti

Tutti i pazienti con malattia

Tutti i pazienti sani

Sensibilità, specificità e valore predittivo

I valori di sensibilità, specificità e i valori predittivi sono in genere considerati caratteristiche del test stesso, indipendenti dalla popolazione dei pazienti.

  • La sensibilità è la probabilità di un test positivo nei pazienti malati (percentuale di veri positivi)

Pertanto un test che è positivo in 8 pazienti malati su 10 complessivi ha una sensibilità di 0,8 (espressa anche come 80%). La sensibilità valuta la capacità del test di individuare la malattia; un test con bassa sensibilità non identifica molti pazienti con la malattia, e un test con sensibilità elevata è utile per escludere una diagnosi quando i risultati sono negativi. La sensibilità è complementare alla percentuale di falsi negativi (ossia, percentuale di falsi negativi più sensibilità = 100%).

  • La specificità è la probabilità di un test negativo nell'individuo sano (percentuale di veri negativi)

Pertanto, un test che è negativo in 9 su 10 pazienti sani ha una specificità di 0,9 (o 90%). La specificità rappresenta quanto correttamente un test identifica i pazienti con malattia in quanto i test ad alta specificità hanno un basso tasso di falsi positivi. Un test con bassa specificità descrive come malati molti pazienti sani. È, inoltre, complementare alla percentuale di falsi positivi.

  • Il valore predittivo positivo è la proporzione di pazienti con un test positivo che ha realmente la malattia

Pertanto, se 9 su 10 risultati positivi sono corretti (veri positivi), il valore predittivo positivo del test è del 90%. Poiché tutti i risultati positivi hanno numerosi veri positivi e falsi positivi, il valore predittivo positivo descrive la probabilità che un risultato positivo in una certa popolazione di pazienti rappresenti una vera positività.

  • Il valore predittivo negativo è la proporzione di pazienti con un risultato negativo al test che in realtà sono sani

Pertanto, se 8 risultati su 10 negativi sono corretti (vero negativo), il valore predittivo negativo è dell'80%. Poiché non tutti i risultati negativi sono veri negativi, alcuni pazienti con un test negativo in realtà hanno la malattia. Il VPN descrive la probabilità che un risultato negativo del test in una data popolazione rappresenti una vera negatività.

Rapporti di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza)

A differenza dei valori di sensibilità e specificità, che non si applicano alle specifiche probabilità dei pazienti, il LR (likelihood ratio, rapporto di verosimiglianza) consente ai medici di interpretare i risultati dei test in un determinato paziente a condizione che vi sia una nota (anche se spesso solo stimata) probabilità pretest di malattia.

Il LR (likelihood ratio, rapporto di verosimiglianza) descrive la variazione nella probabilità pretest per una malattia quando il risultato del test è noto e risponde alla domanda "Quanto è cambiata la probabilità posttest ora che il risultato del test è noto?" Molti test clinici sono dicotomici; o sono al di sopra (positivo) o al di sotto (negativo) del valore limite e ci sono, quindi, solo 2 risultati possibili. Altri test danno risultati che sono continui o si verificano entro un intervallo in cui vengono selezionati molteplici valori limite. L'effettiva probabilità posttest dipende dalla grandezza del LR (likelihood ratio, rapporto di verosimiglianza) (che dipende dalle caratteristiche operative del test) e dalla stima della probabilità pretest della malattia. Quando il test utilizzato è dicotomico, e il suo risultato può quindi essere solo positivo o negativo, la sensibilità e la specificità possono essere utilizzate per calcolare LR positivo (LR+) o LR negativo (LR-).

  • LR+: (likelihood ratio, rapporto di verosimiglianza) il rapporto tra la probabilità che un test risulti positivo in pazienti con malattia (vero positivo) e la probabilità che un test risulti positivo in pazienti senza malattia (falso positivo)

  • LR-: (likelihood ratio, rapporto di verosimiglianza) il rapporto tra la probabilità che un test risulti negativo in pazienti con la malattia (falso negativo) e la probabilità che un test risulti negativo in pazienti sani (vero negativo)

Quando il risultato è continuo o ha molteplici valori limite, è la curva ROC (receiver operating characteristic) a essere utilizzata, e non la sensibilità e specificità, al fine di calcolare un LR che viene più descritto come LR+ o LR-.

Poiché il LR (likelihood ratio, rapporto di verosimiglianza) è un rapporto di eventi mutuamente esclusivi, piuttosto che una percentuale di un totale, esso rappresenta un odds piuttosto che una probabilità. Per un dato test, il LR (likelihood ratio, rapporto di verosimiglianza) è diverso per risultati positivi e negativi.

Per esempio, per un dato risultato positivo, un LR (likelihood ratio, rapporto di verosimiglianza) di 2,0 indica che l'odds è uguale a 2:1 (veri positivi:falsi positivi) che un test positivo rappresenti un paziente con la malattia. Di 3 test positivi, 2 si verificano in pazienti con malattia (veri positivi) e 1 si verifica in un paziente senza malattia (falsi positivi). Dato che i veri positivi e i falsi positivi sono componenti dei calcoli di sensibilità e specificità, il LR+ (likelihood ratio, rapporto di verosimiglianza) può anche essere calcolato come sensibilità/(1 specificità). Più grande è il LR+ (likelihood ratio, rapporto di verosimiglianza), maggiore è la quantità di informazioni fornite dal risultato positivo di un test; un risultato positivo in un test con LR+> 10 è da considerarsi una forte evidenza in favore di una diagnosi. In altre parole, la probabilità pretest tende fortemente al 100% quando un test positivo ha un elevato LR+ (likelihood ratio, rapporto di verosimiglianza).

Per un risultato negativo, un LR- (likelihood ratio, rapporto di verosimiglianza) di 0,25 indica che l'odds è uguale a 1:4 (falsi negativi:veri negativi) che un test negativo rappresenti un paziente malato. Di 5 test negativi, 1 si verifica in un paziente malato (falso-negativo) e 4 si verificano in pazienti sani (vero negativo). Il LR- (likelihood ratio, rapporto di verosimiglianza) può anche essere calcolato come (1 sensibilità)/specificità. Più piccolo è il LR- (likelihood ratio, rapporto di verosimiglianza), maggiore è la quantità di informazioni fornite dal risultato negativo di un test; un risultato negativo di un test con un LR < 0,1 è da considerarsi una forte evidenza contro una determinata diagnosi. In altre parole, la stima della probabilità pretest tende fortemente allo 0% quando un test negativo ha un basso LR- (likelihood ratio, rapporto di verosimiglianza).

I test con LR (likelihood ratio, rapporto di verosimiglianza) di 1,0 non forniscono alcuna informazione e non influiscono sulla probabilità posttest di malattia.

I LR (likelihood ratio, rapporto di verosimiglianza) sono utili per confrontare i test e sono utilizzati anche nell'analisi bayesiana per interpretare i risultati dei test. I LR (likelihood ratio, rapporto di verosimiglianza) variano al modificarsi del valore limite, esattamente come la sensibilità e la specificità. Per esempio, un valore limite alto, per la conta leucocitaria (p. es., 20 000/μL) in un caso di appendicite acuta, è più specifico e avrebbe un elevato LR+ (likelihood ratio, rapporto di verosimiglianza) ma anche un elevato LR- (quindi non molto utile); la scelta di un valore limite più basso e molto sensibile (p. es., 10 000/μL) comporterebbe, invece, un basso LR- ma anche un basso LR+.

Test dicotomici

Un test dicotomico ideale non ha falsi positivi o falsi negativi; tutti i pazienti con test positivo devono avere la malattia (100% valore predittivo positivo), e tutti i pazienti con test negativo devono non averla (100% valore predittivo negativo).

In realtà, tutti i test presentano falsi positivi e falsi negativi, e alcuni più di altri. Per illustrare le conseguenze dell'imperfezione di sensibilità e specificità sui risultati di un test, si consideri l'ipotetico risultato (vedi tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%) di un test urinario all'esterasi leucocitaria su dipstick in un gruppo di 1000 donne, 300 (30%) delle quali hanno un'infezione delle vie urinarie, come determinato dal test di riferimento cioè, l'esame colturale delle urine. Questo scenario presuppone, a scopo illustrativo, che il test con dipstick abbia una sensibilità del 71% e una specificità dell'85%.

Sensibilità del 71% significa che solo 213 donne (71% di 300) con infezione delle vie urinarie avrebbero un test positivo. Il restante 87 avrebbe un risultato negativo. Specificità dell'85% significa che 595 donne (85% di 700) senza infezione delle vie urinarie avrebbero un risultato negativo. Le 105 rimanenti avrebbero un risultato positivo. Così, su 318 risultati positivi del test, solo 213 sarebbero corretti (213/318 = 67% valore predittivo positivo); un risultato positivo del test renderebbe quindi la diagnosi di infezione delle vie urinarie più probabilmente positiva che negativa, ma il risultato resterebbe incerto. Ci sarebbero anche 682 test negativi, di cui 595 corretti (595/682 = 87% valore predittivo negativo); ciò renderebbe la diagnosi di infezione delle vie urinarie molto meno probabile, ma ancora possibile; il 13% delle pazienti con un test negativo presenterebbe in realtà un'infezione delle vie urinarie.

Tabella
icon

Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%

Risultati

Malattia presente

Malattia assente

Totale pazienti

Test positivo

Veri positivi (VP)

213 pazienti (71% di 300)

Falso-positivo (FP)

105 pazienti (700 595)

318 pazienti con un test positivo

Test negativo

Falso-negativo (FN)

87 pazienti (300 213)

Vero negativo (VN)

595 pazienti (85% di 700)

682 pazienti con un test negativo

Totale pazienti

300 pazienti con infezione delle vie urinarie (presunte)

700 pazienti non affetti da infezione delle vie urinarie (presunte)

1000 pazienti

Valore predittivo positivo = veri positivi/(tutti i pazienti con un test positivo) = VP/(VP + FP) = 213/(213 + 105) = 67%.

Valore predittivo negativo = veri negativi/(tutti i pazienti con un test negativo) = VN/(VN + FN) = 595/(595 + 87) = 87%.

Rapporto di verosimiglianza positivo (LR+) (likelihood ratio, rapporto di verosimiglianza) = sensibilità/(1 specificità) = 0,71/(1 0,85) = 4,73.

Rapporto di verosimiglianza negativo (LR-) (likelihood ratio, rapporto di verosimiglianza) = (1 sensibilità)/specificità = (1 0,71)/0,85 = 0,34.

Tuttavia, il valore predittivo positivo e valore predittivo negativo calcolati in questo gruppo di pazienti non possono essere utilizzati per interpretare i risultati del test stesso quando l'incidenza della malattia sottostante (pretest o probabilità a priori) è differente. Notare gli effetti del cambiamento dell'incidenza della malattia al 5% (vedi tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 5%). Adesso, la maggior parte dei risultati positivi è falsa, e il valore predittivo positivo è pari solo al 20%; una paziente con un test positivo ha, di fatto, un numero maggiore di probabilità di non avere infezione delle vie urinarie. Tuttavia, il valore predittivo negativo è molto alto (98%) e pertanto; un risultato negativo esclude la diagnosi di infezione delle vie urinarie.

Tabella
icon

Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 5%

Risultati

Malattia presente

Malattia assente

Totale pazienti

Test positivo

Veri positivi (VP)

36 pazienti (71% di 50)

Falso-positivo (FP)

144 pazienti (950 806)

180 pazienti con un test positivo

Test negativo

Falso-negativo (FN)

14 pazienti (50 36)

Vero negativo (VN)

806 pazienti (85% di 950)

820 pazienti con un test negativo

Totale pazienti

50 pazienti con infezione delle vie urinarie (presunte)

950 pazienti non affetti da infezione delle vie urinarie (presunte)

1000 pazienti

Il valore predittivo positivo = veri positivi/(tutti quelli con un test positivo) = VP/(VP + FP) = 36/(36 + 144) = 20%.

Valore predittivo negativo = veri negativi/(tutti quelli con un test negativo) = VN/(VN + FN) = 806/(806 + 14) = 98%.

Rapporto di verosimiglianza positivo (LR+) (likelihood ratio, rapporto di verosimiglianza) = sensibilità/(1 specificità) = 0,71/(1 0,85) = 4,73.

Rapporto di verosimiglianza negativo (LR-) (likelihood ratio, rapporto di verosimiglianza) = (1 sensibilità)/specificità = (1 0,71)/0,85 = 0,34.

Si noti che in entrambe le coorti di pazienti, anche se il valore predittivo positivo e valore predittivo negativo sono molto diversi, i LR (likelihood ratio, rapporto di verosimiglianza) non cambiano perché esse sono determinate solo dalla sensibilità e specificità del test.

Il risultato di un test non fornisce mai una diagnosi definitiva, ma solo una stima della probabilità di presenza o assenza di una malattia. Questa probabilità posttest (probabilità di malattia, dato un risultato del test specifico) varia notevolmente a seconda della probabilità pretest della malattia così come della sensibilità e specificità del test (e quindi la sua LR, likelihood ratio, rapporto di verosimiglianza).

Probabilità pretest

La probabilità pretest non è una misura precisa; essa si basa su quanto i segni e i sintomi clinici suggeriscano la malattia al giudizio clinico, sugli elementi anamnestici che indicano la diagnosi e sull'incidenza della malattia in una determinata popolazione. Esistono molti sistemi di punteggio al fine di stimare la probabilità pretest di malattia; assegnare dei punti sulla base della presenza di elementi clinici facilita molto il calcolo della scala a punteggio. Questi esempi illustrano l'importanza di una stima accurata della prevalenza pretest, perché la prevalenza della malattia nella popolazione considerata influenza notevolmente l'utilità del test. Gli strumenti di stima della prevalenza validati e pubblicati devono essere utilizzati quando disponibili. Per esempio, vi sono dei criteri per stabilire la probabilità pretest di embolia polmonare. Punteggi più alti indicano una probabilità stimata più elevata.

Test continui

I risultati di molti test sono espressi come variabili continue e possono fornire utili informazioni cliniche su un'ampia gamma di risultati. I medici, spesso, selezionano un certo valore soglia per ottimizzare l'utilità dei test. Per esempio, una conta leucocitaria > 15 000 può essere giudicato come positivo; valori < 15 000 come negativi. Quando un test è caratterizzato da risultati continui ma viene stabilito un valore soglia, il test funzionerà come dicotomico. Può anche essere selezionato più di un valore soglia. Sensibilità, specificità, valore predittivo positivo, valore predittivo negativo, LR+ (likelihood ratio, rapporto di verosimiglianza) e LR- possono essere calcolati sia per un singolo che per più valori limite. La tabella Effetto della modifica del valore soglia per la conta leucocitaria in pazienti con sospetto di appendicite illustra l'effetto della modifica del valore soglia per la conta leucocitaria nei pazienti con sospetto di appendicite.

Tabella
icon

Effetto della modifica del valore soglia per la conta leucocitaria in pazienti con sospetto di appendicite

Valore soglia dei globuli bianchi*

Sensibilità

Specificità

LR+ (likelihood ratio, rapporto di verosimiglianza)

LR- (likelihood ratio, rapporto di verosimiglianza)

> 10 500

84%

53,13%

1,79

0,3

> 11 500

78%

62,5%

2,13

0,32

> 12 850

68%

75%

2,72

0,43

> 13 400

61,33%

78,12%

2,86

0,45

> 14 300

56,67%

81,25%

3,2

0,49

*Vengono stabiliti più valori soglia per una variabile continua come la conta leucocitaria; i risultati al di sopra del valore limite sono considerati come positivi mentre quelli al di sotto come negativi.

LR = likelihood ratio, rapporto di verosimiglianza.

Adattato da Keskek M, M Tez, Yoldas O, et al: Receiver operating characteristic analysis of leukocyte counts in operations for suspected appendicitis. American Journal of Emergency Medicine 26:769–772, 2008.

In alternativa, si possono raggruppare in livelli i risultati continui di un test. In questo caso, i risultati non sono caratterizzati come positivi o negativi, perché ci sono più risultati possibili, così sebbene un LR (likelihood ratio, rapporto di verosimiglianza) possa essere determinato per ciascun livello di risultati, non c'è più un distinto LR+ o LR-. Per esempio, la tabella Utilizzo dei gruppi della conta leucocitaria per determinare il rapporto di verosimiglianza della batteriemia nei bambini febbrili illustra la correlazione tra la conta leucocitaria e la batteriemia in bambini febbrili. Poiché il LR (likelihood ratio, rapporto di verosimiglianza) è il rapporto tra la probabilità di un dato risultato in pazienti malati diviso la probabilità di tale risultato in pazienti sani, il LR per ciascun raggruppamento di valori della conta leucocitaria è uguale alla probabilità di batteriemia in quel gruppo diviso la probabilità di assenza di batteriemia.

Tabella
icon

Utilizzo dei gruppi della conta leucocitaria per determinare il rapporto di verosimiglianza della batteriemia nei bambini febbrili*

Conta leucocitaria

Numero di bambini con batteriemia, n = 127 (%)

Numero di bambini senza batteriemia, N = 8629 (%)

LR (likelihood ratio, rapporto di verosimiglianza) (% con batteriemia/% senza batteriemia)

0-5000

0 (0,0%)

543 (6,3%)

0,00

5001-10 000

3 (2,4%)

3291 (38,1%)

0,06

10 001-15 000

15 (11,8%)

2767 (32,1%)

0,37

15 001-20 000

48 (37,8%)

1337 (15,5%)

2,4

20 001-25 000

34 (26,8%)

469 (5,4%)

4,9

25 001-30 000

12 (9,4%)

155 (1,8%)

5,3

> 30 001

15 (11,8%)

67 (0,8%)

15,2

*Incidenza di batteriemia in 8756 bambini febbrili raggruppati per conta leucocitaria. Il LR (likelihood ratio, rapporto di verosimiglianza) per ciascun gruppo viene calcolato dividendo la probabilità di batteriemia per la probabilità di assenza di batteriemia.

LR = likelihood ratio, rapporto di verosimiglianza.

Adattato da Lee GM, Harper MB: Risk of bacteremia for febrile young children in the post-Haemophilus influenzae type b era. Archives of Pediatric and Adolescent Medicine 152:624–628, 1998.

Il raggruppamento delle variabili continue consente un utilizzo più ampio del risultato del test rispetto a quando vi è un unico valore soglia stabilito. Utilizzando le analisi bayesiane, i rapporti di verosimiglianza riportati nella tabella Utilizzo dei gruppi della conta leucocitaria per determinare il rapporto di verosimiglianza di batteriemia nei bambini febbrili possono essere usati per calcolare la probabilità posttest.

Per i risultati di test continui, se è nota una curva ROC (receiver operating characteristic), non sono necessari calcoli, come mostrato nella tabella; i LR (likelihood ratio, rapporto di verosimiglianza) possono essere calcolati, per vari punti, all'interno della gamma dei risultati possibili utilizzando la pendenza della curva ROC (receiver operating characteristic) nel punto desiderato.

Teorema di Bayes

L'utilizzo della probabilità pretest della malattia e delle caratteristiche del test, per calcolare la probabilità posttest, è definito teorema di Bayes o revisione bayesiana. Nell'uso clinico routinario, la metodologia bayesiana si manifesta tipicamente sotto diverse forme:

  • Formulazione di odds-verosimiglianza (calcolo o nomogramma)

  • Approccio tabellare

Calcolo degli odds-verosimiglianza

Dato che il LR (likelihood ratio, rapporto di verosimiglianza) di un test, in realtà, è un odds, se la probabilità pretest di malattia è espressa come il suo odds, il prodotto dei 2 rappresenta l'odds posttest della malattia (analogamente a quanto avviene quando si moltiplicano 2 probabilità per calcolare la probabilità del verificarsi simultaneo di 2 eventi):

Odds pretest × LR (likelihood ratio, rapporto di verosimiglianza) = odds posttest

Dato che i medici di solito ragionano in termini di probabilità piuttosto che di odds, la probabilità può essere convertita in odds (e viceversa) con queste formule:

Odd = probabilità/1 probabilità

Probabilità = odds/odds + 1

Si consideri l'esempio delle infezioni delle vie urinarie come indicato nella tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%, in cui la probabilità pretest di malattia è 0,3, e il test utilizzato ha un LR+ (likelihood ratio, rapporto di verosimiglianza) di 4,73 e un LR- di 0,34. Una probabilità pretest di 0,3 corrisponde a un odds di 0,3/(1 0,3) = 0,43. Così, l'odds posttest che sia presente un'infezione delle vie urinarie in una paziente con un test positivo è uguale al prodotto dell'odds pretest e del LR+; 4,73 × 0,43 = 2,03, che è uguale a una probabilità posttest di 2,03/(1 + 2,03) = 0,67. Pertanto, i calcoli bayesiani mostrano che un risultato positivo aumenta la probabilità pretest dal 30 al 67%, un risultato uguale a quello ottenuto nel calcolo del valore predittivo positivo nella tabella.

Un calcolo simile può essere effettuato per un test negativo; odds posttest = 0,34 × 0,43 = 0,15, corrispondente a una probabilità di 0,15/(1 + 0,15) = 0,13. Quindi, un risultato negativo diminuisce la probabilità pretest dal 30 al 13%, di nuovo lo stesso risultato ottenuto nel calcolo del valore predittivo negativo nella tabella.

Sono disponibili molti programmi di calcolo per medici, su dispositivi portatili, per calcolare la probabilità posttest partendo dalla probabilità pretest e dai LR (likelihood ratio, rapporto di verosimiglianza).

Nomogramma odds-verosimiglianza

Utilizzare un nomogramma è particolarmente conveniente perché evita di convertire gli odds in probabilità o di creare tabelle 2×2.

Per utilizzare il nomogramma di Fagan, si traccia una linea a partire dalla probabilità pretest che attraversa la linea del LR (likelihood ratio, rapporto di verosimiglianza). La probabilità posttest è il punto in cui questa linea interseca quella della probabilità post test. Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%. La linea A rappresenta un risultato positivo; parte da una probabilità pretest di 0,3 attraversa il LR+ (likelihood ratio, rapporto di verosimiglianza) di 4,73 e dà un valore posttest < 0,7, simile alla probabilità calcolata di 0,67. La linea B rappresenta, invece, un risultato negativo; essa parte da una probabilità pretest di 0,3, attraversa la LR- (likelihood ratio, rapporto di verosimiglianza) di 0,34 e dà un valore posttest leggermente > 0,1, simile alla probabilità calcolata del 13%.

Sebbene il nomogramma appaia meno preciso dei calcoli, spesso alcuni valori tipici di probabilità pretest sono solo stime; in tal modo, l'apparente precisione dei calcoli risulta fuorviante.

Nomogramma di Fagan

Le linee illustrative sono tracciate utilizzando i dati del test delle infezioni delle vie urinarie contenuti nella tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%. La linea A rappresenta un risultato positivo, ed è tracciata da una probabilità pretest di 0,3 attraverso un LR+ (likelihood ratio, rapporto di verosimiglianza) del 4,73 fino a un valore posttest di poco < 0,7, simile alla probabilità calcolata di 0,67. La linea B rappresenta un risultato negativo, ed è tracciata da una probabilità pretest di 0,3 attraverso un LR- (likelihood ratio, rapporto di verosimiglianza) di 0,34 a un valore posttest leggermente > 0,1, simile alla probabilità calcolata del 13%.

LR+= rapporto di verosimiglianza per un risultato positivo (likelihood ratio, rapporto di verosimiglianza); LR-= rapporto di verosimiglianza per un risultato negativo.

Adattato da Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Nomogramma di Fagan

Approccio tabellare

Spesso, i LR (likelihood ratio, rapporto di verosimiglianza) di un test non sono noti, ma la sensibilità e la specificità si, e la probabilità pretest può essere stimata. In questo caso, la metodologia bayesiana può essere eseguita utilizzando una tabella 2×2 illustrata nella tabella Interpretazione del risultato di un ipotetico test all'esterasi leucocitaria utilizzando l'esempio dalla tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%. Si noti che questo metodo mostra che un risultato positivo incrementa la probabilità di infezione delle vie urinarie al 67%, e un risultato negativo diminuisce tale probabilità al 13%. Come già sottolineato, gli stessi risultati vengono ottenuti dai calcoli che sfruttano i LR (likelihood ratio, rapporto di verosimiglianza).

Tabella
icon

Interpretazione del risultato di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne assumendo una prevalenza di infezioni delle vie urinarie del 30% (probabilità pretest), una sensibilità del test pari al 71% e una specificità pari all'85%*

Risultati

Infezione delle vie urinarie presente

Infezione delle vie urinarie assente

300 pazienti con infezioni delle vie urinarie

700 pazienti non affetti da infezioni delle vie urinarie

esterasi leucocitaria test positivo

213 pazienti (VP)

105 pazienti (FP)

esterasi leucocitaria test negativo

87 pazienti (FN)

595 pazienti (VN)

*Il teorema di Bayes può essere semplificato per consentire il calcolo della probabilità posttest quando la probabilità pretest è nota:

  • Probabilità posttest quando il test è positivo = VP(tutti con un test positivo) = VP/(VP + FP) = 213/(213 + 105) = 67%.

  • Probabilità posttest quando il test è negativo = veri negativi TN/(tutti quelli con un test negativo) = FN/(FN + TN) = 87/(87 + 595) = 13%.

FN = falso negativo; FP = falso positivo; TN = vero (true) negativo; TP = vero (true) positivo.

Test sequenziale

I medici spesso eseguono dei test in sequenza durante le valutazioni diagnostiche. Se gli odds pretest e i LR (likelihood ratio, rapporto di verosimiglianza) sono noti per ciascun test prima dell'esecuzione in sequenza dei test stessi, l'odds posttest può essere calcolato utilizzando la formula seguente:

Odds pretest × LR1 × LR2 × LR3 = odds posttest

Questo metodo è limitato dal fondamentale presupposto che ciascuno dei test è indipendente l'uno dall'altro.

Test di screening

I pazienti spesso devono considerare se essere sottoposti a esami di screening per una malattia occulta. Le premesse concettuali dello screening si basano sul fatto che la diagnosi precoce della malattia può migliorare la prognosi dei pazienti con malattia occulta e che i falsi positivi, che spesso si verificano, non comportano delle conseguenze (p. es., costi, effetti avversi dei test di conferma, trattamenti ingiustificati) eccedenti i benefici della diagnosi precoce. Per ridurre al minimo tali possibili conseguenze, i medici devono scegliere il test di screening più appropriato. Lo screening non è una pratica adeguata quando i trattamenti sono inefficaci o la malattia è molto rara (a meno che non possa essere identificata una sottopopolazione in cui la prevalenza è maggiore).

Teoricamente, il test migliore, sia per lo screening che per la diagnosi, è quello con la più alta sensibilità e specificità. Tuttavia, tali accurati test sono spesso complessi, costosi e invasivi (p. es., coronarografia) e pertanto non sono pertanto utili per lo screening di un gran numero di persone asintomatiche. Generalmente, quando si seleziona un test di screening, deve essere trovato qualche compromesso tra sensibilità e specificità.

L'utilizzo di un test che ha maggiore sensibilità o specificità dipende dalle conseguenze di un risultato falsamente positivo o negativo così come dalla probabilità pretest della malattia. Un test di screening ideale è quello che risulta sempre positivo in quasi tutti i pazienti con malattia, in modo che un risultato negativo escluda con sicurezza la malattia nei pazienti sani. Per esempio, nei test per una grave malattia per cui è disponibile un trattamento efficace (p. es., patologia coronarica), si preferisce tollerare più falsi positivi rispetto ai falsi negativi (alta sensibilità e bassa specificità). Sebbene un'elevata sensibilità sia una caratteristica molto importante per un test di screening, anche la specificità risulta molto importante in certe strategie di prevenzione. In popolazioni con una più alta prevalenza di malattia, il valore predittivo positivo di un test di screening aumenta; con la riduzione della prevalenza, la probabilità posttest, o a posteriori, di un risultato positivo diminuisce. Pertanto, nello screening per una patologia nelle popolazioni ad alto rischio, sono da preferirsi i test con maggiore sensibilità rispetto a quelli con più alta specificità, in quanto più adatti per escludere la malattia. Di converso, nelle popolazioni a basso rischio o nello screening per malattie poco comuni per cui la terapia è caratterizzata da un beneficio più basso e/o da rischio più alto, sono da preferirsi i test con una specificità più alta.

Test di screening multipli

Con la continua disponibilità di nuovi test di screening, i medici devono prendere in considerazione le implicazioni di una batteria di tali test. Per esempio, batterie di test contenenti 8, 12, o 20 esami del sangue vengono spesso effettuati quando un paziente viene ricoverato in ospedale o viene visitato per la prima volta da un medico che non lo conosce. Sebbene questo tipo di test possa essere utile nello screening di pazienti per alcune malattie, l'utilizzo di ampie batterie di test ha conseguenze potenzialmente negative. Per definizione, un test con una specificità del 95% dà risultati falsamente positivi nel 5% dei pazienti sani. Eseguendo 2 test di screening con queste caratteristiche, ciascuno per una malattia occulta diversa, in un paziente che in realtà non ne ha nessuna, la probabilità che entrambi i test siano negativi è del 95% × 95% o circa 90%; inoltre, ci sarebbe un 10% di probabilità di ottenere almeno un risultato falsamente positivo. Per 3 test, la possibilità che tutti e 3 siano negativi è del 95% × 95% ×95%, o 86%, corrispondente a una probabilità del 14% di ottenere almeno un falso positivo. Se si effettuano 12 diversi test per 12 diverse malattie, la possibilità di ottenere almeno un falso positivo è del 46%. Questa alta probabilità sottolinea la necessità di cautela nel decidere di richiedere una serie di test di screening e nell'interpretazione dei risultati.

Soglia per l'esecuzione di un test

Un test di laboratorio deve essere effettuato solo se il suo risultato influirà sulla gestione clinica; in caso contrario la spesa e il rischio per il paziente sono vani. I medici, a volte, possono valutare quando eseguire un test confrontando le stime di probabilità pretest e posttest rispetto a determinati valori soglia. Al di sopra di un certo valore limite di probabilità, i benefici della terapia superano i rischi (compreso il rischio di errato trattamento di un paziente senza malattia); di conseguenza, il trattamento risulta indicato. Questo punto è definito come soglia di trattamento ed è determinato come descritto nelle Strategie decisionali cliniche: stime di probabilità e soglia di trattamento. Per definizione, il test non è necessario quando la probabilità pretest è già al di sopra della soglia di trattamento. Quando la probabilità pretest è, invece, al di sotto della soglia di trattamento, l'esecuzione del test risulta indicata fino a quando un risultato positivo potrebbe aumentare la probabilità posttest al di sopra della soglia di trattamento. La più bassa probabilità pretest a cui ciò può verificarsi dipende dalle caratteristiche del test (p. es., lR+) e viene definita soglia per l'esecuzione di un test.

Teoricamente, se il test migliore per una grave malattia ha un basso LR+ (likelihood ratio, rapporto di verosimiglianza), e la soglia di trattamento è alta, risulta dunque che un risultato positivo non può spostare la probabilità posttest al di sopra della soglia di trattamento in un paziente con una bassa, ma preoccupante, probabilità pretest (p. es., 10% o 20%).

Come esempio numerico, consideriamo il caso precedentemente descritto di un possibile infarto del miocardio acuto in cui l'equilibrio tra rischio e beneficio determina una soglia di trattamento del 25%. Quando la probabilità di infarto del miocardio supera il 25%, viene somministrata la terapia trombolitica. Quando è necessario eseguire un ecocardiogramma rapido prima di dare la terapia trombolitica? Si suppone, per l'ecocardiografia, una sensibilità ipotetica del 60% e una specificità del 70% nella diagnosi di infarto del miocardio; queste percentuali corrispondono a un LR+ (likelihood ratio, rapporto di verosimiglianza) di 60/(100 70) = 2 e un LR- di (100 60)/70 = 0,57.

La questione può essere affrontata matematicamente (odds pretest × LR = odds posttest) o graficamente, in modo più intuitivo, utilizzando il nomogramma di Fagan. Nel nomogramma, una linea collega la soglia di trattamento (25%) sulla linea della probabilità posttest, attraversa la linea centrale a livello di LR+ (2,0) e interseca una probabilità pretest di circa 0,14. Ovviamente, un test positivo in un paziente con una probabilità pretest < 14%, risulterebbe ancora in una probabilità posttest inferiore alla soglia di trattamento. In questo caso, l'ecocardiografia sarebbe inutile, perché persino un risultato positivo non porterebbe a una giustificazione, almeno teorica, del trattamento; di conseguenza, una probabilità pretest del 14% risulta essere la soglia di esecuzione per questo particolare test (vedi figura Descrizione delle soglie per l'esecuzione di test e di trattamento). Un altro test con un diverso LR+ (likelihood ratio, rapporto di verosimiglianza) avrebbe una soglia diversa.

Utilizzo del nomogramma di Fagan per determinare la necessità del test

In questo esempio, si suppone una soglia di trattamento del 25% per il trattamento di un paziente con un infarto del miocardio acuto. Quando la probabilità di infarto del miocardio supera il 25%, viene somministrata la terapia trombolitica. I medici possono utilizzare il nomogramma Fagan per determinare quando eseguire un'ecocardiografia rapida prima di somministrare la terapia trombolitica. Supponendo che l'ecocardiografia abbia una sensibilità ipotetica del 60% e una specificità del 70% per un nuovo infarto del miocardio, tali percentuali corrispondono a un rapporto di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza) per un test positivo (LR+) di 60/(100 70) = 2. Una linea parte da una soglia di trattamento del 25% sulla linea delle probabilità posttest, interseca un LR+ (2,0) sulla linea centrale e termina su una probabilità pretest di circa 0,14. Un risultato positivo, in un paziente con una probabilità pretest di < 14%, risulterebbe ancora in una probabilità posttest inferiore alla soglia di trattamento.

Adattato da Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Utilizzo del nomogramma di Fagan per determinare la necessità del test

Descrizione delle soglie per l'esecuzione di test e di trattamento

La linea orizzontale rappresenta la probabilità posttest.

Descrizione delle soglie per l'esecuzione di test e di trattamento

Poiché il 14% rappresenta ancora un rischio significativo di infarto del miocardio, è chiaro che una probabilità di malattia al di sotto della soglia per il test (p. es., un 10% di probabilità pretest) non significa necessariamente che la malattia sia esclusa, ma soltanto che un risultato positivo del test non cambierebbe la gestione clinica e, quindi, che la prova non è indicata. In questa situazione, il medico deve tenere in osservazione il paziente per rilevare, eventualmente, altri elementi clinici che potrebbero elevare la probabilità pretest al di sopra della soglia del test. In pratica, poiché sono spesso disponibili più test per una determinata malattia, potrebbero essere effettuati dei test in sequenza.

Questo esempio considera un test che di per sé non presenta rischi per il paziente. Se un test è gravato da gravi rischi (p. es., cateterismo cardiaco), la soglia per la sua esecuzione deve essere più elevata; i calcoli quantitativi possono essere effettuati, ma sono complessi. Pertanto, l'effetto della riduzione della sensibilità e della specificità di un test o dell'aumento dei rischi connessi è quello di restringere il range di probabilità della malattia al di sopra del quale l'esecuzione del test risulta la strategia migliore. Migliorando la capacità discriminativa di un test, o facendo diminuire il suo rischio, si aumenterà il range di probabilità al di sopra del quale il test risulta essere giustificato.

Una possibile eccezione al non effettuare un test nel caso in cui la probabilità pretest sia al di sotto della soglia per l'esecuzione (ma è ancora preoccupante) si può verificare nel caso in cui un risultato negativo possa ridurrela probabilità posttest al di sotto del punto in cui la malattia può essere considerata esclusa. Questa determinazione richiede un giudizio soggettivo sia del grado di certezza necessario per dire che una malattia è esclusa, sia dei rischi connessi all'esecuzione dei test, dato che le probabilità coinvolte sono basse.

Clicca qui per l’educazione dei pazienti
NOTA: Questa è la Versione per Professionisti. CLICCA QUI per accedere alla versione per i pazienti
Ottieni

Potrebbe anche Interessarti

SOCIAL MEDIA

PARTE SUPERIORE