Capire i test medici e i risultati dei test

DiBrian F. Mandell, MD, PhD, Cleveland Clinic Lerner College of Medicine at Case Western Reserve University
Revisionato/Rivisto mag 2021
Visualizzazione l’educazione dei pazienti

I risultati dei test possono aiutare a fare una diagnosi in pazienti sintomatici (test diagnostici) o a identificare una malattia occulta in pazienti asintomatici (screening). Se i test sono stati adeguatamente prescritti sulla base della presentazione clinica, qualsiasi risultato deve aiutare ad avvalorare o escludere possibili diagnosi. I risultati dei test possono interferire con il processo delle decisioni cliniche se i test distinguono malamente i pazienti con o senza malattia(e) sospetta(e) o se i risultati dei test non sono compatibili con il quadro clinico o se i risultati dei test sono integrati impropriamente nel contesto medico.

I test di laboratorio sono imperfetti e possono identificare erroneamente le persone sane come malate (un falso positivo) o possono erroneamente identificare come sani alcuni pazienti malati (un falso-negativo). La capacità di un esame di identificare correttamente i pazienti con una malattia dipende dalle probabilità che ha un soggetto di avere quella patologia (probabilità a priori) così come dalle caratteristiche operative intrinseche del test stesso.

Sebbene i test diagnostici siano spesso un fattore critico per il processo decisionale clinico accurato, essi possono avere delle conseguenze indesiderate o non intenzionali. Il test deve essere effettuato con attenta considerazione, con uno scopo, e con l'aspettativa che il suo risultato riduca l'ambiguità dei problemi del paziente e contribuisca alla sua salute. Oltre al rischio di fornire informazioni errate (e quindi di ritardare l'inizio del trattamento o di indurre trattamenti non necessari), gli esami di laboratorio consumano le già limitate risorse e possono essi stessi avere effetti avversi (p. es., pneumotorace causato da biopsia polmonare) o possono richiedere ulteriori esami inutili.

Definire un risultato positivo di un test

Tra i test più diffusi ci sono quelli che forniscono risultati lungo una scala quantitativa continua (p. es., glicemia, conta leucocitaria). Tali test possono fornire utili informazioni cliniche su un ampio range di valori, ma i medici spesso li usano per diagnosticare una condizione richiedendo che il risultato sia classificato come positivo o negativo (ossia, malattia presente o assente) in base al confronto con un criterio prestabilito o punto limite. Tali punti limite sono generalmente selezionati sulla base di analisi statistiche e teoriche che tentano di bilanciare il tasso di falsi positivi (che richiedono prove inutili, costose, e possono consistere in test o trattamenti pericolosi) e quello di falsi negativi (mancata diagnosi di una malattia curabile). L'individuazione di un punto limite dipende anche dall'avere uno standard di riferimento per l'identificazione della malattia in questione.

In genere, gli esiti delle prove quantitative (p. es., conta leucocitaria nei casi di sospetta polmonite batterica) seguono un certo tipo di curva di distribuzione (non necessariamente una curva normale, anche se comunemente raffigurata come tale). La distribuzione dei risultati dei test per i pazienti con malattia è centrata su un punto diverso da quello per i pazienti sani. Alcuni pazienti con malattia hanno un risultato molto alto o molto basso, ma la maggior parte ha un risultato centrato su un valore medio. Al contrario, alcuni pazienti senza malattia hanno un risultato molto alto o molto basso, ma la maggior parte ha un risultato centrato su una media diversa da quella dei pazienti con la malattia. Per la maggior parte dei test, le distribuzioni si sovrappongono in maniera tale che molti dei possibili risultati del test si verificano in pazienti con e senza malattia; tali risultati sono illustrati più chiaramente quando le curve vengono riportate sullo stesso grafico (vedi figura Distribuzioni dei risultati del test). Alcuni pazienti con dei risultati al di sopra e al di sotto del punto soglia selezionato saranno classificati in modo errato. La regolazione di un punto soglia per identificare più pazienti con malattia (aumentare la sensibilità del test) aumenta anche il numero di falsi positivi (scarsa specificità), mentre spostando il punto soglia nella direzione opposta per evitare la falsa diagnosi di malattia, aumenta il numero di falsi negativi. Ciascun punto soglia è associato a una specifica probabilità di risultati veri positivi e falsi positivi.

Distribuzioni dei risultati del test

I pazienti con la malattia sono mostrati nella distribuzione superiore; i pazienti sani sono mostrati nella distribuzione inferiore. Per i pazienti con malattia, la regione sotto la distribuzione dei risultati che si trova a destra (sopra) rispetto al valore del punto limite corrisponde alla percentuale dei veri positivi (ossia, la sua sensibilità); l'area che si trova al di sotto a sinistra del valore limite corrisponde alla percentuale di falsi negativi. Per i pazienti sani, la regione a destra del valore del punto limite corrisponde alla percentuale di falsi positivi, e la regione a sinistra corrisponde invece alla percentuale di veri negativi (ossia, la sua specificità). Per le 2 parti sovrapposte delle distribuzioni (p. es., pazienti con e senza malattia), la variazione della linea del valore limite influenza la sensibilità e la specificità, ma in direzioni opposte; cambiando il valore limite da 1 a 2 si riduce il numero di falsi negativi (maggiore sensibilità), ma aumenta anche il numero di falsi positivi (minore specificità).

Curve ROC (receiver operating characteristic)

Riportando graficamente la frazione di veri positivi (numero di veri positivi/numero di malattie) contro la frazione di falsi positivi (numero di falsi positivi/numero senza malattia) per una serie di valori soglia si crea ciò che è noto come una curva ROC (receiver operating characteristic). La curva ROC (receiver operating characteristic) rappresenta graficamente la relazione funzionale tra la sensibilità e la specificità al variare del valore limite (vedi figura Tipica curva ROC (receiver operating characteristic)). Per convenzione, la frazione di veri positivi viene effettuata sull'asse y, e la frazione di falsi positivi viene effettuata sull'asse x. Maggiore è l'area sotto la curva ROC (receiver operating characteristic), migliore è la capacità di un test di discriminare tra pazienti con o senza malattia.

Le curve ROC (receiver operating characteristic) permettono di confrontare i test su una varietà di valori limite. Nell'esempio, il test A rende meglio del test B su tutte le gamme. Le curve ROC (receiver operating characteristic) facilitano anche la scelta del punto soglia progettato per ottimizzare l'utilità di un test. Se un test è progettato per confermare una malattia verrà selezionato un punto limite con maggiore specificità e minore sensibilità. Se il test è stato progettato per lo screening per una malattia occulta, verrà selezionato un punto soglia con una maggiore sensibilità e una minore specificità.

Tipica curva ROC (receiver operating characteristic)

Caratteristiche

Alcune variabili cliniche hanno solo 2 possibili risultati (p. es., vivo/morto, incinta/non incinta); tali variabili sono chiamate categoriali e dicotomiche. Altri risultati categoriali possono avere molti valori discreti (p. es., gruppo sanguigno, Glasgow coma scale) e sono chiamati nominali o ordinali. Le variabili nominali, come il gruppo sanguigno, non hanno un ordine particolare. Variabili ordinali come la Glasgow Coma Scale hanno, invece, valori discreti disposti in un ordine particolare. Altre variabili cliniche, tra cui molti test diagnostici comuni, sono continue e hanno un numero infinito di possibili risultati (p. es., conta leucocitaria, glicemia). Molti medici selezionano un valore soglia in modo tale da considerare una variabile continua come dicotomica (p. es., pazienti con una glicemia a digiuno > 126 mg/dL [7,0 mmol/L] sono da considerare come diabetici). Altri esami diagnostici continui presentano utilità diagnostica quando hanno molteplici valori soglia o quando gli intervalli di risultati hanno differente valore diagnostico.

Quando i risultati dei test possono essere definiti come positivi o negativi, tutti i possibili risultati possono essere registrati in una semplice tabella 2 × 2 (vedi tabella Distribuzione degli ipotetici risultati dei test) da cui possono essere calcolate importanti caratteristiche dei test discriminativi, tra cui sensibilità, specificità, valore predittivo positivo e negativo e rapporto di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza) (vedi tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%).

Tabella

Sensibilità, specificità e valore predittivo

I valori di sensibilità e specificità sono in genere considerati caratteristiche del test stesso, indipendenti dalla popolazione dei pazienti.

  • La sensibilità è la probabilità che i pazienti con la malattia avranno un risultato positivo del test (percentuale di veri positivi)

Pertanto un test che è positivo in 8 pazienti malati su 10 complessivi ha una sensibilità di 0,8 (espressa anche come 80%). La sensibilità valuta la capacità del test di individuare la malattia; un test con bassa sensibilità non identifica molti pazienti con la malattia, e un test con sensibilità elevata è utile per escludere una diagnosi quando i risultati sono negativi. La sensibilità è complementare alla percentuale di falsi negativi (ossia, percentuale di falsi negativi più sensibilità = 100%).

  • La specificità è la probabilità che i pazienti senza la malattia avranno un test negativo nell'individuo sano (percentuale di veri negativi)

Pertanto, un test che è negativo in 9 su 10 pazienti sani ha una specificità di 0,9 (o 90%). La specificità rappresenta quanto correttamente un test identifica i pazienti con malattia in quanto i test ad alta specificità hanno un basso tasso di falsi positivi. Un test con bassa specificità descrive come malati molti pazienti sani. È, inoltre, complementare alla percentuale di falsi positivi.

I valori predittivi descrivono il comportamento del test in una data popolazione di pazienti che non sanno se hanno la malattia. Per un dato test, i valori predittivi variano a seconda della prevalenza della malattia nella popolazione di pazienti testata.

  • Il valore predittivo positivo è la proporzione di pazienti con un test positivo che ha realmente la malattia

Pertanto, se 9 su 10 risultati positivi sono corretti (veri positivi), il valore predittivo positivo del test è del 90%. Poiché tutti i risultati positivi hanno numerosi veri positivi e falsi positivi, il valore predittivo positivo descrive la probabilità che un risultato positivo in una certa popolazione di pazienti rappresenti una vera positività.

  • Il valore predittivo negativo è la proporzione di pazienti con un risultato negativo al test che in realtà sono sani

Pertanto, se 8 risultati su 10 negativi sono corretti (vero negativo), il valore predittivo negativo è dell'80%. Poiché non tutti i risultati negativi sono veri negativi, alcuni pazienti con un test negativo in realtà hanno la malattia. Il VPN descrive la probabilità che un risultato negativo del test in una data popolazione rappresenti una vera negatività.

Calcolatore Clinico
Calcolatore Clinico

Rapporti di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza)

A differenza dei valori di sensibilità e specificità, che non si applicano alle specifiche probabilità dei pazienti, il LR (likelihood ratio, rapporto di verosimiglianza) consente ai medici di interpretare i risultati dei test in un determinato paziente a condizione che vi sia una nota (anche se spesso solo stimata) probabilità pre-test di malattia.

Il rapporto di verosimiglianza (likelihood ratio, LR) descrive la variazione della probabilità pre-test della malattia quando il risultato del test è noto e risponde alla domanda

  • Quanto è cambiata la probabilità post-test rispetto alla probabilità pre-test ora che il risultato del test è noto?

Molti test clinici sono dicotomici; o sono al di sopra (positivo) o al di sotto (negativo) del valore limite e ci sono, quindi, solo 2 risultati possibili. Altri test danno risultati che sono continui o si verificano entro un intervallo in cui vengono selezionati molteplici valori limite. L'effettiva probabilità post-test dipende dalla grandezza del LR (likelihood ratio, rapporto di verosimiglianza) (che dipende dalle caratteristiche operative del test) e dalla stima della probabilità pre-test della malattia. Quando il test utilizzato è dicotomico, e il suo risultato può quindi essere solo positivo o negativo, la sensibilità e la specificità possono essere utilizzate per calcolare LR positivo (LR+) o LR negativo (LR-).

  • LR+: (likelihood ratio, rapporto di verosimiglianza) il rapporto tra la probabilità che un test risulti positivo in pazienti con malattia (vero positivo) e la probabilità che un test risulti positivo in pazienti senza malattia (falso positivo)

  • LR-: (likelihood ratio, rapporto di verosimiglianza) il rapporto tra la probabilità che un test risulti negativo in pazienti con la malattia (falso negativo) e la probabilità che un test risulti negativo in pazienti sani (vero negativo)

Quando il risultato è continuo o ha molteplici valori limite, è la curva ROC (receiver operating characteristic) a essere utilizzata, e non la sensibilità e specificità, al fine di calcolare un LR che viene più descritto come LR+ o LR-.

Poiché il LR (likelihood ratio, rapporto di verosimiglianza) è un rapporto di eventi mutuamente esclusivi, piuttosto che una percentuale di un totale, esso rappresenta un odds piuttosto che una probabilità. Per un dato test, il LR (likelihood ratio, rapporto di verosimiglianza) è diverso per risultati positivi e negativi.

Per esempio, per un dato risultato positivo, un LR (likelihood ratio, rapporto di verosimiglianza) di 2,0 indica che l'odds è uguale a 2:1 (veri positivi:falsi positivi) che un test positivo rappresenti un paziente con la malattia. Di 3 test positivi, 2 si verificano in pazienti con malattia (veri positivi) e 1 si verifica in un paziente senza malattia (falsi positivi). Dato che i veri positivi e i falsi positivi sono componenti dei calcoli di sensibilità e specificità, il LR+ (likelihood ratio, rapporto di verosimiglianza) può anche essere calcolato come sensibilità/(1 specificità). Più grande è il LR+ (likelihood ratio, rapporto di verosimiglianza), maggiore è la quantità di informazioni fornite dal risultato positivo di un test; un risultato positivo in un test con LR+ > 10 è da considerarsi una forte evidenza in favore di una diagnosi. In altre parole, la probabilità pre-test tende fortemente al 100% quando un test positivo ha un elevato LR+ (likelihood ratio, rapporto di verosimiglianza).

Per un risultato negativo, un LR- (likelihood ratio, rapporto di verosimiglianza) di 0,25 indica che l'odds è uguale a 1:4 (falsi negativi:veri negativi) che un test negativo rappresenti un paziente malato. Di 5 test negativi, 1 si verifica in un paziente malato (falso-negativo) e 4 si verificano in pazienti sani (vero negativo). Il LR- (likelihood ratio, rapporto di verosimiglianza) può anche essere calcolato come (1 sensibilità)/specificità. Più piccolo è il LR- (likelihood ratio, rapporto di verosimiglianza), maggiore è la quantità di informazioni fornite dal risultato negativo di un test; un risultato negativo di un test con un LR < 0,1 è da considerarsi una forte evidenza contro una determinata diagnosi. In altre parole, la stima della probabilità pre-test tende fortemente allo 0% quando un test negativo ha un basso LR- (likelihood ratio, rapporto di verosimiglianza).

I test con LR (likelihood ratio, rapporto di verosimiglianza) di 1,0 non forniscono alcuna informazione e non possono influire sulla probabilità post-test di malattia.

I LR (likelihood ratio, rapporto di verosimiglianza) sono utili per confrontare i test e sono utilizzati anche nell'analisi bayesiana per interpretare i risultati dei test. I LR (likelihood ratio, rapporto di verosimiglianza) variano al modificarsi del valore limite, esattamente come la sensibilità e la specificità. Per esempio, un valore limite alto, per la conta leucocitaria (p. es., 20 000/μL) in un caso di appendicite acuta, è più specifico e avrebbe un elevato LR+ (likelihood ratio, rapporto di verosimiglianza) ma anche un elevato LR- (quindi non molto utile); la scelta di un valore limite più basso e molto sensibile (p. es., 10 000/μL) comporterebbe, invece, un basso LR- ma anche un basso LR+.

Test dicotomici

Un test dicotomico ideale non ha falsi positivi o falsi negativi; tutti i pazienti con test positivo devono avere la malattia (100% valore predittivo positivo), e tutti i pazienti con test negativo devono non averla (100% valore predittivo negativo).

In realtà, tutti i test presentano falsi positivi e falsi negativi, e alcuni più di altri. Per illustrare le conseguenze dell'imperfezione di sensibilità e specificità sui risultati di un test, si consideri l'ipotetico risultato (vedi tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%) di un test urinario all'esterasi leucocitaria su dipstick in un gruppo di 1000 donne, 300 (30%) delle quali hanno un'infezione delle vie urinarie, come determinato dal test di riferimento cioè, l'esame colturale delle urine. Questo scenario presuppone, a scopo illustrativo, che il test con dipstick abbia una sensibilità del 71% e una specificità dell'85%.

Sensibilità del 71% significa che solo 213 donne (71% di 300) con infezione delle vie urinarie avrebbero un test positivo. Il restante 87 avrebbe un risultato negativo. Specificità dell'85% significa che 595 donne (85% di 700) senza infezione delle vie urinarie avrebbero un risultato negativo. Le 105 rimanenti avrebbero un risultato positivo. Così, su 213 + 115 = 318 risultati positivi del test, solo 213 sarebbero corretti (213/318 = 67% valore predittivo positivo); un risultato positivo del test renderebbe quindi la diagnosi di infezione delle vie urinarie più probabilmente positiva che negativa, ma il risultato resterebbe incerto. Ci sarebbero anche 87 + 595 = 682 test negativi, di cui 595 corretti (595/682 = 87% valore predittivo negativo); ciò renderebbe la diagnosi di infezione delle vie urinarie molto meno probabile, ma ancora possibile; il 13% delle pazienti con un test negativo presenterebbe in realtà un'infezione delle vie urinarie.

Tabella

Tuttavia, il valore predittivo positivo e valore predittivo negativo calcolati in questo gruppo di pazienti non possono essere utilizzati per interpretare i risultati del test stesso quando l'incidenza della malattia sottostante (pre-test o probabilità a priori) è differente. Notare gli effetti del cambiamento dell'incidenza della malattia al 5% (vedi tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in un campione di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 5%). Adesso, la maggior parte dei risultati positivi è falsa, e il valore predittivo positivo è pari solo al 20%; una paziente con un test positivo ha, di fatto, un numero maggiore di probabilità di non avere infezione delle vie urinarie. Tuttavia, il valore predittivo negativo è molto alto (98%) e pertanto; un risultato negativo esclude la diagnosi di infezione delle vie urinarie.

Tabella

Si noti che in entrambe le coorti di pazienti, anche se il valore predittivo positivo e valore predittivo negativo sono molto diversi, i LR (likelihood ratio, rapporto di verosimiglianza) non cambiano perché esse sono determinate solo dalla sensibilità e specificità del test.

Il risultato di un test non fornisce mai una diagnosi definitiva, ma solo una stima della probabilità di presenza o assenza di una malattia. Questa probabilità post-test (probabilità di malattia, dato un risultato del test specifico) varia notevolmente a seconda della probabilità pre-test della malattia così come della sensibilità e specificità del test (e quindi la sua LR, likelihood ratio, rapporto di verosimiglianza).

Probabilità pre-test

La probabilità pre-test non è una misura precisa; essa si basa su quanto i segni e i sintomi clinici suggeriscano la malattia al giudizio clinico, sugli elementi anamnestici che indicano la diagnosi e sull'incidenza della malattia in una determinata popolazione. Esistono molti sistemi di punteggio al fine di stimare la probabilità pre-test di malattia; assegnare dei punti sulla base della presenza di elementi clinici facilita molto il calcolo della scala a punteggio. Questi esempi illustrano l'importanza di una stima accurata della prevalenza pre-test, perché la prevalenza della malattia nella popolazione considerata influenza notevolmente l'utilità del test. Gli strumenti di stima della prevalenza validati e pubblicati devono essere utilizzati quando disponibili. Per esempio, vi sono dei criteri per stabilire la probabilità pre-test di embolia polmonare. Punteggi più alti indicano una probabilità stimata più elevata.

Test continui

I risultati di molti test sono espressi come variabili continue e possono fornire utili informazioni cliniche su un'ampia gamma di risultati. I medici, spesso, selezionano un certo valore soglia per ottimizzare l'utilità dei test. Per esempio, una conta leucocitaria > 15 000 può essere giudicato come positivo; valori < 15 000 come negativi. Quando un test è caratterizzato da risultati continui ma viene stabilito un valore soglia, il test funzionerà come dicotomico. Può anche essere selezionato più di un valore soglia. Sensibilità, specificità, valore predittivo positivo, valore predittivo negativo, LR+ (likelihood ratio, rapporto di verosimiglianza) e LR- possono essere calcolati sia per un singolo che per più valori limite. La tabella Effetto della modifica del valore soglia per la conta leucocitaria in pazienti con sospetto di appendicite illustra l'effetto della modifica del valore soglia per la conta leucocitaria nei pazienti con sospetto di appendicite.

Tabella

In alternativa, si possono raggruppare in livelli i risultati continui di un test. In questo caso, i risultati non sono caratterizzati come positivi o negativi, perché ci sono più risultati possibili, così sebbene un LR (likelihood ratio, rapporto di verosimiglianza) possa essere determinato per ciascun livello di risultati, non c'è più un distinto LR+ o LR-. Per esempio, la tabella Utilizzo dei gruppi della conta leucocitaria per determinare il rapporto di verosimiglianza della batteriemia nei bambini febbrili illustra la correlazione tra la conta leucocitaria e la batteriemia in bambini febbrili. Poiché il LR (likelihood ratio, rapporto di verosimiglianza) è il rapporto tra la probabilità di un dato risultato in pazienti malati diviso la probabilità di tale risultato in pazienti sani, il LR per ciascun raggruppamento di valori della conta leucocitaria è uguale alla probabilità di batteriemia in quel gruppo diviso la probabilità di assenza di batteriemia.

Tabella

Il raggruppamento delle variabili continue consente un utilizzo più ampio del risultato del test rispetto a quando vi è un unico valore soglia stabilito. Utilizzando le analisi bayesiane, i rapporti di verosimiglianza riportati nella tabella Utilizzo dei gruppi della conta leucocitaria per determinare il rapporto di verosimiglianza di batteriemia nei bambini febbrili possono essere usati per calcolare la probabilità post-test.

Per i risultati di test continui, se è nota una curva ROC (receiver operating characteristic), non sono necessari calcoli, come mostrato nella tabella; i LR (likelihood ratio, rapporto di verosimiglianza) possono essere calcolati, per vari punti, all'interno della gamma dei risultati possibili utilizzando la pendenza della curva ROC (receiver operating characteristic) nel punto desiderato.

Teorema di Bayes

L'utilizzo della probabilità pre-test della malattia e delle caratteristiche del test, per calcolare la probabilità post-test, è definito teorema di Bayes o revisione bayesiana. Nell'uso clinico routinario, la metodologia bayesiana si manifesta tipicamente sotto diverse forme:

  • Formulazione di odds-verosimiglianza (calcolo o nomogramma)

  • Approccio tabellare

Calcolo degli odds-verosimiglianza

Dato che il LR (likelihood ratio, rapporto di verosimiglianza) di un test, in realtà, è un odds, se la probabilità pre-test di malattia è espressa come il suo odds, il prodotto dei 2 rappresenta l'odds post-test della malattia (analogamente a quanto avviene quando si moltiplicano 2 probabilità per calcolare la probabilità del verificarsi simultaneo di 2 eventi):

Odds pre-test × LR (likelihood ratio, rapporto di verosimiglianza) = odds post-test

Dato che i medici di solito ragionano in termini di probabilità piuttosto che di odds, la probabilità può essere convertita in odds (e viceversa) con queste formule:

Odd = probabilità/1 probabilità

Probabilità = odds/odds + 1

Si consideri l'esempio delle infezioni delle vie urinarie come indicato nella tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%, in cui la probabilità pre-test di malattia è 0,3, e il test utilizzato ha un LR+ (likelihood ratio, rapporto di verosimiglianza) di 4,73 e un LR- di 0,34. Una probabilità pre-test di 0,3 corrisponde a un odds di 0,3/(1 0,3) = 0,43. Così, l'odds post-test che sia presente un'infezione delle vie urinarie in una paziente con un test positivo è uguale al prodotto dell'odds pre-test e del LR+; 4,73 × 0,43 = 2,03, che è uguale a una probabilità post-test di 2,03/(1 + 2,03) = 0,67. Pertanto, i calcoli bayesiani mostrano che un risultato positivo aumenta la probabilità pre-test dal 30 al 67%, un risultato uguale a quello ottenuto nel calcolo del valore predittivo positivo nella tabella.

Un calcolo simile può essere effettuato per un test negativo; odds post-test = 0,34 × 0,43 = 0,15, corrispondente a una probabilità di 0,15/(1 + 0,15) = 0,13. Quindi, un risultato negativo diminuisce la probabilità pre-test dal 30 al 13%, di nuovo lo stesso risultato ottenuto nel calcolo del valore predittivo negativo nella tabella.

Sono disponibili molti programmi di calcolo per medici, su dispositivi portatili, per calcolare la probabilità post-test partendo dalla probabilità pre-test e dai LR (likelihood ratio, rapporto di verosimiglianza).

Calcolatore Clinico
Calcolatore Clinico

Nomogramma odds-verosimiglianza

Utilizzare un nomogramma è particolarmente conveniente perché evita di convertire gli odds in probabilità o di creare tabelle 2×2.

Per utilizzare il nomogramma di Fagan, si traccia una linea a partire dalla probabilità pre-test che attraversa la linea del LR (likelihood ratio, rapporto di verosimiglianza). La probabilità post-test è il punto in cui questa linea interseca quella della probabilità post test. Linee illustrative sono tracciate utilizzando i dati del test delle infezioni delle vie urinarie nella tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%. La linea A rappresenta un risultato positivo; parte da una probabilità pre-test di 0,3 attraversa il LR+ (likelihood ratio, rapporto di verosimiglianza) di 4,73 e dà un valore post-test < 0,7, simile alla probabilità calcolata di 0,67. La linea B rappresenta, invece, un risultato negativo; essa parte da una probabilità pre-test di 0,3, attraversa la LR- (likelihood ratio, rapporto di verosimiglianza) di 0,34 e dà un valore post-test leggermente > 0,1, simile alla probabilità calcolata del 13%.

Sebbene il nomogramma appaia meno preciso dei calcoli, spesso alcuni valori tipici di probabilità pre-test sono solo stime; in tal modo, l'apparente precisione dei calcoli risulta fuorviante.

Nomogramma di Fagan

Linee illustrative sono tracciate utilizzando i dati del test delle infezioni delle vie urinarie nella tabella Distribuzione dei risultati dei test di un ipotetico test di esterasi leucocitaria in una coorte di 1000 donne con una prevalenza di infezioni del tratto urinario del 30%. La linea A rappresenta un risultato positivo, ed è tracciata da una probabilità pre-test di 0,3 attraverso un LR+ (likelihood ratio, rapporto di verosimiglianza) del 4,73 fino a un valore post-test di poco < 0,7, simile alla probabilità calcolata di 0,67. La linea B rappresenta un risultato negativo, ed è tracciata da una probabilità pre-test di 0,3 attraverso un LR- (likelihood ratio, rapporto di verosimiglianza) di 0,34 a un valore post-test leggermente > 0,1, simile alla probabilità calcolata del 13%.

LR+ = rapporto di verosimiglianza per un risultato positivo (likelihood ratio, rapporto di verosimiglianza); LR- = rapporto di verosimiglianza per un risultato negativo.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Approccio tabellare

Spesso, i LR (likelihood ratio, rapporto di verosimiglianza) di un test non sono noti, ma la sensibilità e la specificità si, e la probabilità pre-test può essere stimata. In questo caso, la metodologia bayesiana può essere eseguita utilizzando una tabella 2×2 illustrata nella tabella Interpretazione del risultato di un ipotetico test all'esterasi leucocitaria utilizzando l'esempio dalla tabella Distribuzione dei risultati di un ipotetico test all'esterasi leucocitaria in una coorte di 1000 donne con una prevalenza assunta di infezione delle vie urinarie pari al 30%. Si noti che questo metodo mostra che un risultato positivo incrementa la probabilità di infezione delle vie urinarie al 67%, e un risultato negativo diminuisce tale probabilità al 13%. Come già sottolineato, gli stessi risultati vengono ottenuti dai calcoli che sfruttano i LR (likelihood ratio, rapporto di verosimiglianza).

Tabella

Test sequenziale

I medici spesso eseguono dei test in sequenza durante le valutazioni diagnostiche. Se gli odds pre-test e i LR (likelihood ratio, rapporto di verosimiglianza) sono noti per ciascun test prima dell'esecuzione in sequenza dei test stessi, l'odds post-test può essere calcolato utilizzando la formula seguente:

Odds pre-test × LR1 × LR2 × LR3 = odds post-test

Questo metodo è limitato dal fondamentale presupposto che ciascuno dei test è indipendente l'uno dall'altro.

Test di screening

I pazienti spesso devono considerare se essere sottoposti a esami di screening per una malattia occulta. Le premesse concettuali di uno screening di successo si basano sul fatto che la diagnosi precoce della malattia può migliorare una prognosi clinicamente significativa dei pazienti con malattia occulta e che i falsi positivi, che possono verificarsi, non comportano delle conseguenze (p. es., costi, effetti avversi dei test di conferma, ansia provocata dai test, trattamenti ingiustificati) eccedenti i benefici della diagnosi precoce. Per ridurre al minimo tali possibili conseguenze, i medici devono scegliere il test di screening più appropriato. Lo screening non è una pratica adeguata quando i trattamenti o le misure preventive sono inefficaci o la malattia è molto rara (a meno che non possa essere identificata una sottopopolazione in cui la prevalenza è maggiore).

Teoricamente, il test migliore, sia per lo screening che per la diagnosi, è quello con la più alta sensibilità e specificità. Tuttavia, tali accurati test sono spesso complessi, costosi e invasivi (p. es., coronarografia) e pertanto non sono pertanto utili per lo screening di un gran numero di persone asintomatiche. Generalmente, quando si seleziona un test di screening, deve essere trovato qualche compromesso tra sensibilità e specificità.

L'utilizzo di un test che ha maggiore sensibilità o specificità dipende dalle conseguenze di un risultato falsamente positivo o negativo così come dalla probabilità pre-test della malattia. Un test di screening ideale è quello che risulta sempre positivo in quasi tutti i pazienti con malattia, in modo che un risultato negativo escluda con sicurezza la malattia nei pazienti sani. Per esempio, nei test per una grave malattia per cui è disponibile un trattamento efficace (p. es., coronaropatia), si preferisce tollerare più falsi positivi rispetto ai falsi negativi (alta sensibilità e bassa specificità). Sebbene un'elevata sensibilità sia una caratteristica molto importante per un test di screening, anche la specificità risulta molto importante in certe strategie di prevenzione. In popolazioni con una più alta prevalenza di malattia, il valore predittivo positivo di un test di screening aumenta; con la riduzione della prevalenza, la probabilità post-test, o a posteriori, di un risultato positivo diminuisce. Pertanto, nello screening per una patologia nelle popolazioni ad alto rischio, sono da preferirsi i test con maggiore sensibilità rispetto a quelli con più alta specificità, in quanto più adatti per escludere la malattia. Di converso, nelle popolazioni a basso rischio o nello screening per malattie poco comuni per cui la terapia è caratterizzata da un beneficio più basso e/o da rischio più alto, sono da preferirsi i test con una specificità più alta.

Test di screening multipli

Con la continua disponibilità di nuovi test di screening, i medici devono prendere in considerazione le implicazioni di una batteria di tali test. Per esempio, batterie di test contenenti 8, 12, o 20 esami del sangue vengono spesso effettuati quando un paziente viene ricoverato in ospedale o viene visitato per la prima volta da un medico che non lo conosce. Sebbene questo tipo di test possa essere utile nello screening di pazienti per alcune malattie, l'utilizzo di ampie batterie di test ha conseguenze potenzialmente negative. Per definizione, un test con una specificità del 95% dà risultati falsamente positivi nel 5% dei pazienti sani. Eseguendo 2 test di screening con queste caratteristiche, ciascuno per una malattia occulta diversa, in un paziente che in realtà non ne ha nessuna, la probabilità che entrambi i test siano negativi è del 95% × 95% o circa 90%; inoltre, ci sarebbe un 10% di probabilità di ottenere almeno un risultato falsamente positivo. Per 3 test, la possibilità che tutti e 3 siano negativi è del 95% × 95% ×95%, o 86%, corrispondente a una probabilità del 14% di ottenere almeno un falso positivo. Se si effettuano 12 diversi test per 12 diverse malattie, la possibilità di ottenere almeno un falso positivo è del 46%. Questa alta probabilità sottolinea la necessità di cautela nel decidere di richiedere una serie di test di screening e nell'interpretazione dei risultati.

Soglia per l'esecuzione di un test

Un test di laboratorio deve essere effettuato solo se il suo risultato influirà sulla gestione clinica; in caso contrario la spesa e il rischio per il paziente sono vani. I medici, a volte, possono valutare quando eseguire un test confrontando le stime di probabilità pre-test e post-test rispetto a determinati valori soglia. Al di sopra di un certo valore limite di probabilità, i benefici della terapia superano i rischi (compreso il rischio di errato trattamento di un paziente senza malattia); di conseguenza, il trattamento risulta indicato. Questo punto è definito come soglia di trattamento ed è determinato come descritto nelle Strategie decisionali cliniche: stime di probabilità e soglia di trattamento. Per definizione, il test non è necessario quando la probabilità pre-test è già al di sopra della soglia di trattamento. Quando la probabilità pre-test è, invece, al di sotto della soglia di trattamento, l'esecuzione del test risulta indicata fino a quando un risultato positivo potrebbe aumentare la probabilità post-test al di sopra della soglia di trattamento. La più bassa probabilità pre-test a cui ciò può verificarsi dipende dalle caratteristiche del test (p. es., lR+) e viene definita soglia per l'esecuzione di un test.

Teoricamente, se il test migliore per una grave malattia ha un basso LR+ (likelihood ratio, rapporto di verosimiglianza), e la soglia di trattamento è alta, risulta dunque che un risultato positivo non può spostare la probabilità post-test al di sopra della soglia di trattamento in un paziente con una bassa, ma preoccupante, probabilità pre-test (p. es., 10% o 20%).

Come esempio numerico, consideriamo il caso precedentemente descritto di un possibile infarto del miocardio acuto in cui l'equilibrio tra rischio e beneficio determina una soglia di trattamento del 25%. Quando la probabilità di infarto del miocardio supera il 25%, viene somministrata la terapia trombolitica. Quando è necessario eseguire un ecocardiogramma rapido prima di dare la terapia trombolitica? Si suppone, per l'ecocardiografia, una sensibilità ipotetica del 60% e una specificità del 70% nella diagnosi di infarto del miocardio; queste percentuali corrispondono a un LR+ (likelihood ratio, rapporto di verosimiglianza) di 60/(100 70) = 2 e un LR- di (100 60)/70 = 0,57.

La questione può essere affrontata matematicamente (odds pre-test × LR = odds post-test) o graficamente, in modo più intuitivo, utilizzando il nomogramma di Fagan. Nel nomogramma, una linea collega la soglia di trattamento (25%) sulla linea della probabilità post-test, attraversa la linea centrale a livello di LR+ (2,0) e interseca una probabilità pre-test di circa 0,14. Ovviamente, un test positivo in un paziente con una probabilità pre-test < 14%, risulterebbe ancora in una probabilità post-test inferiore alla soglia di trattamento. In questo caso, l'ecocardiografia sarebbe inutile, perché persino un risultato positivo non porterebbe a una giustificazione, almeno teorica, del trattamento; di conseguenza, una probabilità pre-test del 14% risulta essere la soglia di esecuzione per questo particolare test (vedi figura Descrizione delle soglie per l'esecuzione di test e di trattamento). Un altro test con un diverso LR+ (likelihood ratio, rapporto di verosimiglianza) avrebbe una soglia diversa.

Utilizzo del nomogramma di Fagan per determinare la necessità del test

In questo esempio, si suppone una soglia di trattamento del 25% per il trattamento di un paziente con un infarto del miocardio acuto. Quando la probabilità di infarto del miocardio supera il 25%, viene somministrata la terapia trombolitica. I medici possono utilizzare il nomogramma Fagan per determinare quando eseguire un'ecocardiografia rapida prima di somministrare la terapia trombolitica. Supponendo che l'ecocardiografia abbia una sensibilità ipotetica del 60% e una specificità del 70% per un nuovo infarto del miocardio, tali percentuali corrispondono a un rapporto di verosimiglianza (LR, likelihood ratio, rapporto di verosimiglianza) per un test positivo (LR+) di 60/(100 70) = 2. Una linea parte da una soglia di trattamento del 25% sulla linea delle probabilità post-test, interseca un LR+ (2,0) sulla linea centrale e termina su una probabilità pre-test di circa 0,14. Un risultato positivo, in un paziente con una probabilità pre-test di < 14%, risulterebbe ancora in una probabilità post-test inferiore alla soglia di trattamento.

Adapted from Fagan TJ. Letter: Nomogram for Bayes theorem. New England Journal of Medicine 293:257, 1975.

Descrizione delle soglie per l'esecuzione di test e di trattamento

La linea orizzontale rappresenta la probabilità post-test.

Poiché il 14% rappresenta ancora un rischio significativo di infarto del miocardio, è chiaro che una probabilità di malattia al di sotto della soglia per il test (p. es., un 10% di probabilità pre-test) non significa necessariamente che la malattia sia esclusa, ma soltanto che un risultato positivo del test non cambierebbe la gestione clinica e, quindi, che la prova non è indicata. In questa situazione, il medico deve tenere in osservazione il paziente per rilevare, eventualmente, altri elementi clinici che potrebbero elevare la probabilità pre-test al di sopra della soglia del test. In pratica, poiché sono spesso disponibili più test per una determinata malattia, potrebbero essere effettuati dei test in sequenza.

Questo esempio considera un test che di per sé non presenta rischi per il paziente. Se un test è gravato da gravi rischi (p. es., cateterismo cardiaco), la soglia per la sua esecuzione deve essere più elevata; i calcoli quantitativi possono essere effettuati, ma sono complessi. Pertanto, l'effetto della riduzione della sensibilità e della specificità di un test o dell'aumento dei rischi connessi è quello di restringere il range di probabilità della malattia al di sopra del quale l'esecuzione del test risulta la strategia migliore. Migliorando la capacità discriminativa di un test, o facendo diminuire il suo rischio, si aumenterà il range di probabilità al di sopra del quale il test risulta essere giustificato.

Una possibile eccezione al non effettuare un test nel caso in cui la probabilità pre-test sia al di sotto della soglia per l'esecuzione (ma è ancora preoccupante) si può verificare nel caso in cui un risultato negativo possa ridurre la probabilità post-test al di sotto del punto in cui la malattia può essere considerata esclusa. Questa determinazione richiede un giudizio soggettivo sia del grado di certezza necessario per dire che una malattia è esclusa, sia dei rischi connessi all'esecuzione dei test, dato che le probabilità coinvolte sono basse.

quizzes_lightbulb_red
Test your KnowledgeTake a Quiz!
iOS ANDROID
iOS ANDROID
iOS ANDROID