Impatto dell'ignorare il disegno di campionamento nella previsione di risultati sanitari binari attraverso la regressione logistica: prove dall'indagine demografica e sanitaria del Malawi nell'ambito
CasaCasa > Blog > Impatto dell'ignorare il disegno di campionamento nella previsione di risultati sanitari binari attraverso la regressione logistica: prove dall'indagine demografica e sanitaria del Malawi nell'ambito

Impatto dell'ignorare il disegno di campionamento nella previsione di risultati sanitari binari attraverso la regressione logistica: prove dall'indagine demografica e sanitaria del Malawi nell'ambito

Jan 23, 2024

BMC Public Health volume 23, numero articolo: 1674 (2023) Citare questo articolo

1 Altmetrico

Dettagli sulle metriche

I tassi di natalità e di mortalità di una popolazione sono tra le statistiche vitali cruciali per la pianificazione delle politiche socioeconomiche in qualsiasi paese. Poiché il tasso di mortalità sotto i cinque anni è uno degli indicatori per monitorare la salute di una popolazione, richiede una stima regolare e accurata. I dati nazionali delle indagini demografiche e sanitarie, prontamente disponibili alla popolazione, sono diventati un mezzo per rispondere alla maggior parte delle domande relative alla salute tra le popolazioni africane, utilizzando metodi statistici pertinenti. Tuttavia, molte di queste applicazioni tendono a ignorare l’effetto del disegno dell’indagine nelle stime, nonostante la disponibilità di strumenti statistici a supporto delle analisi. Si sa poco sulla quantità di informazioni imprecise che vengono generate quando si prevedono i tassi di mortalità sotto i cinque anni. Questo studio stima e confronta gli errori riscontrati quando si applicano metodi di regressione logistica non ponderata e ponderata per prevedere il tasso di mortalità sotto i cinque anni in Malawi utilizzando i dati di un’indagine a livello nazionale. Per determinare la distorsione sono stati utilizzati i dati dell’indagine demografica e sanitaria del Malawi del 2004, 2010 e 2015-2016. Le analisi sono state effettuate con il software R versione 3.6.3 e Stata versione 12.0. Per stimare il tasso di mortalità sotto i cinque anni è stato utilizzato un modello di regressione logistica che includeva vari fattori bio- e socio-demografici riguardanti il ​​bambino, la madre e il nucleo familiare. I risultati hanno mostrato che l’accuratezza della previsione del tasso nazionale di mortalità sotto i cinque anni dipende dalla ponderazione dei cluster della probabilità complessiva prevista di morte infantile, indipendentemente dal fatto che il modello fosse ponderato o meno. La ponderazione del modello ha causato piccoli cambiamenti positivi e negativi in ​​varie stime degli effetti fissi, che hanno diffuso il risultato della ponderazione nelle probabilità adattate di decessi. A sua volta, non è stata riscontrata alcuna differenza tra il tasso di mortalità complessivo previsto ottenuto utilizzando il modello ponderato e quello ottenuto nel modello non ponderato. Si consiglia di considerare i pesi dei cluster di indagine durante il calcolo della probabilità complessiva prevista degli eventi per un risultato sanitario binario. Questo può essere fatto senza preoccuparsi dei pesi durante l'adattamento del modello, il cui scopo è la previsione del parametro della popolazione.

Rapporti di revisione tra pari

Il tasso di mortalità dei bambini di età compresa tra zero e cinquantanove mesi è un indicatore utile per monitorare gli obiettivi sanitari nazionali e globali [1, 16, 32]. Pertanto, la stima del numero totale di decessi osservati nella fascia di età sotto i cinque anni richiede tecniche robuste e affidabili, per ottenere un’approssimazione accurata per le decisioni politiche [13, 16]. È stato riferito che esiste una debole registrazione dei sistemi vitali e alti tassi di decessi sottostimati nelle strutture sanitarie nelle nazioni dell’Africa sub-sahariana [23, 28, 55]. La maggior parte delle stime del tasso di mortalità sotto i cinque anni nella regione si basano su informazioni raccolte da indagini nazionali, come i dati dell’indagine demografica e sanitaria (DHS) [21, 22, 42, 46]. Questo è ciò che richiede l’uso di analisi statistiche basate sul disegno dell’indagine, come i pesi di campionamento, per stime accurate [5, 19, 20, 40, 44, 53]. Il peso del campione è l'inverso della probabilità che un soggetto venga incluso nel campione. Indica il numero di soggetti della popolazione rappresentato da ciascuna unità campionata. Durante l'analisi di regressione, il peso del soggetto viene introdotto come funzionale delle covariate nel modello applicato ai dati dell'indagine, per compensare l'uso di inclusioni di campione disuguali, mancata risposta e sottocopertura del quadro di campionamento [7, 11 , 36, 42, 50, 57].

Tuttavia, l’effetto del disegno dell’indagine viene ignorato nella maggior parte delle applicazioni dei metodi di regressione utilizzati per stimare il tasso di mortalità sotto i cinque anni nell’Africa sub-sahariana, il che potenzialmente distorce le stime e le previsioni [18, 41, 43, 52]. Questo problema è risultato vero anche per altri studi che hanno analizzato i risultati sanitari binari oltre alla mortalità. Ad esempio, la presenza o l'assenza di diabete [48], diarrea [33], schistosomiasi [14, 31] e malaria [29], tra le altre malattie nei pazienti. Questa tendenza potrebbe riflettere l’indisponibilità di studi che dimostrino l’uso tecnico dei progetti di indagine, quando si applicano metodi di regressione a dati sanitari binari. Potrebbe anche essere dovuto al fatto che la maggior parte degli studi esaminati miravano a identificare i fattori di rischio degli esiti sanitari interessati, piuttosto che a prevedere l’entità della condizione fisica stessa, che potrebbe essere raggiunta in qualsiasi modo nella popolazione [9, 17, 54]. C’è una carenza di letteratura sui pregiudizi che si commetterebbero se il tasso nazionale di mortalità sotto i cinque anni o altri dati sanitari a risposta binaria fossero previsti da un’ampia indagine nazionale senza tener conto dell’effetto del disegno. Il presente studio stima pertanto l’errore che un ricercatore potrebbe commettere nel prevedere il tasso di mortalità sotto i cinque anni utilizzando metodi di regressione logistica ponderati e non ponderati dell’indagine. Un errore nella stima del tasso di mortalità sotto i cinque anni è la discrepanza tra il tasso stimato attraverso campioni casuali e il tasso effettivo riportato nelle osservazioni di routine. Ci si aspetterebbe che la differenza tra i due valori fosse zero, nel qual caso si dice che lo stimatore applicato ai dati dell'indagine non è distorto [39]. Il presente studio utilizza tre recenti set di dati di indagini demografiche e sanitarie (DHS) in Malawi per gli anni 2004, 2010 e 2015-16 e i tassi ufficiali di mortalità sotto i cinque anni riportati dai rispettivi DHS per calcolare la distorsione. Vengono utilizzate varie dimensioni del campione di ciascun set di dati DHS, al fine di tenere conto dell'effetto della dimensione del campione nella stima della distorsione.