Il data mining rappresenta un insieme di metodiche e di tecnologie di estrazione e analisi di dati da grandi database, per individuare pattern informativi.
Nell’ambito della ricerca sperimentale, il data mining è stato applicato a genomica, trascrittomica ed epigenomica, sofisticate metodiche di biologia molecolare che, combinate con un’analisi bioinformatica, consentono di valutare contemporaneamente la regolazione e l’espressione di un elevato numero di geni.
Questo approccio rappresenta un metodo innovativo ed efficace per esplorare i meccanismi molecolari di varie malattie, attraverso un'analisi completa dei potenziali cambiamenti nell'espressione genica tra tessuti normali e tessuti affetti.
La pubblicazione di Zeng Y. e colleghi del 2021 – disponibile in bibliografia – aveva come scopo, tramite un’analisi bioinformatica integrata, l’identificazione di possibili biomarcatori dell'ipertensione arteriosa polmonare (PAH) e lo studio dell'infiltrazione immunitaria nei tessuti affetti da questa patologia.
Il database Gene Expression Omnibus (GEO) è stato interrogato per ottenere 3 profili di espressione genica (livelli di mRNA), per un totale di 91 campioni di tessuto polmonare di soggetti affetti da PAH e 49 campioni provenienti da soggetti sani.
In totale, sono stati identificati 182 geni espressi in modo differenziale (differentially expressed genes, DEG), dei quali 117 sovra- e 65 sotto-espressi. Tra questi, 15 geni sono risultati “hub” (geni che presentano numerose interazioni con gli altri geni identificati in questo network) ed erano associati in modo significativo a funzioni del sistema immunitario, quali la migrazione dei leucociti mieloidi, la migrazione dei neutrofili, la chemiotassi, la via di segnalazione del recettore Toll-like e la via di segnalazione NF-κB.
Da queste analisi è stato ricavato un modello a 7 geni con valore diagnostico nella discriminazione dei tessuti provenienti da soggetti con PAH rispetto ai controlli normali. Inoltre, i profili di infiltrazione delle cellule immunitarie dei campioni PAH e dei campioni di controllo normali sono risultati significativamente diversi. Nel dettaglio: nei campioni PAH è stato riscontrato un arricchimento di cellule natural killer (NK) non attivate, mastociti attivati, monociti e neutrofili, mentre percentuali elevate di cellule T CD4 della memoria quiescenti e cellule M1 sono state rilevate nei campioni di controllo normali.
Sulla base di questi risultati, l'arricchimento funzionale dei DEG e l'analisi dell'infiltrazione immunitaria in campioni PAH e campioni di controllo normali potrebbero aiutare a meglio comprendere alcuni meccanismi patogenetici della PAH.
Un team di Esperti
è a tua disposizione per le tue domande
Zeng Y et al. Bioengineered. 2021 Dec;12(1):2576-2591.