banner

Blog

Mar 23, 2024

Genoma

Nature Genetics volume 55, pagine 964–972 (2023) Citare questo articolo

10mila accessi

1 Citazioni

429 Altmetrico

Dettagli sulle metriche

La dissezione spontanea dell'arteria coronaria (SCAD) è una causa poco studiata di infarto miocardico che colpisce principalmente le donne. Non è noto in che misura la SCAD sia geneticamente distinta da altre malattie cardiovascolari, inclusa la malattia coronarica aterosclerotica (CAD). Qui presentiamo una meta-analisi di associazione sull'intero genoma (1.917 casi e 9.292 controlli) che identifica 16 loci di rischio per SCAD. Le annotazioni funzionali integrative hanno dato priorità ai geni che probabilmente sono regolati nelle cellule muscolari lisce vascolari e nei fibroblasti delle arterie e sono implicati nella biologia della matrice extracellulare. Un locus contenente il gene del fattore tissutale F3, coinvolto nell’avvio della cascata della coagulazione del sangue, sembra essere specifico per il rischio SCAD. Diverse varianti associate hanno associazioni diametralmente opposte con la CAD, suggerendo che i processi biologici condivisi contribuiscono ad entrambe le malattie, ma attraverso meccanismi diversi. Deduciamo anche un ruolo causale per l'alta pressione sanguigna nella SCAD. I nostri risultati forniscono nuove intuizioni fisiopatologiche che coinvolgono l’integrità arteriosa e la coagulazione mediata dai tessuti nella SCAD e pongono le basi per future terapie e prevenzioni specifiche.

Le malattie cardiovascolari rappresentano la principale causa di morte nelle donne, ma gli aspetti legati al sesso del rischio di malattie cardiache e di infarto miocardico acuto (AMI) rimangono poco studiati1. La dissezione coronarica spontanea (SCAD) e la malattia coronarica aterosclerotica (CAD) sono entrambe cause di sindromi coronariche acute che portano a AMI2,3,4,5,6. Tuttavia, a differenza della CAD, la SCAD colpisce una popolazione più giovane, prevalentemente femminile7 e origina dallo sviluppo di un ematoma, che porta alla dissezione della tunica media coronarica con l'eventuale formazione di un falso lume, piuttosto che all'erosione o alla rottura della placca aterosclerotica8. La SCAD è stata clinicamente associata ad emicrania9 e ad arteriopatie extracoronariche, inclusa la displasia fibromuscolare (FMD)10,11,12,13. Tuttavia, l'aterosclerosi coronarica coesistente è rara8,14. Mentre la base genetica della CAD è sempre più ben definita15, la fisiopatologia della SCAD rimane poco conosciuta4. La ricerca di mutazioni altamente penetranti nei percorsi candidati o mediante sequenziamento ha ottenuto risultati bassi, spesso indicando geni coinvolti in altre sindromi ereditarie clinicamente non diagnosticate che si manifestano come SCAD16. Precedenti indagini sull'impatto della variazione genetica comune sul rischio di SCAD hanno descritto cinque loci di rischio confermati17,18,19,20.

In questo articolo, abbiamo eseguito una meta-analisi di studi di associazione sull'intero genoma (GWAS) comprendenti 1.917 casi SCAD e 9.292 controlli di origine europea. Abbiamo identificato 16 loci di rischio, inclusi 11 nuovi segnali di associazione, dimostrando una sostanziale ereditarietà poligenica per questa malattia. È importante sottolineare che abbiamo dimostrato che diversi loci di rischio genetico comuni per la SCAD sono condivisi con la CAD ma hanno un effetto direzionalmente opposto e un diverso contributo genetico dei fattori di rischio cardiovascolare stabiliti. Questi risultati implicano l’integrità arteriosa correlata alla biologia della matrice extracellulare, al tono vascolare e alla coagulazione dei tessuti nella fisiopatologia della SCAD.

Abbiamo condotto una meta-analisi GWAS di otto studi caso-controllo indipendenti (Fig. 1 e 2 supplementari e Tabella supplementare 1). Sedici loci hanno dimostrato segnali di associazione significativi a livello del genoma con SCAD, tra cui 11 sono stati recentemente descritti per questa malattia (Tabella 1, Fig. 1a, Tabella supplementare 2 e Figura supplementare 3). Un locus sul cromosoma 4 (AFAP1) è stato recentemente segnalato per la SCAD nel contesto della gravidanza19 ed è stato ora confermato come generalmente coinvolto nella SCAD (Tabella 1). Gli odds ratio stimati dei loci associati variavano da 1,25 (intervallo di confidenza al 95% (CI) = 1,16-1,35) in ZNF827 sul cromosoma 4 a 2,04 (IC al 95% = 1,77-2,35) sul cromosoma 21 vicino a KCNE2 (Tabella 1). Riportiamo prove di sostanziale poligenicità per SCAD con un'ereditabilità stimata basata sul polimorfismo a singolo nucleotide (SNP) superiore a 0,70 (h2SNP = 0,71 ± 0,11 sulla scala di responsabilità utilizzando la regressione del punteggio di disequilibrio del collegamento21 e h2SNP = 0,70 ± 0,12 utilizzando SumHer22; Tabella supplementare 3 ). Il locus ECM1/ADAMTSL4 sul cromosoma 1 rappresentava la percentuale maggiore di ereditarietà per SCAD nel nostro set di dati (h2 = 0,028), seguito dal locus COL4A1/COL4A2, che conteneva due segnali GWAS indipendenti (h2 = 0,022; Tabella supplementare 4 e Tabella supplementare Figura 4). Nel complesso, stimiamo che i 16 loci spieghino circa il 24% dell'ereditarietà totale di SCAD basata su SNP (Tabella supplementare 4).

1% of cells in artery tissue24. The SCAD 95% credible set of causal SNPs and their linkage disequilibrium proxies were matched to random pools of neighboring SNPs using the GREGOR package43. Enrichment represents the ratio of the number of SCAD SNPs overlapping open chromatin regions over the average number of matched SNPs overlapping the same regions. P values were evaluated by binomial one-sided test, with greater enrichment as the alternative hypothesis43. The bottom dashed line represents significance (P < 0.05) after adjustment for 105 subclusters. Higher opacity is used to identify significant associations (adjusted P < 0.05). Bottom, composition of artery tissues relative to 105 single-cell subclusters, as determined by snATAC-seq in 30 adult tissues24. Only subclusters representing >1% of cells from either the aorta or tibial artery were represented. b, Representation of the SCAD TWAS z score for each prioritized gene in GWAS loci. The point shape indicates the tissue used in the TWAS association. The point color distinguishes genes located at different loci. The absence of a symbol indicates that the gene did not show significant heritability based on the eQTL data in the corresponding tissue. TWAS P values were calculated by two-tailed z test against a null distribution calculated by permutation for each gene or tissue44. Higher opacity is used to identify significant associations (Bonferroni adjusted P < 0.05), corresponding to a z score of >4.8 or <−4.8 (dashed gray lines)./p>90%)2,4. Using genetic association colocalization and genetic correlation, we genetically compared SCAD with CAD. We found that, among SCAD loci, several were known to associate with CAD. Disease association colocalization analyses showed that for six loci SCAD and CAD are likely to share the same causal variants with high posterior probabilities (posterior probability of the shared causal variant hypothesis (H4) = 84–100%), but all with opposite risk alleles (Fig. 3a and Supplementary Table 7). Genetic correlation confirmed a genome-wide negative correlation between SCAD and CAD (rg = −0.12 ± 0.04; P = 3.7 × 10−3) (Supplementary Table 10), including after conditioning SCAD GWAS results on systolic blood pressure (SBP) or diastolic blood pressure (DBP) GWAS results using the multitrait-based conditional and joint analysis (mtCOJO) tool31 (rgCAD/SBP = −0.19 ± 0.04 (P = 4.6 × 10−6); rgCAD/DBP = −0.19 ± 0.04 (P = 1.3 × 10−5)) (Supplementary Table 12 and Supplementary Fig. 11)./p> 0.7) with the lead SNP at each locus, based on information from European populations (1000 Genomes reference panel) queried using the ldproxy function of the LDlinkR package (version 1.1.2)49./p>1% of cells in at least one arterial tissue (T lymphocyte 1, CD8+, endothelial general 2, endothelial general 1, macrophage general, fibroblast general, vascular smooth muscle 2 or vascular smooth muscle 1) were extracted and grouped by annotated cell type as T lymphocytes, macrophages, fibroblasts, endothelial cells and VSMCs, respectively. Genome coverage was calculated using the bedtools (version 2.29.0) coverage function. We detected peaks from bedGraph output using the MACS2 bdgpeakcall function (Galaxy Version 2.1.1.20160309.0) on the Galaxy webserver52,53. All peak files were extended 100 base pairs upstream and downstream using the bedtools (version 2.29.0) slop function. We detected overlaps of SCAD potential functional variants with relevant genomic regions using the findOverlap function from the rtracklayer package (version 1.52.1)54. We used the Integrated Genome Browser (version 9.1.8) to visualize read density profiles and peak positions in the context of the human genome55./p>75% or if eQTL association was significant for SCAD lead SNPs and H4 was over 25%. TWASs were performed using the FUSION R/Python package44. Gene expression models were pre-computed from GTEx data (version 8 release) and were provided by the authors. Only genes with a heritability P < 0.01 were used in the analysis. Both tools used linkage disequilibrium information from the European panel of phase 3 of the 1000 Genomes Project. Bonferroni multiple testing correction was applied using the p.adjust function in R (version 4.1.0). Significant capture Hi-C hits in aorta tissue were provided as supplementary data by Jung et al.25. Genes associated with mouse cardiovascular phenotypes (code MP:0005385) were retrieved from the Mouse Genome Informatics database (www.informatics.jax.org)56. We also queried the DisGeNET database, using the disgenet2r package (version 0.99.2), for genes with reported evidence in human cardiovascular disease (code C14) with a score of >0.2, including “ALL” databases57. In the absence of a missense variant, colocalization and TWAS criteria were given a tenfold weight compared with other criteria. At each locus, we prioritized genes fulfilling the largest number of criteria. In cases where several candidates were retained, we prioritized genes that were most likely to have a function in arterial disease (for example, expression in arterial tissues or exclusion of pseudo-genes)./p>30% across 1,000 generated Bayesian networks starting from different random genes. Bayesian networks were combined for the top GWAS hits query, and mouse gene symbols were converted to their human orthologs. Bayesian networks were queried for the identified top GWAS hits to identify their first-degree network connections and to determine connections between their surrounding subnetwork nodes. The directions of edges were informed by prior knowledge, such as eQTLs and previously known regulatory relationships between genes. Subnetworks were annotated by top biological pathways representative of the subnetwork genes using Enrichr with a false discovery rate of <0.05./p> 0.9) and located within 500 kb from the SCAD lead SNP. COL4A1 and COL4A2 loci were separated by placing an equidistant border from SCAD lead SNPs for the inclusion of SNPs in the analysis. Signal colocalization was evaluated using the R coloc package (version 5.1.0) with default values as priors. We reported H4 coefficients indicating the probability of two signals sharing a common causal variant at each locus./p> 0.6 within a 10,000 kb window)./p>

CONDIVIDERE