banner

Notizia

Nov 15, 2023

Requisiti minimi per la convalida ISO15189 e l'accreditamento di tre procedure di sequenziamento di prossima generazione per la SARS

Rapporti scientifici volume 13, numero articolo: 6934 (2023) Citare questo articolo

774 accessi

1 Altmetrico

Dettagli sulle metriche

Le scoperte rapide e ricorrenti di nuovi ceppi (varianti) di SARS-CoV-2 hanno spinto le autorità sanitarie pubbliche di tutto il mondo a istituire reti di sorveglianza per monitorare la circolazione delle varianti preoccupanti. L'uso di tecnologie di sequenziamento di nuova generazione ha aumentato la necessità di una valutazione del controllo di qualità richiesta nei laboratori clinici. Il presente studio è il primo a proporre una guida di validazione per la tipizzazione SARS-CoV-2 utilizzando tre diversi metodi NGS che soddisfano gli standard ISO15189. Questi includono la valutazione del rischio, della specificità, dell'accuratezza, della riproducibilità e della ripetibilità dei metodi. Tra i tre metodi utilizzati, due sono basati su ampliconi che coinvolgono la reazione a catena della polimerasi a trascrizione inversa (Artic v3 e Midnight v1) su Oxford Nanopore Technologies mentre il terzo è basato su ampliconi utilizzando la reazione a catena della polimerasi a complemento inverso (Nimagen) su tecnologia Illumina. Abbiamo riscontrato che tutti i metodi soddisfacevano i requisiti di qualità (ad esempio, risultati di tipizzazione concordanti al 100% in termini di accuratezza, riproducibilità e ripetibilità) per la tipizzazione SARS-CoV-2 in ambito clinico. Inoltre, i risultati di tipizzazione emersi da ciascuno dei tre metodi di sequenziamento sono stati confrontati utilizzando tre nomenclature ampiamente conosciute (OMS, Pangolineage e Nextclade). Sono stati confrontati anche per quanto riguarda le variazioni dei singoli nucleotidi. I risultati hanno mostrato che Artic v3 e Nimagen dovrebbero essere privilegiati per le indagini sulle epidemie poiché forniscono risultati di qualità superiore per i campioni che non soddisfano i criteri di inclusione per l’analisi in un contesto clinico. Questo studio è un primo passo verso la validazione dei test NGS sviluppati in laboratorio nel contesto del nuovo regolamento europeo per i dispositivi medici e la diagnostica in vitro.

I coronavirus sono virus a RNA a singolo filamento, ampiamente distribuiti tra i mammiferi e gli uccelli, che causano un’ampia gamma di malattie, comprese le infezioni respiratorie. Questi virus presentano una grande diversità genetica e un'elevata capacità di effettuare ricombinazioni e mutazioni genetiche1,2. Alla fine del 2019, un nuovo membro della sottofamiglia dei coronavirus, denominato SARS-CoV-2, è stato rilevato per la prima volta in Cina (Wuhan) ed è diventato responsabile della pandemia globale senza precedenti che ne è seguita. Nonostante la sua bassa frequenza di mutazioni rispetto ad altri virus a RNA3, l’elevato tasso di trasmissione di SARS-CoV-2 nell’uomo aumenta le possibilità di acquisizione di mutazioni e di conseguente evoluzione. Pertanto, nel corso del tempo sono emerse molte varianti di SARS-CoV-2, comprese varianti di interesse e varianti di preoccupazione (VOC). Quest'ultimo presenta una maggiore trasmissibilità e/o capacità di eludere l'immunità rispetto ai ceppi precedentemente circolanti3,4,5,6.

La maggior parte dei paesi ha cercato di controllare le nuove ondate di infezione attuando misure di sanità pubblica con l’obiettivo di evitare l’inondazione delle strutture sanitarie, garantendo così l’accesso all’assistenza sanitaria alle persone che necessitano di cure essenziali. In questo contesto, è stato fondamentale sviluppare un’efficiente rete di sorveglianza che consenta l’individuazione precoce di nuove varianti circolanti e della loro trasmissione nella popolazione7,8. Il sequenziamento dell’intero genoma non solo aiuta gli scienziati a studiare il virus e a sviluppare vaccini, ma è anche lo strumento chiave per creare solide reti di sorveglianza.

L'intero genoma della SARS-CoV-2 è stato sequenziato per la prima volta all'inizio del 2020 utilizzando cellule infettate dal virus e combinando diverse tecnologie di sequenziamento di nuova generazione (NGS) (ad esempio Illumina e Oxford Nanopore Technologies)9. Entrambe le tecnologie sono ancora ampiamente utilizzate in tutto il mondo per ottenere sequenze di ceppi circolanti5,6,7,10,11. Nel settembre 2020, la rete nazionale di sequenziamento del Regno Unito, denominata Coronavirus Disease 2019 (COVID-19) Genomics UK Consortium, ha identificato il primo COV noto oggi come variante alfa (B.1.1.7). Questa variante di SARS-CoV-2 è caratterizzata dalla delezione HV69-70 e dalla mutazione dell’amminoacido N501Y. Era in grado di diffondersi molto rapidamente e mostrava un totale di 14 sostituzioni di aminoacidi specifiche del lignaggio rispetto al primo ceppo identificato a Wuhan, comprese tre mutazioni note per conferire benefici epidemiologici (ovvero N501Y, delezione 69-70, P681H)7,12 . Da allora, sono state identificate a livello globale quattro varianti principali che destano preoccupazione: beta (K417N, E484K), gamma (K417T, V1176F), delta (L19R, L452R, delezione 157-158, L452R, T478K, D950N) e l'ultima omicron (R346K, L452X, F486V) variante. Ognuna di queste varianti ha accumulato mutazioni che conferiscono loro vantaggi evolutivi fino alle varianti omicron attualmente più diffuse che hanno acquisito più di 60 mutazioni rispetto al genoma di riferimento di Wuhan6,13,14.

25. 40 \(\upmu\)L of each pool diluted with 60 \(\upmu\)L of RC-PCR Low-TE buffer (Nimagen B.V.; Nijmegen, Netherlands) was purified using 85 \(\upmu\)L of Solid Phase Reversible Immobilization (SPRI) AmplicleanTM magnetic beads (Nimagen B.V.; Nijmegen, Netherlands) by mixing DNA and beads (beads:DNA ratio = 0.85), followed by incubation of the mix at room temperature (RT) for 5 min, then beads were washed twice with 75% ethanol. Beads covered with DNA fragments of interest were mixed with 110 \(\upmu\)L of RC-PCR Low TE Buffer (Nimagen B.V.; Netherlands) and incubated at RT for 2 min. The purification procedure was repeated a second time. Eluted DNA from each pool was quantified using the 1xdsDNA HS kit (Thermo Fisher Scientific; MA, USA) with the Qubit 4.0 (Thermo Fisher Scientific; MA, USA) and amplicons size and integrity were checked using the QIAxcel fragment analyzer (Qiagen; Hilden, Germany) with the DNA Screening Kit (Qiagen; Hilden, Germany)./p>9) and their length (Artic: minimum length= 400 bp - maximum length= 700 bp, Midnight: minimum length= 600 bp - maximum length= 1,200 bp) to avoid chimeric reads. The passed reads were mapped to the reference genome of SARS-CoV-2 MN908947.3 using minimap2 (version 2.18-r1015) and SNVs were called for positions with depth of reads \(\ge\) 20, and consensus sequence obtained using medaka (version 1.4.3, model r941_prom_variant_g360) a software using trained neural network-based models to appropriately call sequence variations29./p> 0.81 for SNV identification./p> 0.81 for SNV identification./p> 100x, run 2: mean coverage= 0x, 0% > 100x, run 3: mean coverage= 5x, 1.5% > 100x)./p> 0.8) for all samples with a qPCR Ct value < 25 (Artic v3: mean \(\kappa\) = 0.9918 ± 0.01060, Midnight v1: mean \(\kappa\) = 1 ± 0, Nimagen: mean \(\kappa\) = 0.9433 ± 0.1468). For the sample with the highest qPCR Ct value (Ct = 29.01), coefficients are lower (Artic v3: \(\kappa\) = 0.6896 ± 0.02007, Midnight v1: \(\kappa\) = 0 ± 0.00005, Nimagen: \(\kappa\) = 0.7659 ± 0.05119) indicating a greater discrepancy, especially for the Midnight v1 SOP. Both short-amplicon methods (Artic v3 and Nimagen) have a coefficient indicating a high correlation (Fig. 1 left panel). Although the reproducibility of the three methods is similar for samples with a qPCR Ct value <25, the reproducibility of the Midnight v1 SOP is significantly different from that of both other methods for samples with a qPCR Ct value >25 (Supplementary table 3)./p> 100x, repeat 2: mean coverage= 0x, 0% > 100x, repeat 3: mean coverage= 1x, 0% > 100x) (Supplementary table 4)./p> 25 (Artic v3: \(\kappa\) = 0.7279 ± 0.08269, Midnight v1: \(\kappa\) = 0 ± 0, Nimagen: \(\kappa\) = 0.8837 ± 0.03753) still showing a high repeatability for Nimagen and Artic while Midnight v1 is not repeatable./p>25 (Artic v3: \(\kappa\) = 0.7581 ± 0.01951, Nimagen: \(\kappa\) = 0.8287 ± 0.01903), especially for the Midnight v1 SOP which had a \(\kappa\) coefficient = 0 ± 0.00003, indicating that it was not repeatable for samples with a qPCR Ct value > 25 (Fig. 1 right panel). This was due to the low read depth (<20) at most nucleotide positions for two repeats performed with the Midnight v1 SOP. As this depth was the minimum threshold set in the bio-informatics pipeline for nucleotide calling in the consensus sequence, and as the third repeat had a sufficient read depth at these positions, the analysis resulted in a complete mismatch. Although the repeatability is not significantly different between the three methods for samples with qPCR Ct value <25, the repeatability of the Midnight v1 SOP is significantly different when compared with both other methods for qPCR Ct value >25 (Supplementary table 3)./p> 25 in clinical setting, sequencing results and strain typing can be obtained in non-clinical setting but should be interpreted with caution. Therefore, we compared the three methods using fifty-five samples without considering the Ct value exclusion criteria./p>30 for the N-gene (Table 2)./p>25 (Table 2), which led us to study the evolution of genome coverage as a function of viral load. We observed that for the three SOPs, the coverage was high for all samples with a N-gene qPCR Ct values <25 (96% and 90% of samples had a mean coverage above 380x for Artic v3 and Midnight v1 methods, respectively, and 90% of samples have a mean coverage above 600\(\times\) for Nimagen method) but the sequencing coverage dropped drastically with the three SOPs for samples with a qPCR Ct value >25 (Fig. 2)./p>25./p>25, the kappa coefficient decreased progressively with the increase of Ct value. This decrease was similar when comparing any method to one another (Fig. 3). However, all the mismatches observed can be explained by a too low read depth at the position of the mismatch for the method that did not identify the mutation (<20 reads for the Nanopore methods or <5 reads for the Illumina method). When, at that genomic position, the depth of reads was greater than 0 but below the previously mentioned cut-offs, we observed that the mutation was present in more than 70% of the reads, indicating that the discrepancies were not due to sequencing errors inherent to the methods but rather to the detection thresholds set in the bio-informatics pipelines./p>25 usually showed insufficient read depth which provided low reliability on some key mutations, which could lead to wrong or approximate lineage designation, highlighting the importance of sample selection criteria in the context of national surveillance programs using clinical samples8,38. Our data confirmed that the three methods validated here provided similar quality results and were adequate for epidemiological monitoring of SARS-CoV-2 using samples with N-gene qPCR CT value <25 in clinical setting./p>25), a method using smaller amplicons (Artic v3 and Nimagen) should be preferred as they exhibit better reproducibility and repeatability, and a higher mean coverage of the genome. This variability in coverage for samples with a low viral load had already been reported by Freed et al. Nevertheless, they have shown that it was possible to reach good quality results by generating more sequencing data than for samples with high or medium viral loads. This was not achieved in our study as we sequenced all samples under the same conditions. It has also been shown that in order to effectively detect SNVs and by extension reach a minimum coverage of 400x with an amplicon-based NGS technique, the material used for reverse transcription should contain at least 1,000 copies of viral RNA39,40./p>

CONDIVIDERE