UVOD
Razvoj sekvenciranja naslednje generacije (angl. next generation sequencing, NGS) je povzročil revolucijo na področju določanja nukleotidnih zaporedij, saj je le-to postalo dosti hitrejše in cenejše. Zaradi zmožnosti sočasne analize celotnega genoma se je NGS hitro uveljavil v klinični diagnostiki, ki je bila pred tem omejena na določanje zaporedja posameznih genov. V genetski diagnostiki se NGS najbolj pogosto uporablja v diagnostiki prirojenih bolezni in onkologiji. V zadnjem času pa prodira tudi na druga področja, kot sta mikrobna diagnostika (1) in določanje tkivne skladnosti (2). V nadaljevanju se bomo osredotočili na diagnostiko prirojenih bolezni, kjer bodo predstavljeni potek analize ter zmogljivosti in omejitve NGS (Slika 1).
Pojem NGS označuje različne tehnologije sekvenciranja, za katere je značilno, da omogočajo analizo ogromnega števila zaporedij hkrati. Izmed prvotnih tehnologij NGS je danes v širši rabi tehnologija sekvenciranja s sintezo podjetja Illumina (3), zaradi česar izraz NGS pogosto kar enačimo z njo (to velja tudi za nadaljevanje članka, razen če ni navedeno drugače). NGS temelji na sekvenciranju kratkih fragmentov DNA (300 baznih parov), ki so pripeti na pretočno celico, kar omogoča njihovo prostorsko ločbo in sočasno analizo. Sekvenciranje poteka preko sinteze komplementarne verige DNA, kjer se nanjo postopoma dodajajo nukleotidi s fluorescenčno oznako. Zajemanje svetlobnega signala na koncu vsakega dodanega nukleotida omogoča določitev nukleotida, ki se je v tistem krogu vgradil v verigo. V kategorijo NGS uvrščamo tudi novejšo, tretjo generacijo sekvenciranja, katere pomemben predstavnik je sekvenciranje z nanoporami, ki prav tako počasi postaja sestavni del klinične diagnostike. Tretja generacija sekvenciranja omogoča veliko daljša branja (> 10 kb) kot druga (kamor spada Illumina) in služi kot komplementarna metoda v primerih, pri katerih je zmogljivost sekvenciranja s sekvenatorji Illumina slabša, npr. ponavljajoča zaporedja in psevdogeni (4).
Cilj uporabe NGS v diagnostiki prirojenih bolezni je odkritje ene ali več genetskih sprememb, ki bi nam pojasnile klinično sliko preiskovanca. Pod pojmom genetska sprememba razumemo kakršnokoli odstopanje od nukleotidnega zaporedja referenčnega človeškega genoma. Pri tem gre lahko za manjše genetske spremembe, kot v primeru sprememb posameznih nukleotidov (angl. single nucleotide variant, SNV) in kratkih insercij/delecij, ali večje strukturne spremembe, kot so duplikacije, translokacije, inverzije ter večje insercije/delecije. Večina genetskih sprememb je benigne narave, nekatere pa lahko vodijo do nastanka patoloških stanj. Pri iskanju vzročnih patogenih genetskih sprememb ločimo tri različne pristope glede na območje, ki ga v genomu analiziramo: analiza panela genov, sekvenciranje celotnega eksoma (angl. whole exome sequencing, WES) in sekvenciranje celotnega genoma (angl. whole genome sequencing, WGS). Vsak izmed pristopov ima svoje prednosti in slabosti, v praksi se trenutno najpogosteje uporablja sekvenciranje celotnega eksoma (5).
Analiza panela genov
Pri analizi panela genov pripravimo NGS knjižnico za zgolj vnaprej izbrane gene, ki so povezani z opazovanimi kliničnimi znaki (npr. prirojena izguba sluha) (6). Z omejitvijo na manjše število preiskovanih genov se zmanjšajo stroški sekvenciranja, prav tako je enostavnejša tudi nadaljnja bioinformatska analiza rezultatov. Slabost tega pristopa je možnost, da se vzročni gen ne nahaja v izbranem panelu in ga tako v analizi ne bomo zajeli. Prav tako lahko težavo povzročajo neklasične kombinacije kliničnih znakov, kjer se pojavi dilema, panel katerih genov je smiselno analizirati.
Sekvenciranje celotnega eksoma
Eksom obsega vse nukleotidne regije na DNA, ki kodirajo proteine v genomu, in predstavlja med 1 in 2 % celotnega genoma. Pri WES se priprava NGS knjižnice iz panela izbranih genov razširi na vse eksonske regije v genomu. S tem povečamo verjetnost, da bomo v analizo zajeli patogeno genetsko spremembo, hkrati pa je zaradi večje velikosti preiskovanega območja analiza dražja in zahtevnejša (7).
Sekvenciranje celotnega genoma
WGS dodatno poveča možnost za najdbo vzročne patogene genetske spremembe, hkrati pa se pri WGS izognemo stopnji obogatitve DNA knjižnice, zaradi česar je globina branja skozi celoten genom enakomernejša (8). WGS omogoča tudi lažjo določitev strukturnih genomskih sprememb, opredelitev mitohondrijskega genotipa na mitohondrijskem genomu, opredelitev večjih sprememb v številu kopij odseka genoma in njihovih lomov. Njegova ključna slaba lastnost je dražja in časovno zamudnejša analiza.
POTEK SEKVENCIRANJA S TEHNOLOGIJO NGS
Izolacija DNA in priprava DNA knjižnice
Priprava DNA knjižnice se nanaša na postopek priprave vzorca DNA za izvedbo sekvenciranja. Začetni material je izolirana DNA, pri čemer se za izolacijo najpogosteje uporabljata periferna kri in slina. Ker tehnologija NGS temelji na sekvenciranju kratkih fragmentov DNA, je treba narediti fragmentacijo izolirane DNA, in sicer s fizikalnimi (npr. soniciranje) ali encimskimi metodami, medtem ko se kemične metode pogosteje uporabljajo za fragmentacijo RNA (9). Po fragmentaciji naredimo selekcijo fragmentov dolžine 300–500 bp z metodo čiščenja na paramagnetnih kroglicah. Paramagnetne kroglice glede na ionsko moč selektivno vežejo nukleinske kisline po velikosti ter se tako uporabljajo za visoko učinkovite protokole izolacije in čiščenja fragmentov DNA. Po selekciji velikosti fragmentov se z ligacijo ali verižno reakcijo s polimerazo (PCR) na obeh koncih posameznega fragmenta DNA pritrdita adapterska oligonukleotida s tako imenovano »molekularno črtno kodo«. Ta je sestavljena iz unikatnega nukleotidnega zaporedja, ki v primeru vzporednega sekvenciranja več vzorcev hkrati služi kot identifikacijska regija za določitev, kateremu vzorcu pripadajo prebrana zaporedja DNA. Poleg molekularne črtne kode vsebuje adapter tudi regijo, ki omogoča pritrditev fragmenta DNA na pretočno celico. Pojem DNA knjižnica se nanaša na skupek vseh fragmentov DNA posameznega vzorca s pripetimi adapterji. Po pripravi DNA knjižnice za posameznega preiskovanca je treba ovrednotiti količino, kakovost in dolžino pripravljenih fragmentov DNA. To običajno storimo z avtomatsko elektroforezo.
Obogatitev DNA knjižnice
Pri analizi izbranega panela genov in WES naredimo tudi obogatitev DNA knjižnice, s katero v njej povečamo delež fragmentov, ki pripadajo preučevanim regijam v genomu. To dosežemo bodisi s pomnoževanjem izbranih fragmentov DNA s PCR ali z njihovo izolacijo preko hibridizacije s komplementarnim zaporedjem (10). V primeru izvedbe WES je priporočljivo, da obogatena DNA knjižnica poleg eksonskih regij vsebuje tudi začetni del nukleotidnega zaporedja sosednjih intronov, saj se tu pogosto nahajajo genetske spremembe, ki spremenijo proces izrezovanja (11). Pomanjkljivost obogatitve DNA knjižnice je neenakomerna pomnožitev oziroma izolacija posameznih fragmentov DNA, zaradi česar tudi globina branja na različnih mestih ni enakomerna. Obogatitev pri WGS ni potrebna, saj določamo zaporedje celotnega genoma.
Sekvenciranje s tehnologijo Illumina
Fragmenti DNA ene ali več pripravljenih DNA knjižnic se s pomnoževanjem preko mostov pritrdijo na pretočno celico, kjer nato poteka sekvenciranje. Ker je dobljena dolžina zaporedja (100–300 bp) običajno krajša od dolžine fragmenta, določimo zgolj zaporedje njegovega 5‘ končnega dela. Sekvenciranje lahko nato ponovimo tudi na drugem koncu komplementarne verige fragmenta DNA, s čimer dobimo zaporedji parnih koncev (angl. paired-end read), ki sta ločeni z vmesnim delom, kjer zaporedje ni določeno (3).
BIOINFORMATSKA ANALIZA
Surovi podatki sekvenciranja zahtevajo nadaljnjo analizo z različnimi bioinformatskimi orodji. Proces lahko razdelimo v štiri stopnje: določitev baz, poravnava zaporedij, določitev genetskih sprememb in njihova anotacija.
Določitev baz
Določitev baz zaobjema pretvorbo signalov (npr. svetlobnih ali električnih), zajetih med sekvenciranjem v nukleotidno zaporedje. V primeru sočasne analize več vzorcev je hkrati potrebno tudi razvrstiti, katera zaporedja pripadajo kateremu vzorcu. Pri tem so v pomoč »molekularne črtne kode,« ki se nahajajo na začetku vsakega zaporedja (12). Razvrščena zaporedja so shranjena v obliki datoteke formata FASTQ, ki poleg nukleotidnih zaporedij vsebuje tudi podatke o zanesljivosti določitve posameznih nukleotidov.
Poravnava zaporedij
Zaporedja posameznih fragmentov DNA služijo kot osnova za pridobitev celotnega zaporedja eksoma, genoma ali panela genov. Sestavljanje zaporedja genoma de novo (tj. brez uporabe referenčnega genoma) je računsko zahtevno in zahteva večjo količino generiranih podatkov (13), zaradi česar se običajno za sestavo genomskega zaporedja uporablja prileganje fragmentov DNA na referenčni genom. V ta namen so bila razvita različna orodja za prileganje, ki vključujejo kombinacijo globalne in lokalne poravnave (14). Rezultati poravnave so shranjeni v datoteki formata BAM (angl. binary alignment map), ki za vsak posamezen fragment DNA vsebuje podatke o mestu poravnave in morebitnih neujemanjih (15).
Določitev genetskih sprememb
Na podlagi poravnanih zaporedij in neujemanj z referenčnim genomom določimo prisotnost genetskih sprememb. Te so zbrane v datoteki formata VCF (angl. variant call format). V njej sta med drugim za vsako genetsko spremembo določena njeno nahajališče v genomu ter podatek, za kakšno spremembo v zaporedju gre. Podan je tudi podatek o vertikalni pokritosti oziroma globini branja, ki je opredeljena kot število unikatnih fragmentov DNA, ki vsebujejo dani nukleotid na nekem mestu v genomu (16). Večja kot je vertikalna pokritost genetske spremembe, večja je verjetnost, da je ta v genomu dejansko prisotna in ni zgolj artefakt. Za določitev prisotnosti heterozigotnih genetskih sprememb je okvirno potrebna vsaj desetkratna vertikalna pokritost posameznega nukleotida (17). V praksi se izkaže, da je vertikalna pokritost nukleotidov skozi celoten genom oziroma eksom neenakomerna, zaradi tega mora biti povprečna pokritost genoma oziroma eksoma (tj. povprečna vrednost vertikalnih pokritosti posameznih nukleotidov v celotnem genomu oziroma eksomu) višja. S tem dosežemo zadostno globino branj tudi v regijah z nižjo vertikalno pokritostjo nukleotidov. Pri WGS, kjer je vertikalna pokritost razmeroma enakomerna, je priporočljivo, da je povprečna pokritost genoma vsaj 30-kratna, pri WES, kjer pokritost močneje variira, pa vsaj 75–100kratna (11). Če želimo zaznati nizke stopnje mozaicizma ali heteroplazmije, mora biti povprečna pokritost genoma ustrezno višja. Poleg podatka o vertikalni pokritosti je informativen tudi podatek o alelnem deležu genetske spremembe, ki je opredeljen kot razmerje med vertikalno pokritostjo določene genetske spremembe in celokupno vertikalno pokritostjo mesta, kjer se ta nahaja. Iz alelnega deleža je možno sklepati, ali je neka sprememba homozigotna, heterozigotna ali je prisoten mozaicizem (18).
Anotacija genetskih sprememb
Postopek anotacije omogoča povezavo genetske spremembe z informacijami o njenem vplivu na delovanje organizma. Ameriško združenje medicinskih genetikov (angl. American College of Medical Genetics and Genomics, ACMG) je izdalo smernice, v katerih priporočajo petstopenjsko razvrščanje sprememb glede na njihov klinični pomen: patogena, verjetno patogena, sprememba z neznanim kliničnim pomenom, verjetno benigna in benigna (19). V kategoriji patogenih (povzročajo nastanek določene bolezni) in benignih (ne povzročajo nastanka bolezni) spadajo tiste genetske spremembe, za katere obstaja trdna znanstvena podlaga o njihovem kliničnem pomenu, medtem ko v kategoriji verjetno patogenih oziroma verjetno benignih spadajo tiste genetske spremembe, pri katerih lahko z vsaj 90odstotno gotovostjo trdimo o njihovem kliničnem pomenu. Če ni jasnih povezav s klinično sliko, se genetska sprememba razvršča kot sprememba z neznanim kliničnim pomenom. Ker je gotovost o povezavi težko kvantitativno oceniti, med posameznimi kategorijami ni ostre meje. Prav tako lahko nova spoznanja privedejo do ponovne razvrstitve posameznih genetskih sprememb. Najpogosteje uporabljeni podatki za določitev kategorije vključujejo pojavnost genetske spremembe v splošni populaciji in populaciji obolelih, funkcionalne študije, vrsto genetske spremembe in predviden vpliv, primerjavo z že znanimi genetskimi spremembami in rezultate računalniških modelov (20). Ti podatki se črpajo iz objavljene znanstvene literature, podatkovnih baz ter rezultatov napovednih algoritmov. Populacijske podatkovne baze (npr. dbSNP, dbVAR in gnomAD) vsebujejo podatke o prisotnosti in frekvenci genetskih sprememb v neki populaciji, vendar ni nujno, da vsebujejo podatke o njihovem kliničnem pomenu (21, 22, 23, 24). Kljub temu lahko na podlagi podatka o frekvenci genetske spremembe o njeni funkciji deloma sklepamo, saj običajno velja, da splošno prisotne genetske spremembe niso patogene. Drugi tip podatkovnih baz obsega baze patogenih genetskih sprememb (ClinVar, OMIM, HGMD itd.) in tako vsebuje tudi podatke o njihovem kliničnem pomenu (25, 26, 27). Pri interpretaciji podatkov iz podatkovnih baz je potrebna pozornost, v kakšni meri so informacije posodobljene in podprte z zanesljivimi viri. Rezultate podatkovnih baz lahko kombiniramo z algoritmi, ki skušajo napovedati vpliv neke genetske spremembe na izražanje genov ter na funkcijo in strukturo izraženih proteinov. Najpogosteje so uporabljeni algoritmi za napoved posledic na aminokislinski ravni (npr. PolyPhen-2, SIFT in CADD), kjer algoritem preveri, če se prisotnost genetske spremembe izrazi kot nesmiselna oziroma drugače smiselna aminokislinska sprememba ali če pride do spremembe bralnega okvirja (28, 29). Algoritem oceni vpliv aminokislinske spremembe na podlagi njenega mesta znotraj proteina ter biokemijskih lastnosti in evolucijske ohranjenosti mutiranega aminokislinskega ostanka. Prav tako se uporabljajo algoritmi za napovedovanje mest izrezovanja intronov (npr. GeneSplicer), ki lahko napovejo pojav ali izgubo mest v prisotnosti neke genetske spremembe (30). Novejša orodja poskušajo napovedati tudi vpliv genetskih sprememb v nekodirajočih regijah (31). Občutljivost in specifičnost napovednih algoritmov se razlikujeta od primera do primera, v splošnem pa ti algoritmi še niso dovolj zanesljivi, da bi jih lahko uporabili samostojno kot edini vir informacije za napoved vpliva genetskih sprememb. Glede na velik napredek napovednih algoritmov na sorodnih področjih, kot je AlphaFold za napovedovanje tridimenzionalnih struktur proteinov (32), lahko pričakujemo, da bo v bližnji prihodnosti uporaba strojnega učenja in nevronskih mrež tudi na področju napovedovanja vpliva genetskih sprememb privedla do znatnih izboljšav napovedne moči (33).
Filtriranje genetskih sprememb
Za opredelitev vzročne genetske spremembe oziroma genetskih sprememb, ki vplivajo na klinično sliko preiskovanca, izberemo panel genov, ki so povezani s kliničnimi znaki. Pri osnovanju panela si pomagamo z bazo podatkov Human Phenotype Ontology (https://hpo.jax.org/app/) in Genomics England PanelApp (https://panelapp.genomicsengland.co.uk/). Obe bazi podatkov sta razviti na podlagi medicinske literature ter sorodnih portalov, kot so Orphanet, DECIPHER in OMIM. Izbrani panel genov uporabimo za filtriranje anotiranih genetskih sprememb. V naslednjem koraku genetske spremembe filtriramo še glede na prisotnost v populaciji ter njihov položaj v intronski, eksonski, promotorski ali regulatorni regiji. Osredotočimo se na redke genetske spremembe, ki so prisotne v eksonski, promotorski ali regulatorni regiji, saj je vpliv intronskih sprememb običajno težje razložljiv. Izjema so že znane opredeljene vzročne intronske spremembe. Pri genih, ki se dedujejo avtosomno dominantno, klinično sliko pojasnimo z opredelitvijo ene heterozigotne patološke ali verjetno patološke spremembe. Medtem ko v genih, ki se dedujejo recesivno, za pojasnitev kliničnega fenotipa opredelimo eno patološko ali verjetno patološko spremembo v homozigotni obliki oziroma dve heterozigotni spremembi, ki se nahajata na različnih alelih.
Poročanje naključnih najdb
Pri iskanju vzročnih patogenih sprememb, ki bi pojasnile klinično sliko, lahko bodisi po naključju ali načrtno odkrijemo tudi druge patogene spremembe, ki pa niso povezane z napotno diagnozo. Takim najdbam pravimo naključne oziroma sekundarne (v primeru načrtnega iskanja) in lahko razkrijejo že obstoječo nediagnosticirano bolezen ali pa povečano verjetnost za njen pojav v prihodnosti. Pri tem se pojavlja dvom, kako v takih primerih ravnati ter kdaj o najdbah preiskovanca obvestiti in kdaj ne. V ta namen je združenje ACMG sestavilo seznam genov, za katere je priporočljivo poročanje patogenih sprememb (34). Seznam ne vsebuje vseh sprememb genov, pri katerih so patogene spremembe povezane z razvojem različnih bolezni, temveč se pri uvrščanju genov na seznam ravnajo po več merilih. Glavno izmed njih je, da mora poročanje o najdbi omogočiti ukrepe, ki bi znatno zmanjšali obolevnost ali smrtnost brez prekomerne obremenitve preiskovanca in zdravstvenega sistema. Trenutni seznam vsebuje 81 genov, od katerih je največ povezanih z razvojem rakavih in kardiovaskularnih obolenj.
POMANJKLJIVOSTI NGS
Kljub temu da se je NGS uveljavila kot glavna metoda v klinični genetski diagnostiki, ima nekatere pomanjkljivosti, ki zahtevajo uporabo dodatnih metod ter pozornost pri interpretaciji rezultatov.
Določanje zaporedja problematičnih regij
Problematično je predvsem določanje prisotnosti genetskih sprememb v homolognih, repetitivnih ali z gvaninom in citozinom bogatih območjih. Homologne regije zaradi svoje medsebojne podobnosti predstavljajo oviro pri poravnavi zaporedij, saj je včasih nemogoče nedvoumno določiti, kateri regiji pripada neko zaporedje. Tako lahko v primeru napačnega prileganja pride do pojava lažno pozitivnih ali lažno negativnih rezultatov (35). Podobna težava nastopi pri repetitivnih regijah, kjer je težko določiti pravo mesto poravnave, če zaporedje fragmenta DNA vsebuje zgolj repetitivni element (36). Hkrati so repetitivne in homopolimerne regije močneje izpostavljene napakam pri sekvenciranju in pomnoževanju s PCR, saj lahko pride do zdrsa polimeraze (37). Slabša kakovost rezultatov je tudi v regijah, bogatih z gvaninom in citozinom, kjer pogosteje pride do napačne določitve baz (38).
Določanje strukturnih sprememb in sprememb v številu kopij
Medtem ko se NGS razmeroma dobro odreže pri določanju SNV in kratkih insercij oz. delecij, je določevanje večjih kompleksnih strukturnih sprememb in sprememb v številu kopij (angl. copy number variant, CNV) zahtevnejše (39). Razlog je predvsem kratka dolžina prebranih fragmentov DNA, ki jih je v primeru večjih sprememb težko pravilno prilegati na genom. Opredelitev takih genetskih sprememb lahko olajšajo uporaba podatkov o globini branja prebranih zaporedij, sekvenciranje parnih koncev fragmentov DNA ali pa poravnava zaporedij de novo brez uporabe referenčnega genoma (40, 41).
Uspešnost določanja genetskih sprememb v zahtevnejših regijah lahko izboljšamo s sočasno uporabo sorodnih metod. V nekaterih primerih lahko zaporedje problematičnih regij uspešno določimo s sekvenciranjem po Sangerju (42). Prav tako lahko posamezno regijo pred sekvenciranjem specifično pomnožimo s PCR, s čimer povečamo globino branja in se izognemo napačnemu prileganju na homologne regije (35). V zadnjem času se vse pogosteje uporabljajo tehnike tretje generacije sekvenciranja, ki s svojo dolgo dolžino branja olajšajo določanje strukturnih sprememb in zaporedij v problematičnih regijah (4).
KLINIČNI PRIMER
Kot oris uporabe NGS sekvenciranja v klinični diagnostiki prirojenih bolezni je naveden primer bolnika s prirojeno katarakto. Ker je bil bolnik na intenzivni enoti, je bilo naročeno nujno genomsko sekvenciranje. Iz krvi smo izolirali DNA in pripravili DNA knjižnico celotnega genoma. DNA smo z metodo sonikacije fragmentirali ter na oba konca fragmentirane DNA ligirali adapterske oligonukleotide s tako imenovano »molekularno črtno kodo«. Po pripravi DNA knjižnice smo izvedli sekvenciranje s sekvenatorjem Illumina NovaSeq6000. Po končanem sekvenciranju smo naredili bioinformatsko analizo, pri kateri smo s pretvorbo svetlobnih signalov v zaporedje baz določili nukleotidno zaporedje vseh fragmentov DNA ter na podlagi »molekularne črtne kode« določili branja, ki pripadajo preiskovanemu bolniku. S specifičnimi bioinformatskimi orodji smo prilegali izbrana branja na humani referenčni genom. Sledila je določitev genetskih sprememb, ki se razlikujejo od referenčnega genoma ter anotacija le-teh. Pri analizi genetskih sprememb smo pregledali izbrani panel genov, povezanih z izraženim kliničnimi znaki. Po izločitvi intergenskih in intronskih sprememb smo v genu ATAD3A, ki kodira mitohondrijsko membransko ATPazo, našli tri heterozigotne spremembe, ki jih v splošni populaciji ni ali pa so zelo redke in prisotne s frekvenco manj kot 0,1 % (gnomAD). Sprememba c.57C>G (NM_001170535) se nahaja 57 nukleotidov pred start kodonom gena ATAD3A in lahko potencialno vpliva na učinkovitost promotorja ter tako na izražanje gena, vendar njena biološka funkcija ni znana. Sprememba c.229C>G (rs138594222) povzroči zamenjavo levcinskega ostanka na mestu 77 z valinskim (p.Leu77Val) in je v podatkovni bazi HGMD opisana kot patološka, saj povzroči delno izgubo funkcije proteina ATAD3A (43). Sprememba c.282+484_444+227del predstavlja 1,4 kb veliko delecijo, ki zajema eksona 3 in 4 gena ATAD3A (Slika 2). Sprememba je opisana v bazi ClinVar kot patogena delecija. Z analizo sekvenciranja genoma smo opredelili dve patološki spremembi, ki predstavljata verjeten vzrok za opažene klinične znake. Za natančnejšo opredelitev povezave opisanih sprememb z izraženimi kliničnimi znaki bolnika smo opravili tudi analizo družinske segregacije opisanih genetskih sprememb in potrdili, da se patološki spremembi nahajata na različnih alelih.
ZAKLJUČEK
Prihod NGS je v diagnostiki prirojenih bolezni omogočil premik od zamudnega ciljnega iskanja vzročnega gena do hitre analize celotnega genoma, zaradi česar se je uspešnost iskanja genetskega vzroka bolezni močno izboljšala. Poleg hitrejše in celovitejše analize je NGS močno pospešil tudi pridobivanje informacij o človeškem genomu, zaradi česar poznamo čedalje več genetskih sprememb ter njihov vpliv na razvoj bolezni. Skupaj z razvojem sekvenciranja so se razvila tudi številna bioinformatska orodja, ki omogočajo obdelavo ogromne količine podatkov, ki jih pridobimo z NGS. Kljub uspešnosti sekvenciranja s tehnologijo Illumina pri določanju krajših sprememb, se ta slabše obnese pri daljših strukturnih spremembah. V teh primerih se kot rešitev kaže prihod tretje generacije sekvenciranja z dolgimi branji. V bližnji prihodnosti pa nas verjetno čaka še naslednji preboj, ki ga bo prinesla vpeljava umetne inteligence pri napovedovanju posledic genetskih sprememb na izražanje in delovanje proteinov, s čimer bo močno olajšana anotacija sprememb, ki je pogosto ozko grlo analiz.