Moment captured by Marius Mariș |
www.the-workaholi.com | www.komiti.media

Lector: Prof. univ. dr. Jean-François Flot

Data de începere curs: 08.03.2023

Cursul urmărește decodificarea informațiilor genetice conținute în ADN-ul unui organism, prin secvențierea și asamblarea genomică.

Durata cursului: 08.03.2023 – 10.03.2023

Data evaluării: 10.03.2023

Data acordării atestatelor: 28.03.2023

Taxă curs: 0 lei

1. Principii de sercvențiere genomică și asamblare

Secvențierea și asamblarea genomică sunt doi pași importanți în procesul de decodificare a informațiilor genetice conținute în ADN-ul unui organism. Principiile secvențierii și asamblării genomice pot fi rezumate după cum urmează: 1.1. Pregătirea probei: Primul pas în secvențierea unui genom este obținerea unei mostre din ADN-ul organismului. Acest lucru se poate face prin extragerea ADN-ului dintr-o probă de țesut, probă de sânge sau orice altă sursă de ADN.

1.2. Pregătirea bibliotecii: Odată ce ADN-ul a fost extras, acesta este fragmentat în bucăți mai mici și secvențiat. Fragmentele sunt apoi secvențiate folosind o tehnologie de secvențiere masivă, cum ar fi Illumina sau PacBio.
1.3. Alinierea secvenței: Următorul pas este alinierea secvențelor la un genom de referință sau între ele. Acest lucru se face folosind un software specializat care compară secvențele și identifică regiunile de suprapunere.
1.4. Asamblare: După aliniere, secvențele sunt asamblate în secvențe contigue mai lungi, numite contigs. Acest proces implică suprapunerea secvențelor pentru a forma o secvență consens care reprezintă ADN-ul original.
1.5. Controlul calității: Controlul calității este o etapă critică în procesul de secvențiere și asamblare genomice. Aceasta implică verificarea acurateții și completității genomului asamblat, precum și identificarea oricăror erori sau lacune în secvență.
În general, principiile de secvențiere și asamblare genomice implică o serie de pași tehnici care necesită echipamente specializate, software și expertiză. Urmând acești pași, cercetătorii pot genera secvențe de genom de înaltă calitate care oferă informații valoroase asupra structurii genetice a organismelor. 

2. Exerciții practice de asamblare genomică

3. Evaluarea calității unui genom asamblat 

Evaluarea calității unui genom asamblat este un pas esențial în proiectele de secvențiere a genomului pentru a se asigura că ansambarea este cât mai precisă și completă. Metodele frecvent utilizate pentru a evalua calitatea unui genom ansamblat:
3.1. Statistici de asamblare: O metodă de bază pentru a evalua calitatea unui genom ansamblat este de a analiza statisticile de asamblare, cum ar fi numărul total de contiguri sau schele, N50, L50 și dimensiunea genomului. Aceste metrici dau o idee generală asupra completității și continuității genomului ansamblat.
3.2. Evaluarea completității genomului: Completitudinea genomului poate fi evaluată folosind o varietate de instrumente, cum ar fi BUSCO, CheckM și QUAST. Aceste instrumente compară genom ansamblat cu un set de gene conservate care se așteaptă să fie prezente în toate genomurile, oferind astfel o estimare a completității genom ansamblat.
3.3. Consecvența cu datele de secvențiere: genomul ansamblat poate fi validat prin cartarea citirilor brute de secvențiere la genomul ansamblat și prin verificarea coerenței în ceea ce privește acoperirea citirii, adâncimea și distribuția. Prezența unor goluri semnificative sau nepotriviri între citiri și ansamblu poate indica erori potențiale în asamblare.
3.4. Analiza sinteniei: compară genomul ansamblat cu genomul de referință sau cu genomul altor specii înrudite pentru a identifica rearanjamentele structurale sau diferențele de ordine a genelor care pot indica erori în genomul ansamblat.
3.5. Cartografierea Hi-C: cartografierea Hi-C poate fi utilizată pentru a valida genomul ansamblat prin confirmarea interacțiunilor dintre fragmentele de ADN îndepărtate, ceea ce poate ajuta la detectarea ansamblurilor greșite, la rezolvarea neconcordanțelor și la identificarea contigurilor neorientate.
3.6. Analiza repetată: este crucială pentru identificarea și mascarea secvențelor repetitive din genom, care pot fi o sursă de erori și fragmentare a ansamblului. Instrumente precum RepeatMasker și RepeatModeler pot fi utilizate în acest scop. 

În rezumat, o combinație a acestor metode poate fi utilizată pentru a evalua calitatea unui genom asamblat și pentru a se asigura că genomul este cât mai exact și complet posibil.

4. Optimizarea asamblărilor genomice și analize avansate

Îmbunătățirea ansamblării genomului este un proces complex și iterativ care poate fi rezolvat folosind următoarele strategii:
4.1. Creșterea adâncimea de secvențiere: o adâncime de secvențiere mai mare poate ajuta la reducerea erorilor și la creșterea preciziei ansamblului. Acest lucru poate fi realizat prin secvențierea genomului la o adâncime mai mare sau prin combinarea datelor de la mai multe platforme de secvențiere.
4.2. Utilizarea tehnologii de secvențiere cu citire lungă: tehnologiile de secvențiere cu citire lungă, cum ar fi PacBio sau Oxford Nanopore, pot produce citiri care se întind pe regiuni genomice mari, reducând nevoia de algoritmi de asamblare pentru a lega fragmente mai mici. Acest lucru poate îmbunătăți continuitatea și completitudinea ansamblului.
4.3. Utilizarea secvențierea cu citire legată: tehnologiile de secvențiere cu citire legată, cum ar fi 10x Genomics, pot adăuga o etichetă cu cod de bare la fiecare citire, permițând identificarea citirilor care provin din aceeași regiune genomică. Acest lucru poate ajuta la etapizarea ansamblului și poate îmbunătăți acuratețea reconstrucției haplotipului. 4.4. Utilizarea unei abordări hibride: combinarea datelor din mai multe tehnologii de secvențiere, cum ar fi Illumina și PacBio, poate valorifica punctele forte ale fiecărei platforme pentru a produce un ansamblu mai precis.
4.5. Utilizarea unui genom de referință: Dacă o specie strâns înrudită are un genom bine asamblat, acesta poate fi folosit ca referință pentru a schela ansamblul, ghidând plasarea contigurilor și îmbunătățind acuratețea ansamblului. 4.6. Curățarea manuală: poate ajuta la identificarea și corectarea erorilor, cum ar fi asamblarea necorespunzătoare sau contigurile himerice. Acest lucru se poate face folosind instrumente precum software-ul de vizualizare sau prin compararea ansamblului cu alte surse de date genomice, cum ar fi datele transcriptomice.
4.7. Controlul calității: este important să se efectueze verificări de control al calității genomului asamblat pentru a identifica potențiale erori sau lacune în secvență. Controlul calității genomului asamblat include măsuri precum evaluarea completitudinii ansamblului, identificarea potențialilor contaminanți și compararea genomului asamblat cu alte surse de date genomice.