RNA-sequencing
RNA-sequencing of RNA-seq is een moderne moleculaire laboratoriumtechniek die het mogelijk maakt om de genexpressie (de gehele transcriptionele activiteit) van cellen in kaart te brengen door middel van next-generation sequencing. Met deze techniek kan men het zogeheten transcriptoom in kaart brengen. Het transcriptoom omvat alle RNA-moleculen die op een bepaald moment in een cel of weefsel tot expressie komen, waaronder messenger RNA (mRNA), maar ook niet-coderende transcripten zoals microRNA en long non-coding RNA. RNA-seq maakt gebruik van sequencing om deze RNA-fragmenten te identificeren en te kwantificeren, waardoor men een momentopname krijgt van genexpressie in het onderzoeksmonster. De methode begint met het isoleren van RNA, het omzetten daarvan naar complementair DNA (cDNA), en vervolgens het sequencen van deze fragmenten. De verkregen sequenties worden geanalyseerd door ze te matchen tegen een referentiegenoom. Zo kunnen onderzoekers afleiden welke RNA-transcripten tot expressie komen, of specifieker kijken naar aspecten zoals splicing, intron/exongrenzen of ribosoomprofilering. RNA-seq wordt toegepast binnen zowel fundamenteel als toegepast onderzoek. Het wordt onder meer gebruikt om cellulaire responsen op stimuli te bestuderen, ziekteprocessen te ontrafelen en biomarkers te identificeren. De techniek wordt ook in kankeronderzoek gebruikt, meestal om tumorspecifieke expressieprofielen in kaart te brengen. Daarnaast speelt de techniek een rol in ontwikkelingsbiologie, immunologie en systeemgeneeskunde.

RNA-sequencing of RNA-seq is een moderne moleculaire laboratoriumtechniek die het mogelijk maakt om de genexpressie (de gehele transcriptionele activiteit) van cellen in kaart te brengen door middel van next-generation sequencing. Met deze techniek kan men het zogeheten transcriptoom in kaart brengen.
Het transcriptoom omvat alle RNA-moleculen die op een bepaald moment in een cel of weefsel tot expressie komen, waaronder messenger RNA (mRNA), maar ook niet-coderende transcripten zoals microRNA en long non-coding RNA. RNA-seq maakt gebruik van sequencing om deze RNA-fragmenten te identificeren en te kwantificeren, waardoor men een momentopname krijgt van genexpressie in het onderzoeksmonster.
De methode begint met het isoleren van RNA, het omzetten daarvan naar complementair DNA (cDNA), en vervolgens het sequencen van deze fragmenten. De verkregen sequenties worden geanalyseerd door ze te matchen tegen een referentiegenoom. Zo kunnen onderzoekers afleiden welke RNA-transcripten tot expressie komen, of specifieker kijken naar aspecten zoals splicing, intron/exongrenzen of ribosoomprofilering.
RNA-seq wordt toegepast binnen zowel fundamenteel als toegepast onderzoek. Het wordt onder meer gebruikt om cellulaire responsen op stimuli te bestuderen, ziekteprocessen te ontrafelen en biomarkers te identificeren. De techniek wordt ook in kankeronderzoek gebruikt, meestal om tumorspecifieke expressieprofielen in kaart te brengen. Daarnaast speelt de techniek een rol in ontwikkelingsbiologie, immunologie en systeemgeneeskunde.
Geschiedenis
[bewerken | brontekst bewerken]
Voor de aanvang van RNA-sequencing werden genexpressiestudies voornamelijk gebaseerd op microarrays. Deze techniek werkte op basis van hybridisatie van vooraf ontworpen probes en had een beperkte nauwkeurigheid. Door de technische nadelen verschoof het onderzoek geleidelijk naar benaderingen op basis van sequencing, zoals SAGE (serial analysis of gene expression).[2]
De introductie van next-generation sequencing vanaf 2005, met name het plaform van Illumina, maakte mogelijk om DNA zeer snel en relatief goedkoop te sequencen. Dit leidde tot de eerste RNA-seq studies.[3][4][5] Verdere verfijning van protocollen en data-analyse zorgde ervoor dat RNA-sequencing uitgroeide tot de standaardmethode in het veld van transcriptomics.[6] Een belangrijke afgeleide techniek is single-cell RNA-sequencing, waarmee genexpressieanalyse op celniveau kan worden ontrafeld.
Techniek
[bewerken | brontekst bewerken]Hoewel er manieren bestaan om RNA-moleculen direct te sequencen (bijvoorbeeld met technologieën van Oxford Nanopore),[7] is de meest gangbare manier om het RNA, na isolatie uit een cel- of weefselmonster, om te zetten in complementair DNA (cDNA). De gehele verzameling cDNA-moleculen – de library – kunnen vervolgens worden uitgelezen in een DNA-sequencer.[8][9]
Cellen brengen van nature grote hoeveelheden ribosomaal RNA tot expressie (ruim 90% van al het RNA in de cel). Dit is meestal niet informatief in de context van genexpressiestudies. Om het RNA van interesse te verrijken, vaak messenger-RNA (mRNA), maakt men gebruik van de zogeten oligo(dT)-kolom. Deze kolom bindt specifiek aan de poly(A)-staart die standaard voorkomt aan het 3'-uiteinde van eukaryoot mRNA. Er zijn echter ook veel RNA-transcripten in de cel die geen polyadenylering ondergaan, waardoor er soms voor wordt gekozen om het ribosomale RNA te reduceren (ribosomal depletion).[8]
Het geïsoleerde RNA wordt vervolgens omgezet in cDNA, wat veel stabieler is dan RNA en bovendien kan worden geamplificeerd (met behulp van DNA-polymerases) voordat sequencing plaatsvindt. Het omzetten van RNA in cDNA gebeurt met behulp van het enzym reverse-transcriptase. Meestal wordt het cDNA gefragmenteerd in kleine stukken via chemische of enzymatische weg; dit geeft fragmenten van 100-300 bp die geschikt zijn voor sequencing. Het cDNA wordt vaak voorzien van korte adaptersequenties die primer-sites bevatten en vaak ook een barcode (karakteristieke hexameer of octameer) zodat duidelijk is welk cDNA-fragment uit welk onderzoeksmonster afkomstig is.[8]

Experimentele overwegingen
[bewerken | brontekst bewerken]RNA-seq wordt beschouwd als een krachtige (dat wil zeggen gevoelige en nauwkeurige) techniek, maar de interpretatie en validiteit ervan wordt beïnvloed door een aantal belangrijke parameters.
- Weefselspecificiteit. Genexpressie kan zeer sterk verschillen tussen celtypen en weefsels. RNA-seq meet meestal een gemiddelde van alle cellen in het monster. Dit kan het lastig maken om het relevante mechanisme te isoleren, aangezien de signalen van verschillende celtypen door elkaar lopen. Single-cell RNA-seq maakt het mogelijk om genexpressie per individuele cel te meten, waardoor deze menging wordt vermeden.
- Tijdsafhankelijkheid. Genexpressie is dynamisch en kan binnen een paar minuten al veranderen. Een standaard RNA-seq experiment geeft slechts een momentopname (snapshot) van de transcriptie. Onderzoekers analyseren om deze reden soms meerdere tijdspunten in een experiment.[10]
- Sequentiediepte (coverage). Sequentiediepte is een term die zegt hoeveel reads per sample wordt verzamelt, en bepaalt dus hoe betrouwbaar en volledig de metingen zijn. Zeldzame RNA-transcripten worden alleen gedetecteerd als "diep" genoeg wordt gesequenced. Een hoge coverage maakt het daarnaast mogelijk om isovormen van mRNA te identificeren (splicing-varianten).
- Artefacten. Niet alle variatie in RNA-seq data is daadwerkelijk biologisch; een deel is technische variatie. Bronnen van technische variatie zijn bijvoorbeeld: afbraak van het RNA, foutjes in de reverse-transcriptie, bias tijdens het sequencen en batch-effecten. Deze factoren kunnen leiden tot artefacten die ten onrechte als biologisch effect worden geïnterpreteerd. RNA-seq kent hierdoor meestal een strakke experimentele controles, het gebruik van replicaten en verschillende statistische correcties.[11]
Zie ook
[bewerken | brontekst bewerken]- ↑ (en) PubMed search: "RNA Seq". PubMed. Geraadpleegd op 1 september 2025.
- ↑ (en) Kukurba KR, Montgomery SB. (2015). RNA Sequencing and Analysis. Cold Spring Harbor Protocols 2015 (11). DOI: 10.1101/pdb.top084970.
- ↑ (en) Lister R, O'Malley RC, Tonti-Filippini J, Gregory BD, Berry CC, Millar AH, Ecker JR. (2008). Highly Integrated Single-Base Resolution Maps of the Epigenome in Arabidopsis. Cell 133 (3): 523-536. DOI: 10.1016/j.cell.2008.03.029.
- ↑ (en) Mortazavi A, Williams BA, Mccue K, Schaeffer L, Wold B. (2008). Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nature Methods 5 (7): 621-628. DOI: 10.1038/nmeth.1226.
- ↑ (en) Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M. (2008). The Transcriptional Landscape of the Yeast Genome Defined by RNA Sequencing. Science 320 (5881): 1344-1349. DOI: 10.1126/science.1158441.
- ↑ (en) Stark R, Grzelak M, Hadfield J. (2019). RNA sequencing: the teenage years. Nature Reviews Genetics 20 (11): 631-656. DOI: 10.1038/s41576-019-0150-2.
- ↑ (en) Garalde DR, Snell EA, Jachimowicz D, Sipos B, Lloyd JH, Bruce M, Pantic N, et al. (2018). Highly parallel direct RNA sequencing on an array of nanopores. Nature Methods 15 (3): 201-206. DOI: 10.1038/nmeth.4577.
- ↑ a b c (en) Griffith M, Walker JR, Spies NC, Ainscough BJ, Griffith OL. (2015). Informatics for RNA Sequencing: A Web Resource for Analysis on the Cloud. PLOS Computational Biology 11 (8): e1004393. DOI: 10.1371/journal.pcbi.1004393.
- ↑ (en) Wang Z, Gerstein M, Snyder M. (2009). RNA-Seq: a revolutionary tool for transcriptomics. Nature Reviews Genetics 10 (1): 57-63. DOI: 10.1038/nrg2484.
- ↑ (en) Oh S, Song S, Grabowski G, Zhao H, Noonan JP. (2013). Time Series Expression Analyses Using RNA-seq: A Statistical Approach. BioMed Research International 2013: 1-16. DOI: 10.1155/2013/203681.
- ↑ (en) Mcintyre LM, Lopiano KK, Morse AM, Amin V, Oberg AL, Young LJ, Nuzhdin SV. (2011). RNA-seq: technical variability and sampling. BMC Genomics 12 (1). DOI: 10.1186/1471-2164-12-293.