Dugolančana nekodirajuća RNK

Dugolančane nekodirajuće RNK (duge ncRNK, lncRNK) su tip RNK, definiran kao transkripti s dužinama većim od 200 nukleotida, koje se ne prevode u protein.[2] Ova, donekle proizvoljna, granica razlikuje duge ncRNA od kratkolančanih nekodirajućih RNK kao što su mikroRNK (miRNK), muška interferirajuća RNK (siRNAs), Piwi-interaktivna RNK (piRNK), muška jedarna RNK (snoRNK) i druge kratkomolekulske RNK.[3] Duge intervenirajuće /intergenskee nekodirajuće RNK (lincRNK) su sekvence lncRNA koje se ne preklapaju s genima koji kodiraju proteine.[4]

Tipovi dugolančane nekodirajuće RNK.[1]

Rasprostranjenje

uredi

Jedna studija iz 2007. otkrila je da je samo petina transkripcija u ljudskom genomu povezana sa genima koji kodiraju proteine,[5] što ukazuje na najmanje četiri puta duže nekodirajuće od kodirajućih sekvenci RNK. Međutim, veliki projekti sekvenciranja komplementarne DNK (cDNK), kao što je FANTOM (Functional Annoation of Mammalian cDNA) otkrivaju složenost ove transkripcije.[6] Projekt FANTOM3 identificirao je ~ 35.000 nekodirajućih transkripata sa ~10.000 različitih lokusa koji nose mnoge prepise iRNK, uključujući 5 'zatvaranje, preradu i poli-adenilaciju, ali imaju malo ili nimalo otvorenih okvira čitanja (ORF).[6] Iako se bogatstvo dugolančanih ncRNK nije očekivalo, ovaj broj predstavlja konzervativnu, nižu procjenu, jer je izostavio mnoštvo pojedinačnih transkripata i nepoliadeniliranih transkripata (popločavanje niza pokazujući da je više od 40% nepoliadeniliranih transkripata).[7] Međutim, jednoznačno prepoznavanje ncRNK unutar ovih cDNK biblioteka predstavlja izazov, jer može biti teško razlikovati transkripte koji kodiraju proteine od nekodirajućih transkripata. U više studija sugerirano je da sjemenici,[8] i nervna tkiva imajuju najveću količinu dugih nekodirajućih RNK bilo kojeg tipa tkiva.[9] Korištenjem FANTOM5 identificirano je 27.919 ncRNK u različitim ljudskim izvorima.[10]

Kvantitativno, lncRNA imaju ~10 puta nižu zastupljenost od iRNK u populaciji ćelija,[11][12] što se objašnjava većom varijacijom nivoa ekspresije nivoa lncRNK gena u pojedinačnim ćelijama u odnosu na gene koji kodiraju proteine.[13] In general, the majority (~78%) of lncRNAs are characterized as tissue-specific, as opposed to only ~19% of mRNAs.[11] Pored veće specifičnosti tkiva, lncRNK karakteriše i veća specifičnost u razvojnom stadiju,[14] i specifičnost ćelijskog podtipa u heterogenim tkivima, poput ljudskog neokorteksa.[15] U 2018., sveobuhvatna integracija lncRNK iz postojećih baza podataka, objavljene literature i novih sklopova RNK na osnovu analize podataka RNK-seq, otkrila je da kod ljudi ima 270.044 transkripta lncRNA.[16]

U poređenju sa sisarima, relativno malo studija fokusiralo se na prevalenciju lncRNK u biljkama. Međutim, opsežna studija koja je uzela u obzir 37 viših biljnih vrsta i šest algi identificirala je ~200 000 nekodirajućih transkripata, koristeći pristup "in-silico",[17] koja je također uspostavila povezanu bazu podataka zelenog nekodiranja (GreeNC), spremište biljnih lncRNK.

Funkcije

uredi

Sekvenciranje širokog opsega biblioteka cDNK i nedavno transkriptomsko sekvenciranje sledeće generacije ukazuju na to da kod sisara dugih nekodirajućik RNK ima desetak hiljada. Međutim, uprkos prikupljanju dokaza koji sugeriraju da će većina njih vjerovatno biti funkcionalna,[18][19] dokazano je da je samo relativno mali udio biološki relevantan. Od januara 2016., 294 LncRNA su funkcionalno označene u LncRNAdb-i (baza podataka koja opisuje LncRNK),[20][21] s tim da je većina njih (183 LncRNK) opisana na ljudima. Od juna 2018. godine, ukupno 1867 ljudskih lncRNK su sa eksperimentalnim dokazima nadgledane u zajednici u LncRNAWiki (platforma za javno uređivanje i otvoreni sadržaj, zasnovana na wikiju za nadgledanje ljudskih lncRNA u zajednici)[22] u pogledu funkcionalnih mehanizama i asocijacija bolesti, kojima se također može pristupiti na linku LncBook Arhivirano 17. 1. 2020. na Wayback Machine.[16] Prema kuriranju funkcionalnih mehanizama lncRNK na osnovu literature, izvještava se da su opsežno uključene u regulaciju transkripcije.[16] Daljnja velika studija sekvenciranja pruža dokaze da se mnogi transkripti smatraju kao lncRNA zapravo mogu biti prevedeni u proteine.[23]

Organizacija genoma

uredi

U 2005. slika genom sisara opisan je kao brojna „žarišta“ transkripcije koja su odvojena dugim dijelovima intergenskog prostora.[6] Dok su duge ncRNK smještene i transkribirane unutar intergenskih sekvenci, većina se transkribira kao složene, isprepletene mreže preklapajućih smislenih i antisens transkripata, koji često uključuju kodirajuće gene za proteine,[5] što dovodi do složene hijerarhije preklapajućih izoformi.[24] > Genomske sekvence unutar ovih transkripcijskih fokusa često se dijele unutar niza različitih kodirajućih i nekodirajućih transkripata u smislu i antisens smjernica[25] Naprimjer, 3012 od 8961 cDNA-a prethodno označenih kao skraćene kodirajuće sekvence unutar FANTOM2, kasnije su označene kao prave ncRNK varijante kDNK-a, koje kodiraju proteine.[6] Iako obilje i očuvanost ovih isprepletenih aranžmana sugeriraju da imaju biološku važnost, složenost ovih žarišta onemogućava lahku procjenu.

Konzorcij GENCODE objedinio je i analizirao sveobuhvatan skup oznaka ljudskih lncRNK i njihovu genomsku organizaciju, modifikacije ćelijskih lokacija i profila ekspresije tkiva.[9] Njihova analiza ukazuje na to da ljudske lncRNK pokazuju pristranost prema dvoegzonskim transkriptima.[9]

Alati za identifikacuju dugolančanih nekodirajućih RNK

uredi
Ime Vrsta Web Server Repozitorij Unosni fajl Glavni model/Algoritam Vježbovni-set Godina objave Reference
RNAsamba Sve RNAsamba RNAsamba FASTA Prirodna mreža Da 2020. [26]
LGC Biljka/Životinja LGC Arhivirano 30. 4. 2020. na Wayback Machine FASTA/BED/GTF Relationship between ORF length and GC content Ne 2019. [27]
CPAT Ćovjek/Muha/Miš/Zebrica CPAT Arhivirano 8. 3. 2021. na Wayback Machine CPAT FASTA/BED Logistic Regression Da 2013. [28]
COME Biljka/Čovjek/Miš/Muha/Crv COME Arhivirano 3. 4. 2019. na Wayback Machine COME GTF Balanced Random Forest Da 2017. [29]
lncRScan-SVM Čovjek NA FASTA/BED/GTF/GFF Podrška vektorske mašine Da 2015. [30]
CNCI Biljka/Životinja NA FASTA/GTF Podrška vektorske mašine Ne 2013. [31]
PLEK Kičmenjaci NA PLEK FASTA Podrška vektorske mašine NO 2014. [31]
FEELnc Sve NA FEELnc FASTA/GTF Slučajna šuma Da 2017. [32]
PhyloCSF Kičmenjaci/Muha/Komarac/Kvasac NA FASTA Model filogenetskog kodona Da 2011. [33]
PLIT Biljka NA FASTA LASSO/Slučajna šuma Da 2018. [34]
RNAplonc Biljka NA FASTA REPTree Da 2018. [35]
PLncPRO Biljka/Životinja NA FASTA Slučajna šumat Da 2017. [36]
CREMA Biljka/Životinja NA FASTA Ensemble-pristup Da 2018 [37]
Slncky Sve NA slncky FASTA/BED Evolucijska konzervacija Da 2016. [38]

Također pogledajte

uredi

Reference

uredi
  1. ^ Fernandes, Juliane C. R.; Acuña, Stephanie M.; Aoki, Juliana I.; Floeter-Winter, Lucile M.; Muxel, Sandra M. (17. 2. 2019). "Long Non-Coding RNAs in the Regulation of Gene Expression: Physiology and Disease". Non-coding RNA. 5 (1). doi:10.3390/ncrna5010017. ISSN 2311-553X. PMC 6468922. PMID 30781588.
  2. ^ Perkel JM (juni 2013). "Visiting "noncodarnia"". BioTechniques. 54 (6): 301, 303–4. doi:10.2144/000114037. PMID 23750541.
  3. ^ Ma L, Bajic VB, Zhang Z (juni 2013). "On the classification of long non-coding RNAs". RNA Biology. 10 (6): 925–933. doi:10.4161/rna.24604. PMC 4111732. PMID 23696037.
  4. ^ Julia D. Ransohoff, Yuning Wei & Paul A. Khavari (2018). "The functions and unique features of long intergenic non-coding RNA". Nature Reviews Molecular Cell Biology. 19 (3): 143–157 (2018). doi:10.1038/nrm.2017.104. PMC 5889127. PMID 29138516.
  5. ^ a b Kapranov P, Cheng J, Dike S, Nix DA, Duttagupta R, Willingham AT, Stadler PF, Hertel J, Hackermüller J, Hofacker IL, Bell I, Cheung E, Drenkow J, Dumais E, Patel S, Helt G, Ganesh M, Ghosh S, Piccolboni A, Sementchenko V, Tammana H, Gingeras TR (juni 2007). "RNA maps reveal new RNA classes and a possible function for pervasive transcription". Science. 316 (5830): 1484–1488. Bibcode:2007Sci...316.1484K. doi:10.1126/science.1138341. PMID 17510325.
  6. ^ a b c d Carninci P, Kasukawa T, Katayama S, Gough J, Frith MC, Maeda N, et al. (septembar 2005). "The transcriptional landscape of the mammalian genome". Science. 309 (5740): 1559–1563. Bibcode:2005Sci...309.1559F. doi:10.1126/science.1112014. PMID 16141072.
  7. ^ Cheng J, Kapranov P, Drenkow J, Dike S, Brubaker S, Patel S, Long J, Stern D, Tammana H, Helt G, Sementchenko V, Piccolboni A, Bekiranov S, Bailey DK, Ganesh M, Ghosh S, Bell I, Gerhard DS, Gingeras TR (maj 2005). "Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution". Science. 308 (5725): 1149–1154. Bibcode:2005Sci...308.1149C. doi:10.1126/science.1108625. PMID 15790807.
  8. ^ Necsulea A, Soumillon M, Warnefors M, Liechti A, Daish T, Zeller U, Baker JC, Grützner F, Kaessmann H (januar 2014). "The evolution of lncRNA repertoires and expression patterns in tetrapods". Nature. 505 (7485): 635–640. Bibcode:2014Natur.505..635N. doi:10.1038/nature12943. PMID 24463510.
  9. ^ a b c Derrien T, Johnson R, Bussotti G, Tanzer A, Djebali S, Tilgner H, Guernec G, Martin D, Merkel A, Knowles DG, Lagarde J, Veeravalli L, Ruan X, Ruan Y, Lassmann T, Carninci P, Brown JB, Lipovich L, Gonzalez JM, Thomas M, Davis CA, Shiekhattar R, Gingeras TR, Hubbard TJ, Notredame C, Harrow J, Guigó R (septembar 2012). "The GENCODE v7 catalog of human long noncoding RNAs: analysis of their gene structure, evolution, and expression". Genome Research. 22 (9): 1775–1789. doi:10.1101/gr.132159.111. PMC 3431493. PMID 22955988.
  10. ^ Hon CC, Ramilowski JA, Harshbarger J, Bertin N, Rackham OJ, Gough J, Denisenko E, Schmeier S, Poulsen TM, Severin J, Lizio M, Kawaji H, Kasukawa T, Itoh M, Burroughs AM, Noma S, Djebali S, Alam T, Medvedeva YA, Testa AC, Lipovich L, Yip CW, Abugessaisa I, Mendez M, Hasegawa A, Tang D, Lassmann T, Heutink P, Babina M, Wells CA, Kojima S, Nakamura Y, Suzuki H, Daub CO, de Hoon MJ, Arner E, Hayashizaki Y, Carninci P, Forrest AR (mart 2017). "An atlas of human long non-coding RNAs with accurate 5′ ends". Nature. 543 (7644): 199–204. Bibcode:2017Natur.543..199H. doi:10.1038/nature21374. PMC 6857182. PMID 28241135.
  11. ^ a b Cabili MN, Trapnell C, Goff L, Koziol M, Tazon-Vega B, Regev A, Rinn JL (septembar 2011). "Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses". Genes & Development. 25 (18): 1915–1927. doi:10.1101/gad.17446611. PMC 3185964. PMID 21890647.
  12. ^ Ravasi T, Suzuki H, Pang KC, Katayama S, Furuno M, Okunishi R, Fukuda S, Ru K, Frith MC, Gongora MM, Grimmond SM, Hume DA, Hayashizaki Y, Mattick JS (januar 2006). "Experimental validation of the regulated expression of large numbers of non-coding RNAs from the mouse genome". Genome Research. 16 (1): 11–19. doi:10.1101/gr.4200206. PMC 1356124. PMID 16344565.
  13. ^ Yunusov D, Anderson L, DaSilva LF, Wysocka J, Ezashi T, Roberts RM, Verjovski-Almeida S (septembar 2016). "HIPSTR and thousands of lncRNAs are heterogeneously expressed in human embryos, primordial germ cells and stable cell lines". Scientific Reports. 6: 32753. Bibcode:2016NatSR...632753Y. doi:10.1038/srep32753. PMC 5015059. PMID 27605307.
  14. ^ Yan L, Yang M, Guo H, Yang L, Wu J, Li R, Liu P, Lian Y, Zheng X, Yan J, Huang J, Li M, Wu X, Wen L, Lao K, Li R, Qiao J, Tang F (septembar 2013). "Single-cell RNA-Seq profiling of human preimplantation embryos and embryonic stem cells". Nature Structural & Molecular Biology. 20 (9): 1131–1139. doi:10.1038/nsmb.2660. PMID 23934149.
  15. ^ Liu SJ, Nowakowski TJ, Pollen AA, Lui JH, Horlbeck MA, Attenello FJ, He D, Weissman JS, Kriegstein AR, Diaz AA, Lim DA (april 2016). "Single-cell analysis of long non-coding RNAs in the developing human neocortex". Genome Biology. 17: 67. doi:10.1186/s13059-016-0932-1. PMC 4831157. PMID 27081004.
  16. ^ a b c Ma L, Cao J, Liu L, Du Q, Li Z, Zou D, Bajic VB, and Zhang Z (Jan 2019). "LncBook: a curated knowledgebase of human long non-coding RNAs". Nucleic Acids Research. 47 (Database issue): D128–D134. doi:10.1093/nar/gky960. PMC 6323930. PMID 30329098.
  17. ^ Paytuví Gallart A, Hermoso Pulido A, Anzar Martínez de Lagrán I, Sanseverino W, Aiese Cigliano R (januar 2016). "GREENC: a Wiki-based database of plant lncRNAs". Nucleic Acids Research. 44 (D1): D1161–6. doi:10.1093/nar/gkv1215. PMC 4702861. PMID 26578586.
  18. ^ Mercer TR, Dinger ME, Mattick JS (mart 2009). "Long non-coding RNAs: insights into functions". Nature Reviews Genetics. 10 (3): 155–159. doi:10.1038/nrg2521. PMID 19188922.
  19. ^ Dinger ME, Amaral PP, Mercer TR, Mattick JS (novembar 2009). "Pervasive transcription of the eukaryotic genome: functional indices and conceptual implications". Briefings in Functional Genomics & Proteomics. 8 (6): 407–423. doi:10.1093/bfgp/elp038. PMID 19770204.
  20. ^ Amaral PP, Clark MB, Gascoigne DK, Dinger ME, Mattick JS (januar 2011). "lncRNAdb: a reference database for long noncoding RNAs". Nucleic Acids Research. 39 (Database issue): D146–51. doi:10.1093/nar/gkq1138. PMC 3013714. PMID 21112873.
  21. ^ Quek XC, Thomson DW, Maag JL, Bartonicek N, Signal B, Clark MB, Gloss BS, Dinger ME (januar 2015). "lncRNAdb v2.0: expanding the reference database for functional long noncoding RNAs". Nucleic Acids Research. 43 (Database issue): D168–73. doi:10.1093/nar/gku988. PMC 4384040. PMID 25332394.
  22. ^ Ma L, Li A, Zou D, Xu X, Xia L, Yu J, Bajic VB, Zhang Z (januar 2015). "LncRNAWiki: harnessing community knowledge in collaborative curation of human long non-coding RNAs". Nucleic Acids Research. 43 (Database issue): D187–92. doi:10.1093/nar/gku1167. PMC 4383965. PMID 25399417.
  23. ^ Smith JE, Alvarez-Dominguez JR, Kline N, Huynh NJ, Geisler S, Hu W, Coller J, Baker KE (juni 2014). "Translation of small open reading frames within unannotated RNA transcripts in Saccharomyces cerevisiae". Cell Reports. 7 (6): 1858–1866. doi:10.1016/j.celrep.2014.05.023. PMC 4105149. PMID 24931603.
  24. ^ Kapranov P, Willingham AT, Gingeras TR (juni 2007). "Genome-wide transcription and the implications for genomic organization". Nature Reviews Genetics. 8 (6): 413–423. doi:10.1038/nrg2083. PMID 17486121.
  25. ^ Birney E, Stamatoyannopoulos JA, Dutta A, Guigó R, Gingeras TR, Margulies EH, et al. (juni 2007). "Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project". Nature. 447 (7146): 799–816. Bibcode:2007Natur.447..799B. doi:10.1038/nature05874. PMC 2212820. PMID 17571346.
  26. ^ Camargo, Antonio P; Sourkov, Vsevolod; Pereira, Gonçalo A G; Carazzolle, Marcelo F (1. 3. 2020). "RNAsamba: neural network-based assessment of the protein-coding potential of RNA sequences". NAR Genomics and Bioinformatics (jezik: engleski). 2 (1): lqz024. doi:10.1093/nargab/lqz024. ISSN 2631-9268.
  27. ^ Wang G, Yin H, Li B, Yu C, Wang F, Xu X, Cao J, Bao Y, Wang L, Abbasi AA, Bajic VB, Ma L, Zhang Z (januar 2019). "Characterization and identification of long non-coding RNAs based on feature relationship". Bioinformatics. 41 (Database issue): D246–D251. doi:10.1093/bioinformatics/btz008. PMID 30649200.
  28. ^ Wang L, Park HJ, Dasari S, Wang S, Kocher JP, Li W (april 2013). "CPAT: Coding-Potential Assessment Tool using an alignment-free logistic regression model". Nucleic Acids Research. 41 (6): e74. doi:10.1093/nar/gkt006. PMC 3616698. PMID 23335781.
  29. ^ Hu L, Xu Z, Hu B, Lu ZJ (januar 2017). "COME: a robust coding potential calculation tool for lncRNA identification and characterization based on multiple features". Nucleic Acids Research. 45 (1): e2. doi:10.1093/nar/gkw798. PMC 5224497. PMID 27608726.
  30. ^ Sun L, Liu H, Zhang L, Meng J (2015). "lncRScan-SVM: A Tool for Predicting Long Non-Coding RNAs Using Support Vector Machine". PLOS ONE. 10 (10): e0139654. Bibcode:2015PLoSO..1039654S. doi:10.1371/journal.pone.0139654. PMC 4593643. PMID 26437338.
  31. ^ a b Sun L, Luo H, Bu D, Zhao G, Yu K, Zhang C, Liu Y, Chen R, Zhao Y (septembar 2013). "Utilizing sequence intrinsic composition to classify protein-coding and long non-coding transcripts". Nucleic Acids Research. 41 (17): e166. doi:10.1093/nar/gkt646. PMC 3783192. PMID 23892401.
  32. ^ Wucher, Valentin; Legeai, Fabrice; Hédan, Benoît; Rizk, Guillaume; Lagoutte, Lætitia; Leeb, Tosso; Jagannathan, Vidhya; Cadieu, Edouard; David, Audrey (5. 5. 2017). "FEELnc: a tool for long non-coding RNA annotation and its application to the dog transcriptome". Nucleic Acids Research. 45 (8): e57. doi:10.1093/nar/gkw1306. ISSN 1362-4962. PMC 5416892. PMID 28053114.
  33. ^ Lin MF, Jungreis I, Kellis M (juli 2011). "PhyloCSF: a comparative genomics method to distinguish protein coding and non-coding regions". Bioinformatics. 27 (13): i275–i282. doi:10.1093/bioinformatics/btr209. PMC 3117341. PMID 21685081.
  34. ^ Deshpande S, Shuttleworth J, Yang J, Taramonli S, England M (februar 2019). "PLIT: An alignment-free computational tool for identification of long non-coding RNAs in plant transcriptomic datasets". Computers in Biology and Medicine. 105: 169–181. arXiv:1902.05064. Bibcode:2019arXiv190205064D. doi:10.1016/j.compbiomed.2018.12.014. PMID 30665012.
  35. ^ Negri TD, Alves WA, Bugatti PH, Saito PT, Domingues DS, Paschoal AR (2019). "Pattern recognition analysis on long noncoding RNAs: a tool for prediction in plants". Briefings in Bioinformatics. 20 (2): 682–689. doi:10.1093/bib/bby034. PMID 29697740.
  36. ^ Singh U, Khemka N, Rajkumar MS, Garg R, Jain M (decembar 2017). "PLncPRO for prediction of long non-coding RNAs (lncRNAs) in plants and its application for discovery of abiotic stress-responsive lncRNAs in rice and chickpea". Nucleic Acids Research. 45 (22): e183. doi:10.1093/nar/gkx866. PMC 5727461. PMID 29036354.
  37. ^ Simopoulos CM, Weretilnyk EA, Golding GB (maj 2018). "Prediction of plant lncRNA by ensemble machine learning classifiers". BMC Genomics. 19 (1): 316. doi:10.1186/s12864-018-4665-2. PMC 5930664. PMID 29720103.
  38. ^ Chen J, Shishkin AA, Zhu X, Kadri S, Maza I, Guttman M, Hanna JH, Regev A, Garber M (Feb 2016). "Evolutionary analysis across mammals reveals distinct classes of long non-coding RNAs". Genome Biology. 17 (19). doi:10.1186/s13059-016-0880-9. PMC 4739325. PMID 26838501.