GeneCards je baza podataka ljudskih gena koja pruža genomske, proteomske, transkriptomske, genetičke i funkcionalalne informacije o svim poznatim i predviđenim ljudskim genima.[1][2][3][4] Razvija ga i održava „Krunski centar za genetiku čovjeka" (Crown Human Genome Center) na Weizmannovom institutu za nauku (Weizmann Institute of Science).

GeneCards
Portal baze podataka GeneCards
VrstaBaza genomskih podataka vrste Homo sapiens
StatusAktivna
Glavno sjedišteKrunski centar krunskog ljudskog genoma, Weizmannov institut za nauku, Izrael
JezikEngleski
Br. volonteraNeograničen
Veb-sajtwww.genecards.org
HTLM
Primjer sadržaja podataka u GeneCards-u: tkivna ekspresija gena CXorf66

Cilj baze podataka je pružiti brz pregled ažuriranih dostupnih biomedicinskih informacija o pretraživanom genu, uključujući ljudske gene, kodirane proteine i relevantne bolesti.[5][6] Baza podataka GeneCards omogućava pristup besplatnim resursima svjetske mreže o više od 7.000 svih poznatih ljudskih gena koji su integrirani iz > 90 izvora podataka, kao što je HUGO komitet za nomenklaturu gena (HGNC), Ensembl i NCBI. Glavna lista gena temelji se na odobrenim genskim simbolima koje je objavio HUGO. Podaci se pažljivo prikupljaju i odabiru iz ovih baza podataka pod njihovim motorom. Ako pretraga ne vrati nikakve rezultate, ova baza podataka dat će nekoliko prijedloga koji će korisnicima pomoći da izvrše pretraživanje, ovisno o vrsti upita i ponudit će izravne veze do pretraživača drugih baza podataka.

Vremenom je baza podataka GeneCards razvila niz alata (GeneDecks, GeneLoc, GeneALaCart) koji imaju specijalizovanije mogućnosti. Od 1998., baza podataka GeneCards široko se koristi u zajednicama iz oblasti bioinformatike, genomike i medicine, više od 15 godina.

Profil ekspresije gena FAM214A u normalnom ljudskom tkivu, kako je prikazano na GeneCards

Sadržaj uredi

Određeni GeneCard (primjer: GeneCard:TGFB1]]) ima sljedeći sadržaj.

  1. Header (zaglavlje): sastoji se od simbola gena, kategorije (tj. kodiranje proteina), GIFtS (tj. 74) i GCID (GC19M041837). Različite kategorije imaju različite boje za izražavanje: kodiranje proteina, pseudogen, RNK gen, genski klaster, genski lokus i nekategorizirani geni. Pozadina označava izvore simbola: HGNC odobreni geni, Entrez baza podataka, Ensembl baza podataka gena ili GeneCards generirani geni.
  2. Aliases: kao što mu samo ime govori, aliasi pokazuju sinonime i aliase gena prema različitim izvorima, kao što je HGNC. Desni stubac prikazuje kako su zamjenska imena povezana s resursima i daje prethodne GC-identifikatore.
  3. Summaries (sažezi): lijevi stubac je isti kao u pseudonimima, koji prikazuje izvore. Desni stubac ovdje daje kratki sažetak o funkciji gena, lokalizaciji i utjecaju na fenotip iz različitih izvora.
  4. Genomic Views (izgled genoma): pored izvora, ovaj odjeljak daje referentne sekvence DNK, regulatorne elemente, epigenetske uticaje, pruge hromosoma i genomsku lokaciju različitih izvora. Crvena linija na slici označava integriranu lokaciju GeneLoc. Konkretno, ako se GeneLoc integrirana lokacija razlikuje od lokacije u Entrezu, prikazana je zelenom bojom; plava se pojavljuje kada se integrirana lokacija GeneLoc razlikuje od lokacije u Ensemblu. Pojedinostima o dodavanju može se pristupiti putem veza u odjeljku.
  5. Proteini: Ovaj odjeljak predstavlja anotirane informacije o genima, uključujući preporučeno ime, veličinu, podjedinicu, podćelijsku lokaciju i sekundarne pristupe. Također, uvode se post-translacijske modifikacije, podaci o ekspresiji proteina, REF SEQ proteini, ENSEMBL proteini, detalji o reaktomskom proteinu, proizvodi humanih rekombinantnih proteina, Gene Ontology, Antitelski proizvodi i proizvodi za analizu.
  6. Proteinski domeni/porodice: Ovaj odjeljak prikazuje anotirane informacije o protein domenima i porodicama.
  7. Funkcija: Odjeljak funkcije opisuje funkciju gena, uključujući: Ljudske fenotipove, vezane ciljeve, shRNK za čovjeka i/ili miša/pacova, miRNK genske ciljeve, Proizvodi iRNK, mikroRNK za ortologe čovjeka i/ili miša/pacova, uređivanje gena, klonovi, ćelijske linije, životinjski modeli, in situ hibridizacijjski testovi.
  8. Putevi i interakcije prikazuju objedinjene puteve i interakcije GeneCards koji dolaze iz različitih izvora. Objedinjeni GeneCards putevi se prikupljaju u superputeve, što prikazuje vezu između različitih puteva. Interakcija pokazuje detalje interreaktanata i interakcije.
  9. Lijekovi i smjese je odjeljak koji povezuje GeneCards s lijekovima i spojevima. Oznaka TOCRIS pokazuju spoj, djelovanje i CAS broj. Spoj DrugBank daje spoj, sinonime, CAS broj (broj registra hemijskih sažetaka), vrstu (transporter/meta/nosač/enzim), akcije i PubMed ID-ove. HMDB i Novoseek pokazuju veze hemijskih spojev, što uključuje spoj, sinonime, CAS broj i PubMed ID-ove (članke koji se odnose na Taj spoj). BitterDB prikazuje spoj, CAS broj i SMILES (pojednostavljena specifikacija za unos molekulske ulazne linije). PharmGKB daje lijek/spoj i njegovu bilješku.
  10. Transkripti je odjeljak koji se sastoji od mRNK referentne sekvence, Unigene klaster i reprezentativne sekvence, proizvod miRNK, inhib.RNK proizvod, proizvod klonova, proizvod prajmera i dodatne sekvence mRNK. Korisnik također može dobiti egzonsku strukturu GeneLoc-a.
  11. Ekspresiija: Lijevi stubac prikazuje resurse podataka. Ekspresijske slike i podaci, slični geni, PCR-sekvence, začetnice za testove hibridizacije na ljudima i uključeni su u ovaj odjeljak in situ.
  12. Ortolozi: Ovaj odjeljak daje ortologe za određeni gen iz brojnih vrsta. Tabela prikazuje odgovarajući organizam, taksonomsku klasifikaciju, gen, opis, sličnost čovjeku, vrstu ortologije i detalje. Povezan je s genetičkim sbazama Ensembl, TreeFam i Aminode.[7]
  13. Paralozi: Prikazuju paraloge i pseudogene za određeni gen.
  14. Genomske varijante: Pokazuju rezultat SNP/varijante NCBI-a, izvještaj o neravnoteži veze HapMap, strukturne varijacije, bazu podataka mutacije ljudsog gena (HGMD), QIAGEN SeqTarget dugotrajne prajmere PCR-a u PCR sekvencama mutacija raka ljudi, miša i pacova i SABiosciences. Tabela u ovom odjeljku prikazuje ID za SNP, valjanost, klinički značaj, Chr pos (hromosomsku poziciju), sekvencu za genomske podatke, AAChg, tip i više podataka povezanih s transkripcijom, frekvencijom alela, pop, ukupan uzorak i više za alelne frekvencije. Za Valid, različiti znak predstavlja različite metode provjere valjanosti. ‘C’ znači podskup; ’A’ je pri-2hit-2alel; ’F’ je po frekvenciji; ‘H’ je slučajno, a ‘O’ drugo-pop. U naznaci: klinički značaj može biti jedno od sljedećeg: nepatogeni, patogeni, odgovor na lijek, histokompatibilnost, vjerovatno-ne-patogeni, vjerovatno-patogeni, neprovjereni, nepoznati i drugo. Tip bi trebao biti jedan od ovih: nonsynon, syn, cds, spl, utr, int, exc, loc, stg, ds500, spa, spd, us2k, us5k, PupaSUITE oznake.
  15. Poremećaji/Bolesti: Prikazuje poremećaje/bolesti povezane sa datim genom.
  16. Publikacije: Prikazuje radover povezane sa datim genom.
  17. Vanjske pretrage: Pretražuje više informacija u PubMed, OMIM i NCBI.
  18. Genomske baze podataka: Ostale baze podataka i specijalizirane baze podataka.
  19. Intelektualno vlasništvo: Ovaj odjeljak daje informacije o patentima i tehnologije koje se mogu licencirati.
  20. Produkti

Tekuća proširenja uredi

GeneDecks uredi

GeneDecks je novi alat za analizu za identifikaciju sličnih ili partnerskih gena, koji pruža metriku sličnosti, isticanjem zajedničkih deskriptora između gena, na osnovu jedinstvenog bogatstva GeneCards kombinatornih bilješki ljudskih gena.

  1. Objedinjavanje anotacija: Različiti izvori podataka često nude napomene sa heterogenim sistemom imenovanja. Objedinjavanje bilješki GeneDecksa temelji se na sličnosti u otkrivanju prostora genetičkog sadržaja algoritama GeneCards.
  2. Lov na partnere: U GeneDecks-ovom Partnerskom lovcu korisnici, za upit daju gen, a sistem traži slične gene, na osnovu kombinatorne sličnosti ponderiranih atributa.
  3. Set destilacija: u Set destileru korisnici daju skup gena, a sistem atribuira atribute, prema njihovom stupnju dijeljenja unutar datog skupa gena. Poput lovljenja partnera, omogućava sofisticirano istraživanje različitih genetičkih setova, različitog porijekla, za otkrivanje i razjašnjavanje relevantnih bioloških obrazaca, čime se poboljšava sistematska kontrola genomike i sistemske biologije.[8][9]

GeneALaCart uredi

GeneALaCart je genetički orijentirani skupni upitnik koji se temelji na popularnoj bazi podataka GeneCards. Omogućuje pronalaženje podataka o više gena u paketnom upitu.[10]

GeneLoc uredi

Član GeneLoc odijela predstavlja integriranu ljudsku hromozomski mapu, što je vrlo važno za dizajniranje po mjeri hvatanja čipa, na osnovu podataka integriranih pomoću GeneLoc algoritma. GeneLoc uključuje daljnje veze do GeneCards, NCBI-jevog sekvenciranja ljudskog genoma, UniGene i resursa za mapiranje.[11]

Primjena uredi

GeneCards se široko koristi u u oblsti biologije i biomedicine. Naprimjer, S.H. Shah je iz GeneCards izvukao podatke o ranom nastanku bolesti srca i krvnih sudova, kako bi identificirao gene koji doprinose bolestima. Potvrđeno je da na to utiču hromosomski segmenti 3q13, 1q25 itd. Ovaj rad raspravljao je dalje o povezanosti morbidnih gena i serumskih lipoproteina uz pomoć GeneCard-a.[12]

Drugi primjer je istraživačka studija o tzv. sintetskoj smrtnosti od kancera. Sintetska letalnost pojavljuje se kada mutacija u jednom genu nema utjecaja na funkciju ćelija, ali mutacija dodatnog gena dovodi do ćelijske smrti. Cilj ove studije bio je pronaći nove metode liječenja raka, blokiranjem smrtonosnosti lijekova. GeneCards je korišten za poređenje podataka datog ciljnog gena sa svim mogućim genima. U ovom procesu, rezultat dijeljenja bilješki izračunat je koristeći GeneDecks Partner Hunter (sada se zove Genes Like Me) kako bi se pružili paraloški aspekti. Ciljevi za inaktivaciju izvučeni su nakon eksperimenata na mikrozrakama rezistentnih i nerezistentnih neuroblastomskih ćelijskih linija.

Reference uredi

  1. ^ Rebhan M, Chalifa-Caspi V, Prilusky J, Lancet D (april 1997). "GeneCards: integrating information about genes, proteins and diseases". Trends in Genetics. 13 (4): 163. doi:10.1016/S0168-9525(97)01103-7. PMID 9097728.
  2. ^ Rebhan M, Chalifa-Caspi V, Prilusky J, Lancet D (1998). "GeneCards: a novel functional genomics compendium with automated data mining and query reformulation support". Bioinformatics. 14 (8): 656–64. doi:10.1093/bioinformatics/14.8.656. PMID 9789091.
  3. ^ Safran M, Solomon I, Shmueli O, Lapidot M, Shen-Orr S, Adato A, et al. (novembar 2002). "GeneCards 2002: towards a complete, object-oriented, human gene compendium". Bioinformatics. 18 (11): 1542–3. doi:10.1093/bioinformatics/18.11.1542. PMID 12424129.
  4. ^ Harel A, Inger A, Stelzer G, Strichman-Almashanu L, Dalah I, Safran M, Lancet D (oktobar 2009). "GIFtS: annotation landscape analysis with GeneCards". BMC Bioinformatics. 10 (1): 348. doi:10.1186/1471-2105-10-348. PMC 2774327. PMID 19852797.
  5. ^ "GeneCards". GeneCards. Arhivirano s originala, 14. 10. 2013. Pristupljeno 18 Oct 2013.
  6. ^ "GeneCards". Arhivirano s originala, 17. 8. 2018. Pristupljeno 19 Oct 2013.
  7. ^ Chang KT, Guo J, di Ronza A, Sardiello M (januar 2018). "Aminode: Identification of Evolutionary Constraints in the Human Proteome". Scientific Reports. 8 (1): 1357. Bibcode:2018NatSR...8.1357C. doi:10.1038/s41598-018-19744-w. PMC 5778061. PMID 29358731.
  8. ^ "GeneDecks". GeneCards. Arhivirano s originala, 14. 10. 2013. Pristupljeno 20 Oct 2013.
  9. ^ Stelzer G, Inger A, Olender T, Iny-Stein T, Dalah I, Harel A, et al. (decembar 2009). "GeneDecks: paralog hunting and gene-set distillation with GeneCards annotation". Omics. 13 (6): 477–87. doi:10.1089/omi.2009.0069. PMID 20001862.
  10. ^ "GeneALaCart". GeneCards. Arhivirano s originala, 30. 9. 2013. Pristupljeno 20 Oct 2013.
  11. ^ "GeneLoc". GeneCards. Pristupljeno 20 Oct 2013.
  12. ^ Shah SH, Kraus WE, Crossman DC, Granger CB, Haines JL, Jones CJ, et al. (novembar 2006). "Serum lipids in the GENECARD study of coronary artery disease identify quantitative trait loci and phenotypic subsets on chromosomes 3q and 5q". Annals of Human Genetics. 70 (Pt 6): 738–48. doi:10.1111/j.1469-1809.2006.00288.x. PMID 17044848.

Vanjski linkovi uredi