TestprojekterDTU.dkDTU BioIndeksKontakt
Biotech Academy

National Center for Biotechnology Information (NCBI) og Genbank

Gå til NCBI her.

Gå tilbage til program/database oversigt her.

 

National Center for Biotechnology Information (NCBI) er en af de mest omfattende og benyttede online database. Hos NCBI kan man finde information om næsten alle kendte DNA- og proteinsekvenser.

Beskrivelse

Internetsiden hos NCBI er bygget op omkring mange forskellige databaser, bl.a. sekvensdatabaser for nukleotider og proteiner. Udover sekvensdatabaser, har NCBI også tilknyttet databaser for hele genomprojekter og litteratur (PubMed) samt forskellige programmer som f.eks. søgemaskinen BLAST (læs mere om BLAST her).

Det store antal databaser er med til at gøre søgning på NCBI til en af de mest omfangsrige. NCBI er derfor en god internetside at benytte, når man skal finde informationer om sekvenser.

 

Brug

  • Finde informationer om DNA- og proteinsekvenser ved at søge på enten navn, funktion, organisme, accession nummer (se infoboks 1) eller lignende.
  • Finde videnskabelige artikler om en givenn DNA- eller proteinsekvens.
  • Bestemme en funktion for en ukendt DNA- eller proteinsekvens. 

Generel guide

Ved at benytte NCBI til informationssøgning vil man automatisk søge på tværs af biologisk relaterede databaser. Resultatet af søgningen er omfangsrigt på grund af de store databaser, og det er derfor vigtigt at specificere sin søgning. Specificering kan eksempelvis gøres ved at vælge, hvilken database man vil søge mod. Valg af database afhænger af, om man vil søge efter DNA-sekvenser eller proteiner. I figur 1 kan du se hvor du kan vælge database.

 

/upload/institutter/bio/ba/projekter/bioinfo/ncbi.png

Figur 1. Forsiden på NCBI. Klik for at se figuren i stor format.

 

Søgning på NCBI giver ofte et resultat med mange sekvenser. Hver sekvens der er tilgængelig gennem NCBI har sin egen side med information, en GenBank-side, se infoboks 2. Man kan gå til en sekvens-GenBank-side ved at klikke på sekvensens understregede navn på resultatsiden, se figur 2.

 

/upload/institutter/bio/ba/projekter/bioinfo/ncbi_ii.png

Figur 2. Siden efter søgning efter protiensekvensen for insulin. Klik for at se figuren i stor format.

 

 

GenBank

GenBank er hoveddatabasen for kendte DNA-sekvenser, og den kan findes gennem NCBI's internetside.
Hver DNA-sekvens i GenBank har sin egen GenBank-side. GenBank-siden indeholder informationer omkring DNA-sekvensen, bl.a. hele nukleotidsekvensen, organismen den stammer fra, links til dens translaterede proteinsekvens mm..
GenBank-sider er alle opbygget på samme måde og består af tre dele, som gennemgåes nedenfor.
For at se opbygningen af en GenBank-side kan der klikkes her.

  • Header
    Denne del indeholder den generelle information omkring sekvensen:
    Accession nummer, sekvensens navn, hvilken organisme sekvensen stammer fra, hvilket kromosom den er på, hvilke artikler og publikationer der omtaler den mm..

  • Feature
    Denne del er en slags tabel, der indeholder informationer om selve DNA-sekvensen og funktionen af de forskellige områder i sekvensen. Her beskrives bl.a. hvilke nukleotider, der faktisk koder for proteinet (denne del betegnes CDS, der er en forkortelse af coding sequence, se infoboks 3) samt positionerne for introns og exons (se infoboks 3).

  • Origin
    Denne del indeholder udelukkende selve DNA-sekvensen (nukleotiderne) samt dens positioner.

 

Der er ingen øvelser forbundet til søgning på NCBI's internetside, og dermed gennemgåes søgninger på NCBI ikke nøjere i dette materiale. På trods af dette anbefales det, at man alligevel prøver søgemaskinerne af.

 

 

Sidst opdateret 04.05.2012
Top

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Infoboks 1

 

Et accession nummer er et unikt nummer, der gives til DNA- eller proteinsekvenser, så de kan findes på tværs af databaser. Dvs. at den samme sekvens i UniProt og NCBI vil have samme unikke nummer tilknyttet, så man ved at søge på det vil få samme resultat ved søgning i begge databaser. 

 


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Infoboks 2

 

GenBank er hoved databasen for DNA sekvenser, og indeholder dermed flest sekvenser. En sekvens' GenBank-side er en internet side i GenBank der indeholder informationer om netop den DNA-sekvens man søgte på. 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Infoboks 3

 

CDS er en forkortelse for coding sequence og er den del på DNA-sekvensen, der koder for selve proteinet.
En DNA-sekvens består nemlig af introns og exons, hvor introns er de dele af DNA-sekvensen der koder for et protein (bliver sat sammen til CDS), og exons bliver splejset ud. 

Søltofts PladsBygning 2212800 Kongens LyngbyTlf. 4525 4933