TestprojekterDTU.dkDTU BioIndeksKontakt
Biotech Academy

Protein Data Bank (PDB)

Gå til PDB her.

Gå tilbage til program/database oversigt her.

 

Protein Data Bank (PDB) er en database, der indeholder proteiner og deres kendte tredimensionel struktur.

/upload/institutter/bio/ba/projekter/bioinfo/proteinflow.png

Figur 1. Sammenhæng mellem proteiners strukturformer. I PDB kan man finde tertiær- og kvanternærstrukturen for proteiner.

 

Beskrivelse

For at et protein kan blive tilgængeligt gennem PDB skal det ofte være blevet sekventeret (se infoboks 1), dvs. man skal kende proteinets aminosyresammensætning og dermed både dens primær-, sekundær- og tertiærstruktur (se infoboks 2).

Proteiner, der er tilgængelige gennem PDB, er ofte i interaktion med andre molekyler, f.eks. metalioner, DNA eller andre proteiner da interaktionerne stabiliserer proteinet.

En af metoderne hvorpå den tredimnesionelle struktur bliver fundet er ved røntgenkrystallografi. I denne metoder sender man røntgenstråler ind på atomerne, i en struktur og da røntgenstrålen vil blive afbøjet forskelligt alt afhængig af atomets palcering, kan man ved at måle afbøjningen bestemmer atomernes placering.

 

PDB-databasen er kædet sammen med en række andre databaser og programmer, blandt andet NCBI og PyMol. Ved at søge på et protein på NCBI kan man undersøge om proteinet har en kendt tredimensionel struktur. En sådan undersøgelse er mulig, fordi hvert protein i PDB har et PDB id (se infoboks 3). Et PDB id er et unikt nummer i stil med et accession nummer (se infoboks 4). PDB id'et er fire karaktere lang og består af både tal og bogstaver f.eks. 1MGY.

 

Brug

  • Undersøge om et protein har en kendt tredimensionel struktur.
  • Finde PDB id'et til proteinet med den kendte struktur.
  • Finde informationer om proteinets struktur der kan bruges til en senere undersøgelse i PyMol
    • Hvordan ser proteient ud?
    • Hvordan ser det aktive site ud?
    • Hvilke kæder (subunits) består det af?
    • Hvor lang er aminosyresekvensen i hver kæde?
    • Er der konserverede domæner (se infoboks 5)?

Generel guide

Den mest simple søgning i PDB-databasen gøres ved at søge på et PDB id, f.eks. 1JKL. Ved at søge på et PDB id finder man kun det pågældende protein, men det er en forudsætningen, at man kender PDB id'et.
En mere kompleks søgning gøres med fritekst, f.eks. "human insulin". Fritekstsøgning anvendes, hvis man vil undersøge, om PDB indeholder kendte strukturer inden for søgekriteriet, f.eks. om PDB indeholder strukturer af humant insulin.
En ulempe ved fritekstsøgning er det store antal resultater, der ofte fås. Det anbefales derfor at søge direkte på PDB id’et, hvis man kender det.

figur 2 kan man se hvor søgningsfelterne er placeret i PDB, og figur 3 viser opbygningen af en resultat side efter endt søgning.

 

/upload/institutter/bio/ba/projekter/bioinfo/pdb.png

Figur 2. Startsiden for PDB. Klik for at se figuren i stor format.

 

 /upload/institutter/bio/ba/projekter/bioinfo/pdb_efter s├©gning.png

Figur 3. Resultatsiden efter en fritekstsøgning i PDB. Det er den øverste del af siden der af vist, og dermed kun det første af mange resultater, her strukturen med PDB ID 2L1Y, der kan ses. Klik for at se figuren i stor format.

 

Når den rette struktur er fundet, kan man gå til strukturens PDB-side. Øverst på siden er en række faner (1 på figur 4), der kategoriserer strukturens information. I dette materiale skal fanerne Summay og Sequence benyttes.

  • Summary siden er startsiden for strukturen (se figur 4). Som navnet antyder, giver Summary siden en opsummering af strukturens informationer.
    Det mest interessante område på Summary siden er den molekylære beskrivelse (eng. Molecular Description, 2 på figur 4). I denne del kan man få informationer om:

    • Klassifikationen af søgeresultatet (i eksemplet her er det et hormon)
    • Vægt
    • Antal af kæder (subunits) og deres længde

     
    I området under Source (dansk kilde, (3 på figur 4) kan man se hvilke organismer strukturerne stammer fra.

 

 /upload/institutter/bio/ba/projekter/bioinfo/pdb_summary sektion.png 

Figur 4. Summary siden for en PDB side. 

 

  • I fanen Sequence (se figur 5), er der mere specifikke informationer omkring strukturen.
    Som nævnt kan et protein bestå af flere kæder (subunits). Kæderne kan være både identiske og forskellige, og på Sequence siden kan man se, hvilke der er identiske og forskellige. Dette kan findes under 1 i figur 5, hvor der også står, hvor mange kæder der er. Man kan vælge, om man vil se informationerne for alle kæderne i strukturen, eller kun dem der er unikke (dvs. at der kun vises en af hver kæde, og identiske kæder bliver dermed ekskluderet), se 2 på figur 5. For hver kæde kan man endvidere se sekundærstrukturen for forskellige dele af sekvensenen og dermed se ved hvilke aminosyrer de forskellige sekundærstrukturer starter.
      

 
/upload/institutter/bio/ba/projekter/bioinfo/pdb sequence sektion.png

Figur 5. Sequence siden for et søgeresultat i PDB. Klik for at se figuren i stor format.

 

Du kan læse mere om proteinstrukturer i teoridelen her

Hvis man ønsker at arbejde videre med proteinet i f.eks. PyMol, kan man downloade PDB filen. Dette gøres ved at trykke Download files i det øverste højre hjørne ved siden af PDB id'et (i figur 5 er det ved siden af 2L1Y). Når man har trykket på Download files skal punktet PDB file (Text) vælges, og PDB filen bliver dermed downloaded direktet til din download mappe. PDB filen kan åbnes i programmet PyMol, hvor du kan visualisere proteinet.

 

I Øvelse 1. Aktin, fra mRNA til tredimensionelt protein (1.C), Øvelse 2. Myostatins proteininteraktioner og organismers slægtsskab (2.B), Øvelse 3. Bioinformatisk analyse af antistoffer (3.B) og Øvelse 4. Identifikation og visualisering af ukendt protein (4.C) arbejder man med brugen af PDB.

 

 

Sidst opdateret 04.05.2012
Top

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Infoboks 1

 

Sekventering er en betegnelse for det at bestemme nukleotidrækkefølgen i DNA eller aminosyrerækkefølgen i proteiner. Med andre ord er det en betegnelse for at bestemme sammensætningen af DNA- eller proteinsekvenser. Læs mere om sekventering i afsnit 4.3 her

 

Infoboks 2

 

Et protein er sat sammen på forskellige niveau (strukturer). Den primære struktur betegner aminosyresammensætningen, den sekundære struktur betegner den måde proteinet er foldet på (α-helix eller β-plader), den tertiære struktur betegner den tredimensionnelle foldning af proteinet og den kvanternære struktur 

 betegner et færdigt protein når der er sat sammen i flere subunits (hvor hver subunit er i sin tertiære form). Se et sammenhæng mellem proteinstrukturerne her.

  

Infoboks 3

 

Et PDB id er et unikt nummer alle strukturer i PDB får tildelt. PDB id'et består af fire karakterer, hvilke oftest er et bogstav efter fulgt af tre tal, f.eks. 1JKL. 

 

Infoboks 4

 

Et accession nummer er et unikt nummer der gives til DNA- eller proteinsekvenser så de kan findes på tværs af databaser. Dvs. at den samme sekvens i UniProt og NCBI vil have samme unikke nummer tilknyttet, så man ved at søge på det vil få samme resultat ved søgning i begge databaser. 

 

Infoboks 5

 

Konserverede eller specifikke domæner i proteiner er her ensbetydende med områder i proteinet, der er vigtige for dets funktion. Disse domæner er oftest bevarede i beslægtede proteiner, og aminosyrersekvensen vil derfor være identisk på disse steder, når man sammenligner sekvenserne. Specifikke domæner er f.eks. steder, hvor proteinet interagerer med molekyler eller det sted, hvor processer katalyseres. Se et eksempel på specifikke (bevarede) domæner her.  

 

 

 

Søltofts PladsBygning 2212800 Kongens LyngbyTlf. 4525 4933