I. UniProt
Formålet med denne øvelse er at lære at søge efter og gøre sig bekendt med proteiner ud fra den information, der er tilgængelig gennem UniProt. Dette gøres ved at benyttefritekstsøgekriterier eller accession-numre og derefter undersøge UniProt-siderne for de proteiner, der blev fundet.
a)
Benyt den generelle guide til søgning i UniProt til at søge efter de ønskede proteiner. Du kan vælge enten at have to UniProt-sider åbne i hver sit vindue og foretage de to søgninger samtidig, eller du kan lave del 2.A.a og del 2.A.b for først myostatin og derefter gentage dem for follistatin.
Du skal søge efter:
-
Myostatin, der skal komme fra mennesker.
-
Follistatin, der skal komme fra mennesker.
NB! Husk at proteiner ofte har både et populært navn (f.eks. myostatin) og et videnskabeligt navn (f.eks. GFD8 for myostatin).
Du kan gå til UniProt-databasen ved at klikke her. Husk eventuelt at åbne to vinduer, da du skal lave to søgninger.
-
Hvad er accession-nummeret for de to proteiner?
b)
Gå til de to proteiners UniProt-side og svar på nedenstående spørgsmål. Dette skal du gøre for at få et overblik over UniProt-siderne samt for at finde ud af, hvilke informationer man kan få om proteiner gennem UniProt.
De to første spørgsmål kan besvares ved at se øverst på proteinernes UniProt-side.
- Hvad er proteinernes anbefalede navn (eng. recommended name) og deres gennavn (navnet på det gen der koder for proteinet)?
- Hvor lange er sekvenserne i aminosyrer (fork. AA)?
- Gå til afsnittet “General annotation (Comments)”.
Hvad er deres funktion og subcellulære lokationer? Follistatin har et bindingsdomæne specifikt for proteiner fra TGF. Hvilken proteinfamilie tilhører myostatin? Peger dette i retning af interaktion mellem follistatin myostatin?
- Hvad ville der ske, hvis der kun var myostatin i kroppen? Hvad vil der ske, hvis der både er myostatin og follistatin?
- Gå til afsnittet “Sequence annotation (Features)”.
Follistatin binder som nævnt til proteiner fra TGF-β-familien. Hvad hedder det bindende domæne på proteinsekvensen for follistatin, og på hvilke positioner kan det findes?
NB! Se afsnittet Molecule processing under Sequence Annotation.
II. PDB
Formålet med denne øvelse er at lære at finde relevant information om et protein gennem dets PDB-side, så de relevante dele kan observeres gennem tredimensionel visualisering i PyMol.
a)
Gå til PDB databasen og søg efter PDB-siden med id 3HH2.
-
Hvilke molekyler kan man se i PDB-id’et?
-
Hvor mange kæder indeholder id’et, og hvor mange af disse er identiske? Hvad er navnet på dem (A, B, C…)? Hvad koder de for (myostatin, follistatin…)?
NB! Dette kan findes under Sequence-fanen.
-
Hvor mange aminosyrer indeholder hver af kæderne, og hvilken på position i kæden findes henholdsvis den første og den sidste aminosyre? Stemmer dette overens med længden af de færdige proteiner, som du fandt i 2.A.6 (109AA for myostatin og 315AA for follistatin)?
NB! Dette kan også ses vises gennem
Sequence-fanen.
Viden omkring hvilke kæder PDB-id’et indeholder, hvad disse koder for og hvilke dele af selve aminosyresekvensen id’et indeholder, kan benyttes i PyMol. Denne viden kan bruges til at undersøge proteinerne tredimensionelt, markere kæderne og interessante aminosyrer eller observere interaktioner, når PDB id’et indeholder mere end et protein.
III. PyMol
Formålet med øvelsen er at lære at benytte PyMol til tredimensionel visualisering af proteiner samt at markere relevante kæder og dermed præsentere proteiner på en overskuelig måde.
a)
Åben PyMol og hent aktin-DNAase I-komplekset med PDB-id 1ATN. Benyt herefter den generelle guide til PyMol og kommandosiden for at lære PyMol og relevante kommandoer at kende så du kan gøre følgende:
- Vis alle molekylerne i tegningstruktur.
NB! Det anbefales først at gemme (hide) alt og derefter benytte vis (show).
- Farv de fire forskellige kæder med hver deres farve (kæde A+B en nuance f.eks blålige og kæde C+D en anden f.eks. rødlige).
- Visualiser TB-domænet (TGF-β-familiens bindingsdomæne) på follistatin-molekylet (kæde C og D). Det skal vises med både sidekæde og separat farve. Via deløvelse 2.a fandt du ud af, hvor TB-bindingsdomænet på follistatin-molekylet sidder. Hvis ikke denne øvelse er udført, så udgør dette domæne aminosyrerne i intevallet 30-103 på det ikke-færdige protein og dermed aminosyrerne 1-74 på det færdige.
NB! Vælg først aminosyrerne, vis sidekæder og farv dem til slut.
- Visualiser kun én myostatin- og én follistatin-kæde, fx kæde A og C. Med en generel viden om proteininteraktioner, vil du så antage, at det er det korrekte domæne, der på follistatininteragerer med myostatin?
NB! Vurderingen kan foretages ved at benytte hide og derefter den kæde man ikke vil se.
- Udforsk selv PyMol og de forskellige måder, som molekylerne kan vises på. Eksempelvis kan baggrundsfarven ændres, skyggerne kan justeres, måderne og meget andet.
IV. FigTree
Formålet med øvelsen er at blive bekendt med FigTree og at kunne benytte programmet til at visualisere et evolutionært slægtskab mellem forskellige organismer.
a)
Hent filen myostatin_alignment.ph her. Filen, der er lavet ved sekvensalignments (læs mere her) i programmet ClustalX, og det er en træ-fil af formaten Newick. Newick formatet bruges til træ-filer, og i formatet bliver det evolutionære slægtskab mellem træets arter angivet som distancen mellem arterne.
Marker hele teksten i myostatin_alignment.ph og kopier den over i en teksteditor som f.eks. Notepad på Windows computere eller TextEdit på Apple computere. Gem filen som en almindelig tekstfil som myostatin_alignment.ph. Det er vigtigt, at filen ender på .ph, da dette specificerer, at filen er i et format kaldet phylip. Denne type fil bruges som input i programmet FigTree.
Åbn FigTree og åbn derefter myostatin_alignment.ph i programmet. Svar herefter på følgende spørgsmål:
- Er der en overordnet tendens til en gruppering (dannelse af clades) af de forskellige organismer?
- Hvilken organisme adskiller sig mest fra de andre. Se her både på grenlængden, og på hvilken der intuitivt set (på baggrund af din viden om organismerne) adskiller sig mest?
b)
For at kunne danne sig et overblik over et kronologisk slægtskab kan man lave en rod på træet. Roden laves ved at specificere ydergruppen (eng. outgroup), som er den organisme, der først divergerede væk fra de andre arter, som samlet kan betegnes som ingroup. Således kan der dannes en evolutionær tidshorisont.
- Hvilken organisme vil du vælge som ydergruppe og hvorfor?
Lav nu træet med rod, dvs. lav en rod således at ydergruppen kommer tættest på roden og dermed længst væk fra de andre arter. Benyt den generelle guide til FigTree for at se, hvorledes det gøres.
- Er der sket nogle ændringer i de observerede grupperinger fra spørgsmål 1? Hvorfor/hvorfor ikke?
- Stemmer grupperingerne overens med din logiske viden omkring arterne og det slægtskab omkring dem, som du kender til?
NB! Benyt eventuelt funktionen Rotate til at vende grenene. Det ændrer ikke på selve slægtskabet, men kun på visualiseringen af træet.
Hvis der er tid, kan træet sammenlignes med et træ lavet fra den taxonomiske database hos NCBI. Hent først listen med de arter, der indgår i træet her. Gem den i en tekstfil på din computer som myostatin_arter. Gå herefter til den taxoniske database ved at klikke her.
Benyt filen myostatin_arter i choose file og vælg derefter choose subset. Boksen animals tjekkes af, og choose vælges for at visualisere træet. Arter med fed skrift er dem, der indgår i træet. De latinske navne for arterne skal kendes for at forstå træet. Disse kan ses her.