AC_FL_RunContent = 0;
TestprojekterDTU.dkDTU BioIndeksKontakt
Biotech Academy

Bioteknologiske metoder

4.1 Fylogeni

Fylogeni er en beskrivelse af evolutionshistorien og slægtsforholdene mellem forskellige organismer. Et fylogenetisk træ illustrerer disse forhold i et diagram hvor hvert forgreningspunkt i træet angiver en teoretisk fælles ”forfader” for enhederne længere ude af grenen.

Protein- eller DNA/RNA-sekvenser er særdeles velegnede til at opstille de evolutionære forhold, idet man ved sammenligning af sådanne sekvenser kan se, hvor nært beslægtede organismer er. Jo længere tid organismerne har udviklet sig hver for sig, jo mere forskellige er de. I figur 1 ses et eksempel på et fylogenetisk træ.

 

 

 

 
 Figur 1: Skitse af et fylogenetisk træ. Klik her for at se et større billede.

 

Inden man kan sammenligne gener eller proteiner mellem forskellige organismer, er det nødvendigt at kunne identificere dele af molekylerne som oprindeligt har været ens. Dette stiller krav til det gen eller protein der anvendes. Med udgangspunkt i genet skal det først og fremmes være til stede og have samme funktion i alle organismer der undersøges. Det skal sikre at dele af genet er konserveret dvs. uændret på tværs af de forskellige organismer. Derudover er det også nødvendigt at der er dele af genet som er stærkt varieret mellem forskellige organismer, således at der kan kendes forskel på to nært beslægtede arter. Kravene til anvendelse af gener i evolutionære studier er opsummeret i det følgende:

 

Krav til gener for anvendelse i evolutionære studier

    • Genet skal være til stede og have samme funktion i alle organismer da en sammenligning ellers ikke er mulig. Det vil sige at dele af genet skal være konserveret.
    • Dele af genets sekvens skal være forskellig fra art til art.
    • Der skal være områder på genet som er stærkt varieret, således at der kan kendes forskel på to nært beslægtede arter.
    • Der må ikke være sket overførsel af genet mellem forskellige arter. 

4.1.1 Ribosomalt RNA

Gensekvensen for Ribosomalt RNA (rRNA) er den hyppigst anvendte DNA-sekvens til konstruktion af fylogenetiske træer, da genet opfylder de beskrevne krav (se ovenfor).

 

Ribosomalt RNA, rRNA

    • rRNA findes i alle levende organismer.
    • rRNA har samme funktion i translation for alle organismer.
    • rRNA har udviklet sig langsomt nok, til at der er konserverede sekvenser i genet.

rRNA er hovedelementet i ribosomer og har derfor en stor rolle i proteinsyntesen. Alle levende organismer indeholder rRNA. rRNA findes i store mængder i cellerne da det sikrer at organismerne kan have mange ribosomer og opretholde en hurtig dannelse af proteiner. Ribosomet består af fire rRNA subunits samt en masse proteiner. For prokaryoter analyseres især 16S rRNA (i eukaryoter 18S rRNA) som er RNA-delen af den lille subunit til ribosomet. Dette gen har været anvendt da det har en passende størrelse. Det er relativt hurtig at sekventere og langt nok (ca. 1550 nukleotider) til at give en pålidelig fylogenetisk analyse.

 

I figur 2 nedenfor ses strukturen af et 16S ribosomalt RNA. Den meget specifikke struktur dannes ved hjælp af baseparring, inverted repeat og loops. Man kan sammenligne forskellige sekvenser af 16S rRNA ved hjælp af bioinformatik-programmer. I eukaryoter findes en lignende subunit, som kan sekventeres og analyseres. Denne er dog lidt større og betegnes 18S rRNA.

 

Figur 2: Sekundær struktur af rRNA, hvor man kan se loops og inverted repeats.

 

Før man kan sammenligne sekvenser af 16S rRNA fra forskellige organismer, er det naturligvis nødvendigt at sekventere genet. Inden sekventering er det nødvendigt at opformere genet, som gøres ved hjælp af en teknik der hedder PCR (beskrives senere).

 

Ved at sammenligne 16S rRNA sekvenser kan man adskille organismer på artsniveau og opefter. Det er således ikke muligt at se forskel på to individer inden for samme art ved at analysere de to 16S rRNA sekvenser.

 

4.1.2 Taxonomi

Før man benyttede fylogeni, som dannes ud fra kendte gensekvenser, var taxonomi en metode, hvormed man kunne klassificere organismer. Taxonomien bygger på sammenhænge mellem organismers karaktertræk, dvs. organismernes fænotype, mens fylogenien bygger på genotype. Der vil i mange tilfælde være sammenhæng mellem taxonomi og fylogeni, men det er ikke altid sikkert at de følges ad. To organismer der i lang tid har været gennem forskellige evolutionsforløb vil være placeret langt fra hinanden i det fylogenetiske træ. De samme to organismer kan godt have fælles karaktertræk og blive placeret tæt på hinanden i taxonomien. For eksempel mente man tidligere at svovlbakterier og cyanobakterier var nært beslægtede da de begge har fotosyntese. Efter at have sekventeret deres 16S rRNA og opstillet dem i et fylogenetisk træ, er det imidlertid vist at de to bakterier befinder sig meget langt fra hinanden i evolutionsforløbet.

 

4.2 PCR – Polymerase-kædereaktion

PCR er en forkortelse af det engelske navn “Polymerase chain reaction” og som navnet indikerer, er der tale om en kædereaktion.

PCR er en metode der blandt andet bruges til at opformere dele af DNA-sekvenser in vitro (latin for "i glas". Dvs. ikke i kroppen. Normalt i PCR-rør). Gennem gentagne runder af replikation som man kan bestemme hvordan foregår. Ved hjælp af specifikke primere og en termostabil DNA-polymerase dannes store mængder af specifikke gener.

PCR består af mange cykler hvor en række trin gentages. Hvert trin har en specifik temperatur i et vist tidsrum. Hver cyklus svarer til en DNA-replikation, hvilket vil sige at mængden af DNA fordobles.

Første trin i PCR-maskinen består i opvarmning af DNA. Opvarmningen ødelægger hydrogenbindinger og van der Waals kræfter, hvilket forårsager at DNA denaturerer. Ved denaturering forstås at DNA mister sin sekundære struktur og bliver til to enkeltstrenge i stedet for en dobbeltstrenget α-helix.

Derefter binder to primere sig til hver sin DNA-streng efter baseparringsprincippet. En primer er en kort DNA-streng som er komplementær til DNA-skabelonen. Denne del er nødvendig for at DNA kan replikeres da DNA-polymerasen skal bruge et stykke DNA at starte på og ikke en nøgen streng. Primerne er tilsat PCR-blandingen inden start.

Primerne binder ved at PCR-blandingen nedkøles. Hydrogenbindinger og van der Waals-kræfter bliver aktive igen. Der er tilsat et stort overskud af primere i blandingen for at sikre at DNA-strengene binder til primere og ikke til hinanden. DNA-polymerasen syntetiserer DNA når blandingen varmes en anelse mere op igen. DNA-polymerasen benytte DNA-strengene som skabelon og syntetiserer den komplementære streng. Nukleotiderne dATP, dTTP, dGTP og dCTP fungerer som byggesten og skal derfor også være til stede i PCR-blandingen. Efter én cyklus er antallet af den specifikke DNA-sekvens fordoblet. Nu kan proceduren gentages gang på gang. Normalt udføres 30-40 cykler i en PCR-maskine. Ved 30 cykler fordobles DNA’et 30 gange, og der opstår derved 2^30 kopier af det oprindelige stykke DNA.

 

 

/upload/institutter/bic/sites/biotech academy/darwin/grafik_darwin/4_3_pcr.png

 
Figur 3: Illustration af PCR. Den øverste del af figuren viser de første 3 cykler i en PCR-reaktion. Den nederste del viser detaljerne bag en cyklus. Først denatureres DNA ved opvarmning. Herefter følger en nedkøling hvor primere binder til hver sin DNA-streng. Derefter kopiers DNA-strengene.

 

Opvarmningen i PCR-maskinen er nødvendig for at denaturere DNA. Det er derfor vigtigt at DNA-polymerasen ikke ødelægges ved høje temperaturer. Det er løst ved at isolere DNA polymerasen fra bakterien Thermus aquaticus der lever under varme forhold. Denne polymerase kaldes Taq polymerase og er stabil op til 95 °C.

Dette er et klassisk eksempel på hvordan forskere i områder med ekstreme forhold har fundet enzymer med ønskede egenskaber.

 

4.3 Sekventering

Når man laver en sekventering, ønsker man at finde rækkefølgen af baserne i et stykke ukendt DNA. En DNA-sekvens er netop rækkefølgen af baserne for et bestemt stykke DNA.

Ved DNA-sekventering benyttes også en PCR-reaktion, og princippet er det samme som ved opformering af DNA.  Der tilsættes DNA-polymerase, primer (kun én primer) og nukleotider (dNTP, hvor N står for en nukleobase, dvs. enten A, T, C eller G) samt nogle modificerede nukleotider, som stopper replikationen. Disse stop-nukleotider er di-deoxynukleotider (ddNTP) som er mærket med hver sit fluorescerende stof der kan detekteres. Når PCR-reaktionen er løbet til ende, vil der pga. stopnukleotiderne være opstået DNA-fragmenter med forskellig størrelse. Alle fragmenterne starter det samme sted, nemlig med den primer man har anvendt i reaktionen. Fragmenterne stopper med et ddNTP. der fluorescerer i en farve. Farven angiver hvilket nukleotid der er på den pågældende position. DNA-fragmenterne kan adskilles efter størrelse. Enten ved hjælp af en elektroforese-gel eller ved kapillar elektroforese som er det mest benyttede i dag. Det bagvedliggende Princip er det samme. Fragmenterne vil trænge igennem gelen med forskellig hastighed – de små hurtigst og de store langsomst. Nu kan sekvensen af DNA aflæses, ved at se hvilken farve de enkelte bånd fluorescerer. Det afslører hvilket stopnukleotid der er tale om. I figur 4 vil det DNA-fragment der trænger hurtigst gennem gelen være mærket med en blå fluorescens, som svarer til basen A, og det kan derfor konkluderes at det første bogstav i sekvensen er A.

 

 

 
 Figur 4: Princippet bag sekventering

 

Det er ofte robotter der udfører DNA-sekventering. Detektionen fungerer ved at der sendes laserstråler mod DNA-fragmenterne, hvilket giver et bestemt udslag af fluorescens. Signalet af fluorescens hørende til et bestemt DNA-fragments stopnukleotid opsamles i et datasæt på en computer.

 

Et eksempel på et udsnit af sådan datasæt ses i figur 5. De forskellige toppe viser hvilket nukleotid der er blevet detekteret i den givne position. Nogle steder kan der opstå tvivl om hvilken base der er korrekt. Det ses ved at der fremkommer overlappende toppe. Grunden til at der fremkommer to toppe oven i hinanden er at teknikken ikke er perfekt. Det kan f.eks. være svært at adskille meget små fragmenter fra hinanden, og de kan derved blive detekteret samtidigt.

Højden af toppene indikerer hvor stærkt detektionssignalet er. Når der kun er en top til stede, vil det ikke spille nogen rolle. Hvis der derimod fremkommer to toppe, hvor den ene er lav, og den anden er høj, vil computeren indsætte basen for den højeste top på denne position. Computeren vil i dette tilfælde markere positionen med en gul streg, så det er muligt at se at der er to muligheder for den givne position.

 

 

 

 
Figur 5: Eksempel på datasæt for DNA-sekventering. Hver base giver et bestemt flourescens-udslag.  

 

4.4 Bioinformatik og sequence alignment

Når DNA er sekventeret, er det muligt at sammenligne med andre DNA-sekvenser ved at sammenholde sekvenserne base for base. Denne sekvenssammenligning kaldes på engelsk for sequence alignment.

Hvis sekvenserne ikke er lige lange, eller når der er brug for det, indsættes gaps som forlænger et stykke af sekvensen. Hvis de ikke blev indsat, ville to relativt ens molekyler se ud til at være vidt forskellige. Indsættelsen af gaps er illustreret i figur 6 nedenfor. I figur 7 er vist hvordan et sequence alignment output i praksis kan se ud.

 

 

 
Figur 6: Sequence alignment med indsættelse af gaps. Et-tallerne viser når der er overensstemmelse mellem de to sekvenser, mens 0’erne viser at der ikke er overensstemmelse. Det ses at efter indsættelse af gaps viser de to sekvenser ret stor lighed.

 

 

 
Figur 7: Sequence alignment output. Stregerne angiver hvor der er sammenhæng mellem de to sekvenser.

 

 

Når man har at gøre med små DNA-stykker, vil man godt kunne udføre denne sammenligning ved selv at kigge på sekvenserne, men som regel er DNA-sekvenserne så lange at det er nødvendigt at bruge en computer. For eksempel er DNA-sekvensen for 16S rRNA ca. 1550 nukleotider lang.

 

Der er udviklet computerprogrammer til at lave disse sekvenssammenligninger, og de kan godt sammenligne mange sekvenser på en gang. Ud over at indsætte gaps er programmerne lavet til at genkende de vigtigste områder på sekvenserne. Disse dele kaldes ankerpositioner. Når sekvenssammenligningerne er gennemført, er det muligt at se hvor meget sekvenserne hver især ligner hinanden, og derudfra opstille fylogenetiske træer. Hvis to sekvenser er meget ens, skal de ligge tæt ved hinanden på træet.

 

 

Læs mere:

Livet skal sættes på stregkode

Et internationalt forskningsprojekt skal forsøge at få styr på alverdens levende organismer ved hjælp af små ”DNA-stregkoder”. En artikel fra Aktuel Naturvidenskab.

 

Jagten på generne

En artikel fra Aktuel Naturvidenskab, der belyser, hvordan bioinformatikken bliver benyttet til daglig på Center for Biologisk Sekvensanalyse, DTU.

 

Sidst opdateret 30.05.2011
Top

Biospots

 

Hans Henrik Stærfeldt 

Hans Henrik Stærfeldt er ansat ved Center for biologisk sekvensanalyse, DTU.

[Se Hans Henriks profil]



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ribosomal RNA, rRNA: RNA der indgår i ribosomer. Findes i forskellige typer f.eks 16S i prokaryoter og 18S i eukaryoter.

 

Subunit: Et enkelt molekyle som i samspil med andre molekyler udgør en funktionel enhed. Bruges typisk om proteiner (enzymer), der kan bestå af 2 eller flere forskellige proteiner, der tilsammen udgør det aktive enzym. Bruges også om ribosomer (stor og lille subunit).

 

Baseparing: I DNA parrer A med T og C med G, I RNA gælder, at A parrer med U

i stedet for T. Baseparingen sker ved hydrogenbindinger mellem de forskellige baser i DNA- eller RNA-molekylet.

 

DNA eksisterer som en dobbelthelix af to DNA-strenge, hvor baseparring sker mellem de to strenge (intermolekylært).

 

RNA er enkeltstrenget og baseparring sker derfor mellem baser indenfor samme streng (intramolekylært), ved at RNA-strengen folder tilbage så molekylet i nogle områder bliver dobbeltstrenget.

 

Inverted repeat: Når to områder på RNA-strengen er komplementære, kan RNA-strengen folde tilbage og danne baseparring mellem de to områder. Dette kaldes inverted repeat.

 

Loop: Hvis RNA-strengen baseparer med sig selv ved et inverted repeat dannes der et loop

 

Sekventering: Sekventering er opklaring af basernes rækkefølge i DNA eller RNA.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fænotype: Alle observerbare karaktertræk. Biologisk opstår de af den måde generne i kombination med miljøet kommer til udtryk i en organisme..

 

Genotype: Arveegenskaberne i en organisme.

 

Primer: Et kort stykke RNA eller DNA der fungerer som udgangspunkt for DNA-replikation. En primer er nødvendig for DNA-replikation , da de involverede enzymer kun kan sætte nukleotider på en allerede eksisterende nukleotid-streng.

 

I PCR benyttes syntetisk fremstillede primere der er specifikke for den DNA-sekvens der ønskes opformeret.

 

Hydrogenbindinger: Tiltrækningskræfter mellem et elektropositivt hydrogenatom og et elektronegativt atom (f.eks. oxygen).

 

Van der Waals kræfter: Tiltrækningskræfter mellem to hydrofobe molekyler.

 

Denaturering: Kemisk proces hvormed DNA eller proteiner mister sin rummelige struktur. Dette kan for eksempel ske ved udsætning for syre eller opvarmning. Hvis et protein mister sin rummelige struktur mister det sin funktion.

Søltofts PladsBygning 2212800 Kongens LyngbyTlf. 4525 4933