TestprojekterDTU.dkDTU BioIndeksKontakt
Biotech Academy

Bioteknologiske metoder

4.1 Fylogeni

Fylogeni er en beskrivelse af evolutionshistorien og slægtsforholdene mellem forskellige organismer. Et fylogenetisk træ illustrerer disse forhold i et diagram, hvor hvert forgreningspunkt i træet angiver en teoretisk fælles ”forfader” for enhederne længere ude af grenen.

Protein eller DNA/RNA-sekvenser er særdeles velegnede til at opstille de evolutionære forhold, idet man ved sammenligning af sådanne sekvenser kan se, hvor nært beslægtede organismer er. Jo længere tid organismerne har udviklet sig, hver for sig, jo mere forskellige er de. I figur 1 ses et eksempel på et fylogenetisk træ.

 

 

 

 
 Figur 1: Skitse af et fylogenetisk træ. Klik her for at se et større billede.

 

Inden man kan sammenligne gener eller proteiner mellem forskellige organismer, er det nødvendigt at kunne identificere ens dele af molekylerne. Dette stiller krav til det gen eller protein, der anvendes. Hvis der tages udgangspunkt i genet, skal genet først og fremmes være til stede og have samme funktion i alle organismer, idet dele af genet skal være konserveret dvs. dele af genet skal være ens for forskellige organismer. Derudover er det også nødvendigt, at der er dele af genet, som er stærkt varieret mellem forskellige organismer, således at der kan kendes forskel på to nært beslægtede arter. Kravene til anvendelse af gener i evolutionære studier er opsummeret i det følgende:

 

Krav til anvendelse af gener i evolutionære studier

    • Genet skal være til stede og have samme funktion i alle organismer, da en sammenligning ellers ikke er mulig. Det vil sige, at dele af genet skal være konserveret.
    • Dele af genets sekvens skal være forskellig fra art til art.
    • Der skal være områder på genet, som er stærkt varieret, således at der kan kendes forskel på to nært beslægtede arter.
    • Der må ikke være sket overførsel af genet mellem forskellige arter. 

4.1.1 Ribosomal RNA

Gensekvensen for Ribosomal RNA (rRNA) er den hyppigst anvendte nukleotidsekvens til konstruktion af fylogenetiske træer, da genet, der koder for rRNA, opfylder de krav, der stilles til anvendelse af gener i evolutionære studier (se ovenfor).

 

Ribosomal RNA, rRNA

    • rRNA findes i alle levende organismer.
    • rRNA har samme funktion i translation for alle organismer.
    • rRNA har udviklet sig langsomt nok, til at der er konserverede sekvenser i genet.

rRNA er hovedelementet i ribosomer og har derfor en stor rolle i proteinsyntese. Alle levende organismer indeholder rRNA, da de alle har brug for at syntetisere proteiner. rRNA findes i store mængder i cellerne, da det sikrer, at organismerne hurtigt kan syntetisere ribosomer og dermed opretholde en hurtig dannelse af proteiner. Ribosomet består af fire rRNA subunits samt en masse proteiner. For prokaryoter analyseres især 16S rRNA (i eukaryoter 18S rRNA), som er RNA-delen af den lille subunit til ribosomet. Dette gen har været anvendt, da det har en passende størrelse, det er relativt hurtig at sekventere, og langt (ca. 1550 nukleotider) nok til at give en pålidelig fylogenetisk analyse.

 

I figur 2 nedenfor ses strukturen af et 16S ribosomal RNA-molekyle. Den meget specifikke struktur dannes ved hjælp af baseparring, inverted repeat og loops. Man kan sammenligne forskellige sekvenser af 16S rRNA ved hjælp af bioinformatik-programmer. I eukaryoter findes en lignende subunit, som kan sekventeres og analyseres. Denne er dog lidt større og betegnes 18S rRNA.

 

Figur 2: Sekundær struktur af rRNA, hvor man kan se loops og inverted repeats.

 

Før man kan sammenligne sekvenser af 16S rRNA fra forskellige organismer, er det naturligvis nødvendigt at sekventere genet, der koder for 16S rRNA. Inden sekventering er det desuden nødvendigt at opformere det pågældende gen, og dette gøres ved hjælp af en teknik, der hedder PCR (beskrives senere).

 

Ved at sammenligne 16S rRNA sekvenser kan man adskille organismer på artsniveau og opefter. Det er således ikke muligt at se forskel på to individer inden for samme art ved at analysere de to 16S rRNA sekvenser.

 

4.1.2 Taxonomi

Før man benyttede fylogeni, som dannes ud fra kendte gensekvenser, var taxonomi en metode, hvormed man kunne klassificere forskellige organismer. Taxonomien bygger på sammenhænge mellem organismers karaktertræk, dvs. organismernes fænotype, mens fylogenien bygger på genotype. Der vil i mange tilfælde være sammenhæng mellem taxonomi og fylogeni, men det er ikke altid sikkert, at de følges ad. To organismer, der er placeret langt fra hinanden i det fylogenetiske træ, og dermed i lang tid har været gennem forskellige evolutionsforløb, kan godt have fælles karaktertræk, og derfor blive placeret tæt på hinanden i taxonomien. For eksempel mente man tidligere, at svovlbakterier og cyanobakterier var nært beslægtede, da de begge er i stand til at fotosyntetisere. Efter at have sekventeret deres 16S rRNA og opstillet dem i et fylogenetisk træ er det imidlertid vist, at de to bakterier befinder sig meget langt fra hinanden i evolutionsforløbet.

 

4.2 PCR – Polymerase-kædereaktion

PCR er en forkortelse af det engelske navn “Polymerase chain reaction” og som navnet indikerer, er der tale om en kædereaktion.

PCR er en metode, der blandt andet bruges til at opformere dele af DNA-sekvenser in vitro (dvs. uden for kroppen) gennem gentagne runder af replikation ved hjælp af specifikke primere og DNA-polymerase. Ved polymerase-kædereaktionen kan der dannes store mængder af specifikke gener. PCR benytter princippet bag DNA-replikation, og i PCR-reaktionen benyttes enzymet DNA-polymerase, som replikerer (kopierer) DNA-molekyler.

Første runde i PCR-maskinen består i opvarmning af DNA. Opvarmningen ødelægger hydrogenbindinger og van der Waals kræfter, hvilket forårsager, at DNA denaturerer . Ved denaturering forstås, at DNA mister sin sekundære struktur og bliver til to enkeltstrenge i stedet for en dobbeltstrenget α-helix.

Derefter binder to primere sig til hver sin DNA-streng efter baseparringsprincippet. En primer er en kort RNA-streng, som er komplementær til DNA-molekylet. Denne del er nødvendig for, at DNA kan replikere, da DNA-polymerasen ikke kan bygge DNA ud fra ingenting, men har brug for et stykke at starte på. Primerne er tilsat PCR-blandingen inden start.

PCR-blandingen nedkøles, for at binde DNA-strengene til primerne, idet hydrogenbindinger og van der Waals-kræfter bliver aktive igen. Der er tilsat et stort overskud af primere i blandingen for at sikre, at DNA-strengene binder til primere og ikke til hinanden. DNA-polymerasen replikerer nu DNA ved at benytte DNA-strengene som skabelon ud fra primerne. Nukleotiderne dATP, dTTP, dGTP og dCTP fungerer som byggesten og skal derfor også være til stede i PCR-blandingen. Efter én runde er antallet af den specifikke DNA-sekvens fordoblet. Nu kan proceduren gentages gang på gang. Normalt udføres 30-40 runder i en PCR-maskine. I en PCR-maskine vil der foregå 30-40 cykler, hvor der gentagne gange sker en opvarmning efterfulgt af en nedkøling, så DNA-strengene først adskilles ved opvarmning, hvorefter primere binder ved nedkøling. Ved 30 cykler fodobles DNA’et 30 gange, og der opstår derved 2^30 kopier af det oprindelige stykke DNA.

 

 

/upload/institutter/bic/sites/biotech academy/darwin/grafik_darwin/4_3_pcr.png

 
Figur 3: Illustration af PCR. Den øverste del af figuren viser de første cykler i en PCR-reaktion. Den nederste del viser en detaljerne bag en cyklus. Først denatureres DNA ved opvarmning. Herefter følger en nedkøling, hvor primere binder til hver sin DNA-streng, hvorefter DNA-strengene kopieres.

 

Opvarmningen i PCR-maskinen er nødvendig for at denaturere DNA. Det er derfor vigtigt, at DNA-polymerasen ikke ødelægges ved en temperaturforøgelse. Dette er løst ved at isolere DNA polymerase fra bakterien Thermus aquaticus, der lever under varme forhold. Denne polymerase kaldes Taq polymerase og er stabil op til 95 °C.

Dette er et klassisk eksempel på, hvordan forskere i områder med ekstreme forhold har fundet enzymer med ønskede egenskaber.

 

4.3 Sekventering

Når man laver en sekventering, ønsker man at finde rækkefølgen af baserne i et stykke ukendt DNA. En DNA-sekvens er netop rækkefølgen af baserne for et bestemt stykke DNA.

Ved DNA-sekventering benyttes også en PCR-reaktion, og princippet er det samme som ved opformering af DNA.  Der tilsættes DNA-polymerase, primer (kun én primer) og nukleotider (dNTP, hvor N står for en nukleotidbase, dvs. enten A, T, C eller G) samt nogle modificerede nukleotider, som stopper replikationen. Disse stop-nukleotider er di-deoxynukleotider (ddNTP), som er mærket med hver sit fluorescerende stof, som kan detekteres. Når PCR-reaktionen er løbet til ende, vil der pga. stopnukleotiderne, være opstået DNA-fragmenter med forskellig størrelse. Alle fragmenterne starter det samme sted, nemlig med den primer, man har anvendt i sekvens-reaktionen. Fragmenterne stopper med et ddNTP, der fluorescerer i en farve, der angiver hvilket nukleotid, der er på den pågældende position. DNA-fragmenterne kan adskilles efter størrelse enten ved hjælp af en elektroforese-gel, eller ved kapillar elektroforese, som er det mest benyttede i dag. Princippet er det samme. Fragmenterne vil trænge igennem gelen med forskellig hastighed – de små hurtigst og de store langsomst. Nu kan sekvensen af DNA aflæses, idet der til hvert af fragmenterne er bundet et bestemt fluorescerende stof afhængig af, hvilket stopnukleotid der er tale om. F. eks vil det DNA-fragment, der trænger hurtigst gennem gelen være mærket med en blå fluorescens, som svarer til nukleotidbasen A og det kan derfor konkluderes, at det første bogstav i sekvensen er A. Se figur 4.

 

 

 
 Figur 4: Princippet bag sekventering

 

Det er ofte robotter, der udfører DNA-sekventering. Detektionen fungerer således, at der sendes laserstråler mod de forskellige DNA-fragmenter, hvilket giver et bestemt udslag af fluorescens. Signalet af fluorescens hørende til et bestemt DNA-fragments stopnukleotid opsamles i et datasæt på en computer.

 

Et eksempel på et stykke af et sådant datasæt ses i figur 5. De forskellige toppe viser, hvilken nukleotidbase der er blevet detekteret i den givne position. Nogle steder kan der opstå tvivl om, hvilken base det er. Det ses ved, at der fremkommer to toppe oven i hinanden. Grunden til at der fremkommer to toppe oven i hinanden er, at teknikken ikke er perfekt. Det kan f.eks. være svært at adskille meget små fragmenter fra hinanden, og de kan derved blive detekteret samtidigt.

Højden af toppene indikerer, hvor stærkt detekteringssignalet er. Når der kun er en top til stede, vil det ikke spille nogen rolle. Hvis der derimod fremkommer to toppe, hvor den ene er lav, og den anden er høj, vil den højeste top bestemme, hvilken base computeren angiver i denne position. Computeren vil i dette tilfælde markere positionen med en gul streg, så det er muligt at se, at der er to muligheder i den givne position.

 

 

 

 
Figur 5: Eksempel på datasæt for DNA-sekventering. Hver base giver et bestemt flourescens-udslag.  

 

4.4 Bioinformatik og sequence alignment

Når DNA er sekventeret, er det muligt at sammenligne med andre DNA-sekvenser. Dette sker ved, at DNA-stykkerne sammenlignes base for base. Denne sekvenssammenligning kaldes på engelsk for sequence alignment.

Hvis sekvenserne ikke er lige lange, indsættes gaps, som forlænger et stykke af sekvensen. Hvis de ikke blev indsat, ville to relativt ens molekyler, se ud til at være vidt forskellige. Hvordan indsættelse af gaps fungerer, er illustreret i figur 6 nedenfor. I figur 7 er vist, hvordan et sequence alignment output i praksis kan se ud.

 

 

 
Figur 6: Sequence alignment med indsættelse af gaps. Et-tallerne viser, når der er overensstemmelse mellem de to sekvenser, mens 0’erne viser, at der ikke er overensstemmelse. Det ses, at efter indsættelse af gaps viser de to sekvenser ret stor lighed.

 

 

 
Figur 7: Sequence alignment output. Stregerne angiver hvor der er sammenhæng mellem de to sekvenser.

 

 

Når man har at gøre med små DNA-stykker, vil man godt kunne udføre denne sammenligning ved selv kigge på sekvenserne, men som regel er DNA-sekvenserne så lange, at det er nødvendigt at bruge en computer. For eksempel er DNA-sekvensen for 16S rRNA ca. 1550 nukleotider lang.

 

Der er udviklet computerprogrammer til at lave disse sekvenssammenligninger, og de kan godt sammenligne mange sekvenser på en gang. Ud over at indsætte gaps er programmerne lavet til at genkende de vigtigste områder på sekvenserne. Disse dele kaldes ankerpositioner. Når sekvenssammenligningerne er gennemført, er det muligt ud fra, hvor meget sekvenserne hver især ligner hinanden, at opstille fylogenetiske træer. Hvis to sekvenser er meget ens, skal de ligge tæt ved hinanden på træet.

 

 

Læs mere:

Livet skal sættes på stregkode

Et internationalt forskningsprojekt skal forsøge at få styr på alverdens levende organismer ved hjælp af små ”DNA-stregkoder”. En artikel fra Aktuel Naturvidenskab.

 

Jagten på generne

En artikel fra Aktuel Naturvidenskab, der belyser, hvordan bioinformatikken bliver benyttet til daglig på Center for Biologisk Sekvensanalyse, DTU.

 

Sidst opdateret 02.03.2010
Top

Biospots

 

Hans Henrik Stærfeldt 

Hans Henrik Stærfeldt er ansat ved Center for biologisk sekvensanalyse, DTU.

[Se Hans Henriks profil]



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ribosomal RNA, rRNA: RNA, der indgår i ribosomer. Findes i forskellige typer f.eks 16S i prokaryoter og 18S i eukaryoter.

 

Subunit: Et enkelt molekyle, som i samspil med andre molekyler udgør en funktionel enhed. Bruges typisk om proteiner (enzymer), der kan bestå af 2 eller flere forskellige proteiner, der tilsammen udgør det aktive enzym. Bruges også om ribosomer (stor og lille subunit).

 

Baseparing: I DNA parrer A med T og C med G, mens der for RNA gælder, at A parrer med U og C med G.

Baseparingen sker ved hydrogenbindinger mellem de forskellige baser i DNA- eller RNA-molekylet.

 

DNA eksisterer som en dobbelthelix af to DNA-strenge, hvor baseparring sker mellem de to strenge (intermolekylært).

 

RNA er enkeltstrenget og baseparring sker derfor mellem baser indenfor samme streng (intramolekylært), ved at RNA-strengen folder tilbage så molekylet i nogle områder bliver dobbeltstrenget.

 

Inverted repeat: Når to områder på RNA-strengen er komplementære, kan RNA-strengen folde tilbage og danne baseparring mellem de to områder. Dette kaldes inverted repeat.

 

Loop: Hvis RNA-strengen danner en enkeltstrenget del, som bliver sluttet sammen igen ved inverted repeat.

 

Sekventering: Sekventering er opklaring af basernes rækkefølge i DNA eller RNA.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fænotype: Den måde hvorpå arveegenskaberne i kombination med miljøet kommer til udtryk i en organisme.

 

Genotype: Arveegenskaberne i en organisme.

 

Primer: Et kort stykke RNA eller DNA, der fungerer som udgangspunkt for DNA-replikation. En primer er nødvendig for DNA-replikation , da de involverede enzymer kun kan tilsætte nukleotider til en allerede eksisterende nukleotid-streng.

 

I PCR benyttes syntetisk fremstillede primere, der er specifikke for den DNA-sekvens, der ønskes opformeret.

 

Hydrogenbindinger: Tiltrækningskræfter mellem et elektropositivt hydrogenatom og et elektronegativt atom (f.eks. oxygen).

 

Van der Waals kræfter: Tiltrækningskræfter mellem to hydrofobe molekyler.

 

Denaturering: Kemisk proces hvormed DNA eller proteiner mister sin rummelige struktur. Dette kan for eksempel ske ved udsætning for syre eller opvarmning. Hvis et protein mister sin rummelige struktur mister det sin funktion.

Søltofts PladsBygning 2212800 Kongens LyngbyTlf. 4525 4933