Det centrale dogme

Formålet med denne artikel er at give den nødvendige baggrund for at forstå de efterfølgende artikler om kræftbiologi og DNA-mikrochipteknologi. Artiklen vil gennemgå, hvad gener består af, opbygningen af DNA og RNA, og kort beskrive det centrale dogme og aflæsning af DNA til mRNA.

Hvor findes vores gener?

Alt levende er bygget op af celler. Fælles for alle levende organismer (bakterier, planter, dyr eller mennesker) er, at deres celler indeholder DNA. Generne, der er vores arvemateriale, består af DNA. Et gen er en del af et kromosoms DNA-sekvens jf. figur 1. Generne findes i alle vores celler, da enhver celle (med undtagelse af de røde blodlegemer) indeholder alle menneskets 46 kromosomer. En organismes samlede antal gener kaldes organismens genom. I 1950´erne blev det for alvor slået fast, at det er DNA (og ikke protein), der udgør den genetiske information, som overføres fra celle til celle under celledeling – og dermed fra forældre til børn. I 1953 blev den tredimensionelle struktur af DNA-molekylet opklaret af amerikaneren James Watson og englænderne Francis Crick og Rosalind Franklin.

Figur 1. Et gen er en del af et kromosoms DNA-streng. Gener kan have forskellige længder. En god del af selve DNA’et koder ikke for nogen gener. Disse DNA-stykker kaldes introns, mens de DNA-stykker, som koder for generne, kaldes exons. Dette er illustreret ved de pladser, der er mellem gen 1 og gen 2 hhv. gen 2 og gen 3.

 

Hvordan er DNA og RNA opbygget?

DNA og RNA er nukleinsyrer, som består af kæder af nukleotider (som er de grundlæggende byggesten). Bindingerne mellem nukleotiderne er såkaldte kovalente bindinger, og disse er relativt stærke. Hver nukleotid-byggesten består af tre enkeltdele:

  • En phosphat-gruppe
  • Et kulhydrat (som i DNA er deoxyribose, og i RNA er ribose)
  • En nitrogenholdig base. Der er fire typer baser i DNA, nemlig Adenin (A), Thymin (T), Guanin (G), og Cytosin (C), hvoraf A og G er puriner, mens C og T er pyrimidiner. (I RNA er basen Thymin erstattet med Uracil (U), jf. figur 2

Figur 2. De fire forskellige baser A, C, G og T, der indgår i DNA. Desuden basen U der indgår i RNA i stedet for T. 

DNA er opbygget som et dobbeltmolekyle, hvor to strenge (polynukleotid-kæder) snor sig om hinanden i en højresnoet dobbeltspiral (dobbelthelix). De to strenge holdes sammen af svage hydrogenbindinger mellem baserne, hvor basen A altid baseparrer med T, og G altid baseparrer med C. Den dobbeltstrengede DNA-kæde kan dog adskilles ved høj temperatur til to enkeltstrengede komplementære DNA-strenge.

Dannelse af en DNA-streng (og en RNA-streng) foregår altid ved phosphatgruppen, der sidder på 5´ (“5 mærke”) positionen i kulhydratringen i det nukleotid, der skal indbygges. Phosphatgruppen binder til den voksende streng via OH-gruppen, der sidder på 3´ (“3 mærke”) positionen jf. figur 3.

De to strenge i et DNA-molekyle er dannet i hver sin retning og er derfor antiparallelle. En celles DNA har en samlet længde på ca. 2 meter. For at få plads til hele genomet i hver enkelt celle, er DNA-strengen viklet op omkring spolelignende proteiner – såkaldte histoner. Når DNA pakkes sammen, dannes fibre, der ser ud som perler på en snor. Disse fibre vikles omkring proteiner kaldet histoner og den dannede struktur kaldes chromatin. Den udgør det ”byggemateriale”, som kromosomer er opbygget af, jf. figur 3. Histonerne og deres funktion i regulering af gener uddybes i artiklen ”Biologiske mekanismer i kræft”.

Figur 3. DNA bestående af de fire baser danner en dobbelthelix. Den samlede struktur er et kromosom. Det ses, hvordan DNA-baserne parrer sig to og to. Adenin parrer med thymin, og guanin parrer med cytosin. En DNA-bases ”makker” kaldes den komplementære base.

Opsummering

DNA, der er vores biologiske arvemateriale, findes i alle levende organismers celler. DNA er nukleinsyrer, der består af nukleotider. De består af tre dele; en phosphatgruppe, en kulhydratgruppe og en nitrogenholdig base. DNA har fire forskellige nitrogenholdige baser, adenin (A), thymin (T), cytosin (C), og guanin (G). RNA, der også er en nukleinsyre, ligner DNA. En forskel er basen thymin, som er udskiftet med basen uracil (U). DNA er en dobbelthelix, hvor de to strenge holdes sammen af hydrogenbindinger mellem baserne. Basen A bindes altid til basen T og basen C bindes altid til basen G. DNA i en enkelt celle kan udfoldes til en 2 meter lang streng. For at kroppen kan rumme så meget DNA, pakkes DNA meget kompakt omkring histoner. Denne pakning udgør kromosomet.

Hvordan omsættes den genetiske information i cellen?

Fra en celles gener afsendes beskeder, som indeholder instrukser til at danne funktionelle proteiner, der er nødvendige for cellen. Denne informationsoverførsel er med til at bestemme cellens fænotype (udseende og funktion – f.eks. om cellen skal være en hudcelle eller en muskelcelle). Typen og mængden af protein, der er til stede i en celle, afhænger af genotypen, som er gensammensætningen af cellens kromosomer (et menneskes 46 kromosomer kan deles op i 2 x 23 kromosomer, hvoraf det ene kommer fra ens mor, og det andet fra ens far). Det er genotypen og udefrakommende faktorer, der tilsammen bestemmer fænotypen af cellen og derved organismen.

“Det centrale dogme” indenfor molekylærbiologien er et princip, der siger, at omsætningen af information sker fra DNA over RNA til protein. Kort beskrevet omskrives (transkriberes) DNA i den menneskelige cellekerne til små transportable RNA-molekyler, som efter processering kaldes messenger RNA (mRNA). Herefter transporteres mRNA ud af kernen, og i cytoplasmaet aflæses koden i mRNA’et af ribosomerne, som oversætter (translaterer) denne kode til aminosyrer, der er byggestenene i proteiner. På denne måde syntetiseres alle cellens nødvendige proteiner.

DNA -> mRNA-> aminosyrer -> protein -> celle-fænotype ­-> organisme-fænotype

Den konkrete måde, hvorpå mRNA’et koder for en aminosyre bestemmes af nukleotiderne. Når tre nukleotider sidder i række udgør de et codon. Hvert codon koder for én aminosyre. Og et protein, som er lavet af 100 aminosyrer, stammer således fra et gen med minimum 300 nukleotider. Da der findes 4 forskellige nukleotider i hhv. DNA og RNA (basen T er byttet om med U i RNA), findes der i alt 43 = 64 forskellige codons. Da der kun benyttes 20 forskellige typer af aminosyrer i proteiner, er der dog mange af disse codons, som koder for de samme aminosyrer. I tabel 1 kan alle de forskellige codons ses, og det fremgår hvilke aminosyrer (eller stop-codon), som de koder for.

Tabel 1. Oversigt over den genetiske kode. Det ses, at flere codons koder for samme aminosyre.

Det centrale dogme inden for molekylærbiologien er, at en celle fungerer ved tre primære informationsomsætninger. Disse er replikation, transkription og translation. Replikation er den proces, hvormed DNA’et kopieres, inden en celle undergår mitose og deler sig i to identiske kloner. Transkription er processen, hvor DNA oversættes til RNA, og transkriptionen er den proces, der er direkte relateret til DNA-mikrochipteknologien. Translation er den proces, hvor mRNA’et oversættes til protein af ribosomerne.

Figur 4. Det centrale dogme. DNA transkriberes til mRNA, som videre translateres til protein, der udøver en funktion i kroppen. Når DNA transkriberes til RNA, påsættes der A på den nye RNA-kæde over for T  på DNA-kæden. G påsættes over for C og omvendt, mens basen U (i stedet for T) påsættes over for A.

Transkription

Under transkriptionen bliver DNA oversat til RNA. RNA er i modsætning til DNA enkeltstrenget. En enkeltstrenget sektion af DNA, der svarer til et gen, kopieres til RNA ved base komplementaritet, dvs. U (i stedet for T) dannes over for A, A over for T, G over for C, og C over for G, jf. figur 4.

Transkriptionen sker i tre trin:

  1. Initiering (start)
  2. Elongering (forlængelse)
  3. Terminering (slut)

Transkriptionen starter i bestemte regioner (små sekvensdele) på DNA’et. Disse regioner kaldes promoter-regioner. Når RNA polymerase II har sat sig på promotorregionen, bevæger den sig langs DNA-strengen og forlænger RNA-strengen ved at påsætte frie nukleotider med baserne A, G, C eller U, hvor henholdsvis T, C, G eller A findes på DNA-strengen. RNA polymerasengenkender stopsignalet på DNA-sekvensen og frigør den nysyntetiserede RNA-kæde fra DNA-strengen. RNA-strengen transporteres fra kernen til cytoplasmaet som messenger RNA (mRNA). Ribosomerne translaterer derefter mRNA’et til protein. Før dette finder sted, gennemgår RNA-kæden posttranskriptionelle ændringer, hvor alle ikke-kodende sekvenser (introns) af DNA spaltes fra, så kun DNA med relevant information er tilbage i RNA-strengen. Desuden sættes en sekvens af A’er på RNA strengens 3’ position, jf. figur 3. Denne sekvens af A’er kaldes poly(A)-halen. Poly(A)-halen  og spiller en vigtig rolle i mærkningen af DNA til mikrochippen gennem en proces, der kaldes mRNA revers transkription.

Figur 5. RNA polymerase II er et enzym, der katalyserer dannelsen af RNA ud fra en DNA-skabelon. Syntesen af RNA sker i tre trin; initiering, elongering og terminering.

Translation

Processen, hvor mRNA oversættes (translateres) til protein, kaldes translation. Denne proces udføres af cellens ribosomer, som selv består af ribosomalt RNA (rRNA). Ribosomerne aflæser mRNA’ets codons fra 5′-enden mod 3′-enden og sammensætter de rigtige aminosyrer (som codonerne koder for) i en kæde. Når kæden er kort, kaldes den et peptid, mens når kæden er lang (over 100 aminosyrer) kaldes den et protein eller polypeptid. Den kemiske reaktion som finder sted, når aminosyrerne sættes sammen, kaldes kondensation, da der fraspaltes H2O. Denne reaktion fører til dannelsen af en peptidbinding mellem de to aminosyrer. Reaktionen kan ses i figur 6. Et protein vil således bestå af mere end 100 aminosyrer, hver med en peptidbinding imellem sig, i en lang kæde.

Figur 6. Når to aminosyrer sættes sammen under proteindannelse, fraspaltes H2O. Den binding, der dannes herved, kaldes en peptidbinding. Læg mærke til at den ene aminosyrers OH-gruppe og den anden aminosyrers ene H spaltes fra, hvorved der dannes H2O.

Proteinerne oversat fra den genetiske information er essentielle for, at kroppen kan fungere. Produktionen af proteiner er meget nøje reguleret. Herved skabes en balance mellem kroppens forskellige funktioner, så den kan fungere optimalt. Når kroppen bliver syg uden at det skyldes udefrakommende faktorer – såsom bakterier, virus, dårlig kost eller mangel på motion – kan det skyldes en fejl i den genetiske kode eller reguleringen af den efterfølgende proteinsyntese.

Opsummering

Informationen fra vores arvemateriale, DNA, omsættes til mRNA, som videre oversættes til protein, der bestemmer en celles fænotype (udseende og funktion). Sammensætningen af gener fra de to kromosomsæt kaldes cellens genotype. Transkription fra DNA til mRNA sker i tre trin, initiering, elongering og terminering. RNA polymerase II binder til startpunktet for et gen på DNA-sekvensen og forlænger RNA-strengen ved at bruge DNA-strengen som skabelon. A syntetiseres over for T, U syntetiseres over for A, G syntetiseres over for C mens C syntetiseres over for G. De ikke-kodende dele af DNA spaltes fra i det færdige mRNA-molekyle. Fejl i den genetiske kode eller fejlregulering af gener og proteiner kan lede til forskellige genetiske sygdomme.

Når mRNA oversættes af cellens ribosomer til protein, aflæser ribosomet mRNA’ets codons fra 5′-enden mod 3′-enden og sætter de tilhørende aminosyrer sammen ved en kondensationsreaktion. Når to aminosyrer sammensættes, sker dette under fraspaltning af H2O under dannelse af en peptidbinding.

Hvordan isolerer man et gen, man ikke kender?

For at isolere og identificere gener, man ikke kender, er man nødt til at tage udgangspunkt i den færdigprocesserede mRNA. Det færdigprocesserede mRNA har en sekvens kun med exons, og derfor indeholder sekvensen kun den protein-kodende del. For at få sekvensen på alle gener i en organisme, oprenses mRNA fra alle de forskellige celletyper. mRNA-molekylerne oversættes til DNA vha. enzymet revers transkriptase, som bruger RNA som skabelon til at lave DNA (hvilket egentligt går imod det centrale dogme!). Dette DNA kaldes for komplementær-DNA eller kopi-DNA og skrives som cDNA, da det er komplementært til RNA. De kunstigt syntetiserede cDNA-molekyler repræsenterer alle de gener, som de forskellige celletyper producerer.