Hvad er DNA og gener?

Denne underside udgør første del af teorien for Biotech Academys materiale om Moderne genteknologi.

Genteknologi gør det muligt at ændre i generne. Men hvad er gener, og hvordan styrer de cellerne? En vigtig forklaring findes i genernes kodning som DNA og i de cellebiologiske mekanismer, der tænder og slukker for generne.

DNA og gener: Cellernes sprogkode

Alle organismer på Jorden styres biologisk af deres gener – en særlig kode bygget op i lange DNA-dobbeltstrenge.

DNA kan beskrives som et simpelt fire-bogstavsalfabet, der kan bruges til at skrive ord (generne), og DNA kan forstås ens på tværs af de forskellige livsformer, for eksempel bakterier, fugle, mennesker og svampe!

Hvorfor gener?

Hele meningen med generne er, at de skal bruges som instruktion til dannelsen af forskellige proteiner. Hvert gen koder for et protein, og det er proteinerne, der udfører de vigtige opgaver i cellerne. De omdanner stoffer, giver signaler og struktur i cellerne blandt meget andet. Det er på den måde, generne er afgørende for vores biologiske udvikling og arv. DNA er det sprog, cellerne er styret af. DNA-strengene er bygget op af blot fire forskellige nukleotider, der hedder adenin (A), thymin (T), cytosin (C) og

Figur 1. De fire forskellige baser i DNA-nukleotiderne. Adenin, cytosin og guanin bruges også i RNA, hvorimod thymin erstattes af en anden base.

guanin (G). Det er kun deres forskellige indbyrdes rækkefølger i DNA-kæden, der afgør hvilket protein, de vil kode for. I princippet kunne man tage en elefants DNA, bytte rundt på nukleotiderne og få det samme DNA som i en mus! Forskellen på nukleotiderne er de kemiske grupper kaldt baserne (figur 1).

Hver eneste celle indeholder som udgangspunkt alt det DNA, en organisme skal bruge, og det kan være store mængder! Menneskets DNA består af tre mia. nukleotider fordelt i 23 par af kromosomer. I udstrakt tilstand ville det være hele to meter langt. Kromosomernes tætte sammenrulning gør det dog muligt at rumme den store information inde i de mikroskopiske cellers kerner.

For at vise hvor et gen starter og slutter i DNA’et, bruges bestemte sekvenser af nukleotiderne. Ud over disse proteinkodende gener deltager de øvrige DNA-områder i den vigtige regulering af generne. En organismes samlede mængde gener (genom) rummer nemlig mange forskellige funktioner, der bestemt ikke er lige fordelagtige for alle dens celler hele tiden, og generne skal derfor reguleres. Det er blandt andet derfor vi ikke danner øjenpigment i tungen, selvom alle cellerne bærer de samme gener. Kræft kan også opstå, når nogle bestemte geners regulering forstyrres.

Det centrale dogme

Al den information, som ligger gemt i generne, følger en simpel vej, når den skal bruges i cellen. Denne vej kaldes biologiens centrale dogme. Dogmets regler går igen i al genetisk-baseret viden, og er derfor vigtige for at forstå molekylærbiologi. Dogmet siger at gen-informationen ligger i DNA, afskrives til mRNA og oversættes til protein, der giver selve virkningen. Men hvorfor fungerer det sådan?

Alle cellens gener er meget værdifulde og ligger derfor lagret som DNA – beskyttet i lange, dobbeltstrengede kæder af kromosomer (figur 2). Hvis gener skulle gå tabt eller ændres i en mutation, kan det nemlig betyde cellens død eller misvækst.

Cellen bruger DNA i to processer: replikation og transkription
DNA’et bliver kopieret for at have en ekstra eksakt kopi, når cellen deler sig, og kopieringsprocessen for DNA kaldes replikation.

DNA’et beskyttes så godt, at cellen ikke direkte har mulighed for at oversætte generne til de proteiner, som de bærer instruktionerne (koden) for.

DNA afskrives i stedet først i en proces, der kaldes transkription: Når et bestemt gen skal bruges i cellen, bliver der dannet nogle særlige afskrifter af genets DNA i form af enkeltstrenget mRNA. Dermed er mRNA en afskrift af de gener, der netop nu er behov for i cellen.

Hvis der eksempelvis er stort behov for et gen, er det nemt at styre ved at transkriptere meget mRNA. Det mere ustabile mRNA går nemlig hurtigt til grunde – hvilket er smart, da et bestemt behov hurtigt kan forsvinde for cellen igen. Ud over kun at have én streng, adskiller RNA sig fra DNA ved en mindre kemisk forskel i nukleotiderne. De indeholder deoxyribose i DNA og ribose i RNA. Nukleotiderne er ellers de samme som i DNA med undtagelse af basen thymin, der i RNA-koden altid erstattes af uracil (U) (figur 3 og tabel 1).

Det sidste skridt i det centrale dogmes informationsvej er at få mRNA’et oversat til det protein, som dets gen koder for og som er genets mål. Denne proteinsyntese ud fra mRNA’et kaldes også translation.

Translationen udføres af cellens ribosomer. De starter translationen i den position på mRNA’et, hvor de finder starten af et gen. Med kun ganske få undtagelser starter alle gener ved koden AUG. Dette får ribosomerne til at starte det nye protein med aminosyren methionin. Ribosomet læser nemlig hele tiden tre nukleotider ad gangen, således at næste aminosyre der indsættes i proteinkæden, afgøres af de følgende tre nukleotider efter AUG. Sådanne tre nukleotider, der læses til én aminosyre, hedder codons, og præcis hvilken aminosyre der fås af et bestemt codon, afgøres direkte af den genetiske kode (se figur 4).

Baseparring og Codons

DNA-kædernes snoede dobbelt-helix-struktur indebærer, at hver DNA-streng har en matchende (komplementær) DNA-streng siddende overfor. Dette er endnu en beskyttende foranstaltning af de værdifulde gener (se figur 5). Eksempel på læsning af den genetiske kode: Codonet CAG findes ved at finde C i venstre kolonne, A i top-rækken. Blandt de fire mulige, findes aminosyren Gln ud for G i højre kolonne. Gln er aminosyren glutamin. Som det ses koder flere codons for samme aminosyre. Dette omtales nærmere i artikel 2 Cellefabrikker.

I proteinsyntesen bygges et gens protein altså op, én aminosyre ad gangen ud fra de tilsvarende codons på mRNA-strengen. Proteiner findes i mange størrelser, og på et tidspunkt skal translationen ophøre. Det ordnes galant ved brug af et såkaldt stopcodon, der ikke koder for nogen aminosyre. Når ribosomet møder disse codons, slippes proteinet fri, og translationen er slut.

De to DNA-strenge matcher hinanden ved baseparring. Det er nemlig altid de samme nukleotider, der sidder over for hinanden, hvilket skyldes hydrogenbindinger mellem nukleotidernes baser. De komplementære nukleotider, der altid parrer, er C – G og A – T (ses af figur 5).

Kemien bag DNA

DNA er en ekstremt vigtig biologisk forbindelse, men grundlæggende er det også bare et stort kemisk molekyle sammensat af nukleotider, der jo også er molekyler. Den varierende del af de fire nukleotider kaldes basen, og i DNA-dobbelthelixen vender de ind mod midten og baseparrer med de komplementære baser på den modsatte streng ved svage hydrogenbindinger. Nukleotider indeholder desuden en phosphat-gruppe og sukkergruppen deoxyribose. Den måde, nukleotiderne samles til en streng på, betyder, at en DNA-streng i den ene ende vil have 5’-carbon-atomet fra sukkergruppen fri og i den anden ende 3′-carbon-atomet. 3′ og 5′ bruger man derfor til at referere til retningen af en DNA-streng (se figur 5). DNA er en engelsk forkortelse for deoxyribonukleinsyre. Det centrale dogme beskriver altså, hvordan generne, godt beskyttet i lange DNA-kæder, styrer vores biologiske udvikling ved at blive transkripteret til mRNA og efterfølgende oversat i translationen til protein. Når gener bliver aflæst og skaber et protein, hedder det, at genet udtrykkes. Kendskab til DNA og det centrale dogme er grundlæggende for brugen af genteknologi. Genteknologi gør det muligt at ændre i generne.

Figur 2. Det centrale dogme beskriver, hvordan DNA kopieres (replikation) eller aflæses til mRNA (transkription) for at blive oversat til protein (translation).

Figur 3. Basen uracil, der erstatter thymin i RNA.

DNA	RNA
Dobbeltstrenget	Enkeltstrenget
Deoxyribose-nukleotider	Ribose-nukleotider
Bruger thymin (T)	Bruger uracil (U)

Tabel 1. Forskelle mellem DNA og RNA.

Figur 4. Den genetiske kode

Figur 5. Den dobbeltstrengede DNA-kæde som foldes op i et kromosom. De to DNA-strenge holdes sammen af hydrogenbindinger mellem de baseparrende, komplementære nukleotider.

Da DNA forstås utroligt ens i alle organismer, gør genteknologi det muligt at flytte gener rundt mellem vidt forskellige organismer. Indsættelse af et fremmed gen i en mikroorganisme kan bruges til at skabe cellefabrikker af fx gærceller, der producerer store mængder medicinske proteiner såsom humant insulin til sukkersygepatienter. Vi ved som bekendt, hvad hver enkelt af de fire nukleotider i DNA-sekvenserne betyder for proteinernes aminosyre-sekvens (ses i den genetiske kode, figur 4), og derfor kan vi få cellefabrikker til at producere proteiner, som vi endda selv har udvalgt, optimeret og computerdesignet i håb om, at det fx resulterer i en forbedret medicinsk effekt.
Genteknologien rummer et væld af værktøjer, der gør det muligt at ændre i gener. Ud over at indsætte nye gener kan man slette udvalgte gener, som måske har uønskede eller ukendte virkninger. Ved at slette et ukendt gen i en celle, kan man studere, hvordan cellen reagerer, hvis den kan overleve uden. Dermed kan man prøve at forstå genets normale funktion i cellen.
Blandt andre kraftfulde værktøjer i genteknologien er metoden til at aflæse DNA (sekventering) og analysere det på en computer. Mikrochips kan fx bruges til hurtig og effektiv sammenligning af gener, som mistænkes for at spille en rolle i sygdomme.

Gener, proteiner og enzymer – de grundlæggende elementer i cellen

Et gen?

Et gen er en sekvens af DNA, der koder for et protein, som en form for biologisk instruktion. Genet giver derved en arvelig egenskab, da DNA’et videregives til nye celler. Gener kan påvirke deres organisme meget tydeligt, fx bestemme hvad øjenfarven bliver. Men mange gener virker dog i samspil med hinanden, og der er fx ikke ét gen, der alene dikterer, hvor høj man kan blive.
Et gen omfatter både den kodende del, der fører til proteinet, samt de omgivende regulerende områder, der hjælper med at tænde/slukke genet. Nogle særlige gener kommer ikke til udtryk som protein, fordi det som undtagelse faktisk er deres RNA-sekvens, som har den biologiske virkning. Et eksempel er de proteindannende ribosomer, som bl.a. består af store, foldede RNA-molekyler.

Et protein?

Proteiner er store, vigtige molekyler i cellerne, hvor de fx fungerer som enzymer, som signalgivere eller celleskelet. Ethvert protein er bygget op af en kombination af de 20 forskellige aminosyrer i en lang kæde. Og hver aminosyre har forskellige egenskaber, som påvirker, hvordan proteinet spiller sammen med andre molekyler i cellen, og hvordan den lange kæde af aminosyrer bliver foldet op i proteinets tredimensionelle struktur.

Et enzym?

Enzymer er proteiner, der hjælper med at udføre bestemte biokemiske reaktioner. Denne assistering af reaktionerne kaldes katalyse. Enzymer findes derfor overalt i biologien og bliver kodet for af gener præcis ligesom andre proteiner. På den måde kan et gen styre, hvad der foregår i cellen, fx hvilke stoffer cellen skal danne. Enzymer kan være meget avancerede, som fx DNA-polymerase, der kopierer DNA og samtidig kan tjekke for fejl i kopieringen for at rette dem. Fordøjelsesenzymer er en anden type af enzymer, hvis særlige evne består i at nedbryde forskellige typer af molekyler såsom fedt og kulhydrat-kæder. I cellerne findes en meget bred variation af forskellige opgaver, der afhænger af assistance fra enzymer.

Cellebiologien bag det centrale dogme

Indtil nu er de overordnede principper bag udtryk af DNA gennemgået, men hvordan håndterer cellen rent faktisk DNA’et og det mRNA og protein, der følger?

Transkriptionen

Transkriptionen er mekanismen, hvor mRNA afskrives fra de store DNA-kæder for de gener, som cellen her og nu skal bruge. Som tidligere nævnt skal dette afskrevne gen ende med dannelsen af det kodede protein.

Denne første del af vejen for udtrykket af et gen begynder i transkriptionen med, at forskellige aktiverende proteiner (transkriptionsfaktorer) binder til området lige inden selve den proteinkodende del af DNA’et. Dette bindingsområde kaldes en promoter.

Bindingen af transkriptionsfaktorer gør det muligt for enzymet RNA-polymerase at binde sig til DNA’et for at foretage selve transkriptionen. RNA-polymerase er et meget stort enzym med en form lidt som en krappeklo. Med DNA’et i ’kloen’ bevæger enzymet sig langs DNA-strengen alt imens det syntetiserer mRNA-kæden ud fra DNA-sekvensen ved at bruge reglen om baseparring og komplementære

nukleotider (se figur 6). Det vil altså sige, at et G på DNA-strengen fører til et C på mRNA’et. Da U som tidligere nævnt bruges i stedet for T i RNA, fører et A på DNA’et til et U på den nye mRNA-streng. Bakteriers RNA-polymerase kan transkriptere med en hastighed på omkring 2000 nukleotider i minuttet, og transkriptionen forløber, indtil enzymet møder en særlig terminator-sekvens, hvorefter mRNA-strengen frigives.

Figur 6. Transkription, hvor RNA-polymerase syntetitserer en mRNA-streng (lilla) ud fra de komplementære nukleotider i DNA’et.

Ekstra baggrund: Splicing af introns – nødvendigt i eukaryote celler

Selvom transkriptionen er utrolig ens i alle levende organismer, er der nogle grundlæggende forskelle på de to forskellige celletyper: prokaryote og de mere avancerede eukaryote celler.

Eukaryote celler har cellekerner, der indeholder cellens DNA og dermed det nytranskripterede mRNA. Inden mRNA’et derfor skal passere cellekernen ud til ribosomerne i cytoplasmaet, får det bl.a. tilføjet en poly(A)-hale, der består af en lang række adenin-nukleotider (A), som er med til at forlænge mRNA’ets levetid.

Eukaryot DNA indeholder også nogle sekvenser, der kaldes introner. De ligger spredt og kan fx ligge midt i en proteinkodende sekvens og bliver derfor transkripteret med i mRNA’et. Introner skal klippes (splices) ud af mRNA’et, inden det kan translateres rigtigt til protein i ribosomerne. Disse processer er ikke nødvendige i prokaryote celler, da de hverken har cellekerner, som mRNA’et skal passere, eller introner, der skal splices ud.

Translationen

Translationen er den næste del af proteinsyntesen. Her oversættes mRNA’ets codons til deres tilhørende aminosyrer, som bliver bygget ind i aminosyrekæden. Aminosyrekæden udgør til sidst det endelige protein. Translationen er en nøje afstemt biologisk proces, som kan forløbe med en hastighed på op til ca. 15 aminosyrer i sekundet.

Translationen begynder på mRNA-stengen ved startcodonet AUG, som har den tilhørende aminosyre methionin (Met). Translationen hjælpes af et stort molekyle, der kaldes et ribosom. Ribosomet vil ofte først binde til et ribosombindingsted på mRNA-strengen, som ligger inden startcodonet (figur 7). Efter ribosomet har oversat start-codonet til methionin, vil det fortsætte til det næste codon på mRNA’et, så den næste aminosyre kan sættes på proteinet.

Hver af de tyve aminosyrer, der kan bruges i proteiner, bliver ’ladet’ (placeret) på en særlig type RNA, der kaldes tRNA (transfer-RNA). Denne påsættelse kaldes aminoacylering. tRNA’et er det molekyle, der afleverer den rigtige aminosyre, som et codon koder for i translationen. Hjulpet af ribosomet binder tRNA til det passende codon på mRNA’et, fordi det selv har et såkaldt anticodon, som består af de tre komplementære nukleotider til codonet (se figur 7). Her afleverer tRNA nu sin aminosyre til det protein, der dannes.

Figur 7. Translationen hvor protein dannes fra mRNA. tRNA baseparrer til det næste ledige codon på mRNA-strengen. tRNA’et indsætter dermed den passende aminosyre i den voksende aminosyrekæde, der bliver det nye protein.

Videoanimation af transkription og translation

Denne animationen viser først transkription fra den røde DNA-streng. Læg mest mærke til de overordnede principper og hvor fortryllende stærkt, det går! Det er i real-time.

Den gule streng, der dannes, er mRNA’et. Til sidst ses translation, hvor det blå ribosomkompleks danner proteinet (rødt). Engelsk tale

Replikationen

Replikation er måden, hvorpå cellen laver en kopi af sit DNA før en celledeling. Når replikationen af en DNA-dobbeltstreng skal til at starte, sørger enzymet helicase først for, at der er arbejdsrum. Helicase adskiller nemlig det dobbeltstrengede DNA til enkeltstrenge i et område, som kaldes replikationsboblen.

Replikationen sker ved, at DNA-polymerasen katalyserer baseparring af nukleotider og sammensætter disse i en kæde. Derfor vil hver eksisterende DNA-streng få opbygget en helt ny komplementær streng over for sig (se figur 8). Resultatet af replikationen er altså, at én dobbeltstreng bliver til to dobbeltstrenge, der hver har én af de oprindelige strenge.

DNA-polymerase kan ikke selv binde sig til DNA’et for at danne den nye DNA-streng; det er nemlig kun ekspert i at bygge videre på en eksisterende streng. Et andet enzym, primase, er derfor nødt til at danne en indledende komplementær sekvens, som kaldes en primer. Disse korte primere dannes med RNA-nukleotider og skal derfor senere også omdannes til DNA (se røde kugler, figur 8).

Ligesom RNA dannes de nye DNA-strenge ved at tilføje ét nyt nukleotid ad gangen og danne en binding mellem 5’-enden til 3’-enden på det nye nukleotid. Men da der er to modsatrettede strenge, betyder det, at de to DNA-polymeraser må bevæge sig i hver sin retning! De to strenges replikation følger hinanden i samme replikationsboble, men boblens bevægelse vil kun kunne gå i samme retning som én af strengene (kaldes leading strand). Derfor må den modsatte af strengene (lagging strand) dannes i små bidder, der følger med replikationsboblen. Disse mindre stykker kaldes Okazaki-fragmenter (se figur 8).

Især vigtigt at huske:

Figur 8. Replikation af de to modsatrettede DNA-strenge, som resulterer i en kopiering af DNA’et. De nye DNA-strenge (rødlig) startes fra primerne (røde kugler) og syntetiseres af DNA-polymerase i retningen 5′ til 3′.

Det centrale dogme inden for biologien beskriver den genetiske informationsvej, som alle organismer følger. Generne er kodet som DNA og afskrives efter behov til RNA i transkriptionen. mRNA oversættes i translationen til det protein, som genet koder for. Proteiner deltager i næsten alle vigtige processer i cellerne.
DNA er dobbeltstrenget og består af fire forskellige nukleotider, der forkortes A, T, G og C. De baseparrer som A-T og C-G.
mRNA er en enkeltstrenget afskrift af gener, som cellen har behov for. mRNA består af nukleotiderne A, U, G og C.
Genteknologi gør det bl.a. muligt at ændre DNA og dermed både at slette gener og at indsætte nye eller ændrede gener.