• Mennesket på en DNA-mikrochip

    Velkommen til projektet Mennesket på en DNA-mikrochip, som omhandler kræftudvikling og giver en forståelse for noget af den relevante statistik som bruges i kræftforskningen. Projektet er udarbejdet af Simmi Gehani og Andreas Laustsen i samarbejde med Novo Nordisk A/S og Institut for Systembiologi på DTU, og vi håber, at du efter projektet vil have fået en indføring i emnet kræft og have tilegnet dig basale matematiske værktøjer inden for statistik. Projektet er opbygget i en teoridel og en øvelsesdel, hvori du finder teori om kræft, mikrochips og statistik henholdsvis øvelser omkring disse emner. Til projektet er der desuden udarbejdet ekstra materiale, som med fordel kan benyttes, såfremt man ønsker at beskæftige sig mere med emnerne. I dette ekstra materiale findes også en perspektiverende artikel om den nyeste teori inden for kræftforskning – Kræftstamcelleteorien.

    For at navigere i projektet kan menuen til venstre bruges eller oversigten nedenfor.

     

    Projektoversigt

    Teori

    Øvelser

    Ekstra materiale

    Rigtig god fornøjelse med projektet!

  • Teori

    Her under teoriafsnittet finder du fem forskellige artikler om kræftudvikling, DNA mikrochips og statistik. Artiklerne kan læses uafhængigt af hinanden, men såfremt du ønsker at læse alle artiklerne, anbefales det at tage dem i den angivne rækkefølge, eftersom de tre første artikler giver en indføring i emnet kræft, mens de næste to er af mere teknisk karakter og vil muligvis være mere spændende at læse, hvis der haves en forhåndsviden om kræft. I ekstramaterialet findes 3 ekstra artikler. De to første omhandler de forskellige typer kræft, der kan opstå i menneskekroppen og hvordan man oprenser RNA. Den sidste artikel er af mere perspektiverende karakter, idet denne beskriver en af de nyeste teorier inden for kræftudvikling.

    1. Det centrale dogme
    2. Biologiske mekanismer i kræft
    3. Gener involveret i kræft
    4. Mikrochipteknologi
    5. Statistik i biologien

    Rigtig god fornøjelse med den teoretiske del af materialet!

    Klik her for t-tabel. (Tabellen kan benyttes til t-tests).

    Hvad er statistik, og hvorfor er det overhovedet relevant i biologien? Det korte svar kunne være, at det er en matematisk genvej til at spare tid og penge i forbindelse med f.eks. laboratorieforsøg. Men statistik kan også benyttes til at verificere resultater, således at man kan bevise en sammenhæng og konkludere, at resultaterne ikke bare er en tilfældighed. Kort sagt ville det meste videnskabelige arbejde (og meget andet arbejde) være stærkt hindret, hvis det ikke kunne bevise noget, eller hvis det ikke kunne foretage rationelle vurderinger om, hvor ens tid og penge skulle sættes ind for at opfinde ny viden. Det er her statistikken bliver en hjælp.

    I denne korte artikel vil statistik blive præsenteret som fagdisciplin og relateret til biologien og forsøgsarbejdet i projektet Mennesket på en DNA-mikrochip. Specielt vil t-test blive gennemgået, som er af stor værdi for analysen af DNA-mikrochipeksperimenter. Statistik kan opdeles i flere forskellige kategorier, men er generelt en fagdisciplin under den anvendte matematik. I denne artikel benyttes to overordnede kategorier til inddelingen af den statistiske teori, nemlig den deskriptive statistik og statistisk inferens.

     

    Den deskriptive statistik

    Deskriptiv statistik dækker over den del af statistikken, der benyttes til at beskrive (engelsk: describe) data. Dette kan f.eks. være gennemsnit, største- og mindsteværdier og variation. I det følgende vil flere af de mest essentielle begreber blive defineret og beskrevet kort. Flere af disse  begreber benyttes i statistisk inferens.

    Gennemsnit

    Det måske vigtigste nøgletal, der kan udregnes af en mængde data er gennemsnittet (også kaldt middelværdien). Dette tal kan f.eks. beskrive to fodboldspilleres præstationer og fortælle, at en spiller, der har scoret 10 mål i 13 kampe, scorer oftere end en spiller, der har scoret 30 mål i 500 kampe (selvom den sidstnævnte har scoret flest). Den konkrete matematiske formel for gennemsnittet er angivet herunder.

    Gennemsnit – (1.1)

    I ovenstående udtryk er der tre udgaver af samme formel, som kan benyttes til at beregne et gennemsnit. I korthed fortæller den første formel, at gennemsnittet, μ, beregnes ved at lægge alle data (xi) sammen og dele med antallet af data (n). Summationstegnet angiver, at summen af alle værdier (fra værdi nr. 1 frem til n) skal lægges sammen. Dette skrives ved, at i går fra 1 (dvs. første dataværdi) til n (dvs. n’te dataværdi). Alternativt kan den første formel også skrives som den midterste. Summationstegnet er således en forkortet skrivemåde. Den tredje formel benytter sig imidlertid af frekvensen, f(xi), for de forskellige dataværdier (dvs. hvor ofte en given dataværdi optræder). Frekvensen er defineret som:

    Hvor ni er antallet af gange en given værdi optræder ud af det totale antal værdier i et datasæt, ntotal.

    Median

    En anden værdi, som minder om gennemsnittet, er medianen. Medianen angiver det midterste tal i en sorteret talrække. F.eks. er medianen af tallene 1, 4 og 7 lig med 4. Følgende korte eksempel viser, hvordan medianer findes:

    Eksempel 1 – Median

    Data: 2   4   6   7   8   9   11                     Median = 7

     

    Hvis der er et lige antal dataværdier, så er medianen gennemsnittet af de to midterste værdier, som eksemplificeret nedenfor:

    Eksempel 2 – Median

    Data: 2   4   6   7   8   9                         Median = 6,5

     

    Men hvad kan medianen fortælle, når man ligeså godt kan beregne gennemsnittet (median og gennemsnit ligger ofte tæt på hinanden)? Medianen er mere stabil over for ekstreme værdier, hvorfor medianen kan være en fordel at beregne i tilfælde med såkaldte ”outliers” (dataværdier som helt tydeligvis er usandsynlige i eksperimenter). Fordelen ved medianen kan illustreres ved følgende eksempel, hvor en ekspedient har noteret prisen for en liter mælk i ni dage:

    Eksempel 3 – Median vs. Gennemsnit

    Data:  5   6   5   6   7   8   6   5   99999 (enhed: kr.)

    Gennemsnit, μ  = 11116,33 kr.

    Median             = 6 kr.

     

    I dette tilfælde, hvor ekspedienten tydeligvis har tastet forkert (eller læst en forkert pris) blev gennemsnittet stærkt påvirket (og størrelsen af gennemsnittet er ubrugelig), mens medianen ikke ville have ændret sig – uanset størrelsen af den niende værdi.

    Varians

    En anden vigtig faktor i den deskriptive statistik er variationen. Som det kan ses i eksempel 3 kan en stor variation i datasættet (den højeste værdi var 99999 kr. og laveste 5 kr.) føre til en  ubrugelig værdi for gennemsnittet (ingen priser var i nærheden af 11116,33 kr.). Til at beskrive variationen i datasættet beregnes variansen af datasættet. Formlen for varians er angivet herunder:

    Varians – (1.2)

    Variansen σ2 beregnes som beskrevet: Først findes forskellen på hver enkelt dataværdi (xi) og gennemsnittet (μ), og denne forskel kvadreres. Derefter lægges alle disse (xi– μ)2-værdier sammen, og denne sum divideres med (n – 1), som er antallet af dataværdier minus 1. Den sidste udgave af formlen for varians benytter sig af frekvensen for dataværdierne. Denne udgave kan ofte være mere brugbar, hvis der haves en stor datamængde, men såfremt antallet af dataværdier er mindre end 20 bør denne formel ikke benyttes, da den leder frem til et andet resultat. Dette skyldes, at denne formel benytter sig af frekvens (hvor der divideres med n, og ikke (n – 1) som egentligt er korrekt).

    Variansen kan forstås som den gennemsnitlige kvadratiske afvigelse på alle dataværdierne. Årsagen til, at forskellene kvadreres, er, at negative afvigelser og positive afvigelse ikke må gå ud med hinanden. Effekten af dette kan ses i eksempel 4. Årsagen til at der divideres med (n – 1) og ikke n, er rent matematisk, at det ikke er antallet af værdier, men antallet af frihedsgrader, der skal divideres med. Dette gør næsten ingen forskel, når n er tilstrækkelig stor, men vil have større betydning for små n. Antallet af frihedsgrader vil ikke blive uddybet i denne artikel, men det bør noteres, at denne værdi (ofte kaldet v) benyttes i de fleste statistiske sammenhænge af årsager, som ligger uden for denne artikels formål at beskrive.

     

    Eksempel 4 – Varians

    Data: 2   3   5   6

    Gennemsnit, μ = 4

    Hvis ikke forskellene, (xi– μ), havde været sat i anden potens, ville regnestykket have set således ud:

    Dette ville fejlagtigt have givet det indtryk, at der ingen variation er i datasættet

    Standardafvigelse

    Standardafvigelsen, σ, er tæt beslægtet med variansen, idet standardafvigelsen netop er kvadratroden af variansen (variansen er standardafvigelsen i anden potens, σ2). Formlen for standardafvigelsen kan ses til venstre:

    Igen bemærkes det, at den sidste formel kun bør benyttes, såfremt man har mere end 20 dataværdier. Standardafvigelsen er ofte angivet i stedet for variansen af datasættet. Et eksempel på, hvordan standardafvigelsen beregnes kan ses i eksempel 5.

    Standardafvigelse – (1.3)

    Eksempel 5 – Standardafvigelse

    Data: 2   6   9   11

    Gennemsnit, μ  = 7

    Statistiske plots

    For at visualisere data findes der et hav af forskellige typer af plots og diagrammer. I denne artikel vil to af disse plots blive beskrevet – nemlig boksplottet (boks-plottet) og histogrammet.

    Boksplot

    Et boksplot afbilder data på en sådan måde, at området mellem 1. kvartil og 3. kvartil er et rektangel, 2. kvartil (medianen) en streg beliggende i dette rektangel, og fra rektanglet udgår en linje ud til både største- og mindsteværdien. To eksempler på et boksplot kan ses  figur 1.

    Boksplottets funktion er at skabe et hurtigt overblik over omfanget af et datasæt og angive beliggenheden af de forskellige kvartiler for at give en idé om, hvorvidt data primært er samlet omkring medianen, eller om data ligger spredt mere ud over hele skalaen. Undertiden hvis datamængden er meget stor vil de linier, der udgår fra rektanglet ikke gå ud til hhv. største- og mindsteværdi, men derimod til 5’te procentilen og 95’te procentilen.

    Figur 1. Boksplots af to forskellige datasæt. Et boksplot afbilder data, således at både mindsteværdi, størsteværdi, median samt 1. og 3. kvartil kan aflæses.

    Histogram

    Et histogram er en anden og meget typisk måde af afbilde data på. I et histogram inddeles data i forskellige intervaller af tal såsom [1;3[, [3;5[ osv. (fra og med 1 til 3, hvor værdien 3 først er med i det næste interval, fra og med 3 til 5, osv.). Antallet af observationer inden for disse intervaller angives. Ved afbildning af intervaller vil det midterste tal i intervallet ofte være angivet på x-aksen i histogrammet og bredden af søjlerne svarer til intervallernes bredde. Antallet af observationer eller frekvensen i et givent interval vil kunne aflæses på y-aksen. Et eksempel på et histogram kan ses i figur 2, hvor intervallerne er [131;133[med midterværdien 132, [133;135[ med midterværdien 134 osv.

     

    Statitisk inferens

    Indtil nu i artiklen har det handlet om deskriptiv statistik. Dvs. at statistikken har været brugt til at beskrive data, uden at denne beskrivelse har kunnet føre frem til konklusioner omkring udfald af nye forsøg.

    Figur 2. Histogram over antallet af observationer for forskellige intervaller. Midterværdien i intervallerne ses på x-aksen, og intervallernes bredde er 2. Antallet af observationer i hver interval aflæses på y-aksen.

    Statistisk inferens betegner metoder til at konkludere og fastsætte generelle tendenser og kvantitative egenskaber ud fra stikprøvetagning. Som beskrevet i indledningen til artiklen ligger betydningen af statistikken netop i at kunne forudsige- og fastsætte værdier og planlægge forsøg, f.eks. stikprøvetagning, på en økonomisk fordelagtig måde.

    Det ville f.eks. være uoverskueligt dyrt for en avis i en meningsmåling at udspørge alle danskere om deres politiske holdning. Derfor undlader alle aviser dette ved at tage repræsentative stikprøver i befolkningen. Herved kan de med en eller anden grad af konfidens (f.eks. med 95 % sikkerhed) lave en meningsmåling ud fra et par tusind danskere. Men hvordan tager man en repræsentativ stikprøve, altså en stikprøve, der repræsenterer befolkningen? Dette er altid en udfordring for de folk, der skal foretage en statistisk undersøgelse. En metode til at udtrække en tilfældig stikprøve i befolkningen kunne være at give alle danskere et nummer fra 1 til 5,4 mio. (befolkningstallet) og så udtrække helt tilfældige numre i denne række. Hvis man ville undersøge kornet fra en mark kunne man flyve højt op over marken og kaste nogle hulahopringe tilfældigt ud og så undersøge (tage målinger af) det korn, som var inden for de forskellige ringe. En dårlig måde at foretage en tilfældig stikprøveudvælgelse kunne f.eks. være at spørge alle gymnasieelever om deres politiske holdning og ud fra denne stikprøve udtale sig om hele befolkningen. Dette ville højst sandsynligt give et skævt billede, da alle gymnasieelever er i ca. samme aldersgruppe og alle har prioriteret deres uddannelse frem for arbejde.

    En anden fejlagtig metode, som blev brugt i USA i starten af 1900-tallet var at ringe rundt og spørge, hvem folk stemte på til næste præsidentvalg. Da det kun var de rigeste, der havde råd til en telefon, gav dette også et helt forkert indtryk af den politiske situation. Den kandidat, som ifølge meningsmålinger klart ville vinde, tabte stort ved selve valget. Nu om dage ville en telefonrundspørge dog næppe være helt så fejlbehæftet.

    Når man har taget en repræsentativ stikprøve, skal det ud fra statistiske tests vurderes, hvor overbevisende resultatet fra forsøget er. En typisk metode at gøre dette på er hypotesetests. Her defineres to hypoteser, som oftest kaldes nulhypotesen, H0, og den alternative hypotese, H1. Oftest vil den alternative hypotese være det, man ønsker at vise. Og for at vise denne må man forkaste nulhypotesen (vise at denne ikke kan gælde). F.eks. kunne nulhypotesen være, at et gennemsnit er lig med 3, og den alternative hypotese, at gennemsnittet ikke er 3. Hvis man således kan forkaste/afvise nulhypotesen, har man vist, at den alternative hypotese med stor sandsynlighed gælder.

    t-test for ét gennemsnit

    En klassisk metode til at foretage en hypotesetest er den såkaldte t-test. Denne metode benyttes typisk til test af et gennemsnit ved en stikprøvetagning. t-testen gælder kun, når det kan antages, at det datamateriale, der skal undersøges, er normalfordelt. Normalfordelingen gælder f.eks. for vægten af mandlige studerende, den præcise vægt af 100 gram slikposer og højden af 25-årige kvinder. Men den gælder ikke, hvis data fra forskellige stærkt inhomogene grupper er blandet sammen, f.eks. vægten af blåhvaler og mandlige studerende. Her vil data på ingen måde være normalfordelte. Det er desuden vigtigt at bemærke, at det ikke nødvendigvis er den stikprøve, man har taget, som i sig selv skal være normalfordelt. Derimod er det den samlede mængde data, som stikprøven tages fra, som skal være normalfordelt. Dette vil f.eks. sige, at en stikprøve bestående er fire højder af tilfældige mandlige studerende ikke behøver at være normalfordelt i sig selv, men derimod, at samtlige højder af alle mandlige studerende (i hele Danmark) skal være normalfordelt, for at man kan foretage en t-test på datamaterialet (f.eks. de fire højder). Normalfordelinger vil ikke blive beskrevet nærmere i denne artikel, men på figur 3 kan typiske normalfordelingskurver ses. Det fremgår, at disse er symmetriske med toppunkt i gennemsnitsværdien, μ. Desuden bør det bemærkes, at variansen eller standardafvigelsen ofte er angivet på sådanne kurver, eftersom 95,4 % af data i en normalfordelingskurve ligger i intervallet μ ± 2σ, også skrevet [μ – 2σ; μ + 2σ].

    Figur 3Forskellige normalfordelingskurver.

    Hvis det kan antages, at data er normalfordelte, skal nulhypotesen og den alternative hypotese defineres, inden der foretages beregninger. Typisk vil dette kunne skrives således:

    Nulhypotese:                    μ = μ0

    Alternativ hypotese:          μ ≠ μ0

                         Eller:          μ < μ0

                         Eller:          μ > μ0

    De to ”eller” betyder, at man enten kan undersøge, om det faktiske gennemsnit er forskelligt fra, mindre end eller større end det gennemsnit, som nulhypotesen er defineret til. Herefter foretages beregningerne. Formlen, der benyttes til en t-test, er angivet herunder:

    t-test for ét gennemsnit – (3.1)

    Antal frihedgrader: v = n – 1

    I denne formel betegner n størrelsen af stikprøven, X betegner gennemsnittet på stikprøven (i modsætning til μ, der betegner det ”sande” gennemsnit for samtlige dataværdier, som ikke nødvendigvis er med i ens stikprøve), μ0 betegner det gennemsnit, der er defineret i nulhypotesen, S betegner standardafvigelsen for stikprøven (i modsætning til σ, som er standardafvigelsen for alle dataværdier, som ikke nødvendigvis er med i stikprøven), og t er den parameter, der beregnes. Antallet af frihedsgrader, v, benyttes i forbindelse med opslag i t-tabel og vil blive beskrevet senere.

    En sidste parameter, der skal defineres, er α. Denne parameter angiver graden af usikkerhed for den endelige konklusion (f.eks. hvis α = 0,05, kan man konkludere noget med 95 % sikkerhed eller 5 % usikkerhed). Når denne parameter er defineret (α skal ligge mellem 0 og 1, også skrevet mellem 0 og 100 %), foretages beregningerne, og ud fra følgende skema foretages konklusionen:

                     t-test for ét gennemsnit
      Alternativ hypotese H1       Forkast hvis H0

    μ < μ0

    t < –tα

     

     

    μ > μ0

     

     

    t > tα

     

     

    μ ≠ μ0

     

     

    t < –tα/2

    Eller t > tα/2

     

     

    tα-værdierne benyttes til at afgøre t-testens udfald, og disse findes ved opslag i en t-tabel. Oftest vil der i tabellerne kun være tα-værdier for udvalgte α og for udvalgte v (antal frihedsgrader). Derfor er man tit nødt til at finde den tætteste, brugbare værdi. I eksempel 7 udføres en t-test på en stikprøve.

     

    t-test for to gennemsnit

    Nogle gange er det nok kun at foretage en t-test for ét gennemsnit, men ofte er meningen med beregningen at påvise en forskel på to grupper (populationer). F.eks. i biologien kan det i forbindelse med DNA-mikroarrays være relevant at kunne påvise, at der rent faktisk er en forskel på en gruppe celler og en anden (f.eks. en gruppe raske celler og en gruppe kræftceller) ved målinger på en given celleparameter (f.eks. udtrykkelsen af et protein). Til dette formål kan en t-test for to gennemsnit benyttes. Ligesom før skal data (for begge grupper) være normalfordelte, og der skal defineres en nulhypotese og en alternativ hypotese. Typisk ønskes det vist, at to gennemsnit er forskellige. Nulhypotesen vil derfor være, at de to gennemsnit er ens, og den alternative hypotese at de er forskellige:

    Nulhypotese:                    μ– μ2 = 0

    Alternativ hypotese:          μ1 – μ2 ≠ 0

                         Eller:          μ1 – μ2 < 0

                         Eller:          μ1 – μ2 > 0

    Igen er der flere muligheder for den alternative hypotese. Konklusionen foretages på baggrund af et lignende skema som før, efter at en α-værdi er blevet valgt.

        Alternativ hypotese H1            Forkast hvis H0            

    μ1 – μ2 < 0

     

     

    t < –tα

     

     

    μ1 – μ2 > 0

     

     

    t > tα

     

     

    μ1 – μ2 ≠ 0

     

     

    t < –tα/2

    Eller t > tα/2

     

     

    tα-værdierne benyttes igen til at afgøre t-testens udfald. Disse tα-værdier findes igen ved opslag i en t-tabel. Formlen, der benyttes til en t-test for to gennemsnit, er angivet herunder:

    t-test for to gennemsnit – (3.2)

    Antal frihedgrader: v = n1 + n2 – 2

     

    I denne formel betegner n1 og n2 størrelsen af stikprøven fra hhv. population 1 og population 2, X1 og X2 betegner gennemsnittet på stikprøven fra hhv. population 1 og population 2. Sp  betegner den poolede standardafvigelse (den ”fælles” standardafvigelse, som er en slags gennemsnitlig standardafvigelse for stikprøverne). Den beregnes efter ovenstående formel ud fra S1 og S2, som er standardafvigelsen for stikprøven for hhv. population 1 og population 2. Igen er t den parameter, der bestemmes. Bemærk, at antallet af frihedsgrader nu beregnes efter en ny formel. Et eksempel på hvordan en t-test for to gennemsnit benyttes, er givet i eksempel 8.

     

    Konfidensinterval

    Et sidste statistisk begreb, der vil blive præsenteret i denne artikel, er konfidens-intervallet. Konfidensintervallet benyttes til at udtrykke, at et gennemsnit for nogle data med en given sikkerhed ligger inden for et interval (f.eks. at gennemsnittet for antallet af æbler på et æbletræ med 90 % sandsynlighed ligger mellem 100 og 200). Til at lave et konfidensinterval benyttes mange af de samme parametre som ved t-test, og ofte laves der et konfidensinterval efter en t-test er udført. Formlen for konstruktionen af et konfidensinterval er givet ved:

    Konfidensinterval – (3.3)

     

    Antal frihedsgrader: v = n – 1

    Her betegner n  størrelsen af stikprøven, X betegner gennemsnittet på stikprøven, μ betegner hele populationens gennemsnit, S betegner standardafvigelsen for stikprøven, og tα/2 er en t-parameter, der slås op i en t-tabel ud fra valg af α og antallet af frihedsgrader. Et eksempel på, hvordan et konfidensinterval beregnes, er givet i eksempel 9.

    En vigtig pointe ved konfidensintervaller er, at når et sådant interval er beregnet, kan man udelukke alle værdier, som ikke indgår i intervallet med den givne procents sikkerhed. Dvs. hvis man startede med at udregne konfidensintervallet fra eksempel 9, kunne man hurtigt konkludere, at gennemsnittet for hele populationen med 95 % sikkerhed ikke er 10 (som det blev vist i eksempel 7). Det kan derfor være en stor fordel at udregne et konfidensinterval for et gennemsnit, når man har taget en stikprøve. Man kan så, uden at skulle lave mange t-tests, hurtigt afvise alle værdier, der ikke ligger inden for intervallet.

    For sammenligning af to gennemsnit kan et konfidensinterval også benyttes. I dette tilfælde er konfidensintervallet givet ved følgende formel:

    Konfidensinterval for forskellen på to gennemsnit – (3.4)

    Antal frihedsgrader: v = n1 + n2 – 2

    I denne formel betegner n1 og n2 størrelsen af stikprøven fra hhv. population 1 og population 2, X1 og X2 betegner gennemsnittet på stikprøven fra hhv. population 1 og population 2. Sp betegner den poolede standardafvigelse. Den beregnes efter ovenstående formel ud fra S1 og S2, som er standardafvigelsen for stikprøven for hhv. population 1 og population 2. Størrelsen tα/2 er en t-parameter, der slås op i en t-tabel ud fra valg af α og antallet af frihedsgrader. I eksempel 10 kan det ses, hvordan et konfidensinterval for forskellen på to gennemsnit kunne have været benyttet til nå til samme konklusion som i eksempel 8.

     

    Relation til biologien

    Statistik benyttes som redskab i mange fag. I biologien  benyttes statistik specielt i forbindelse med udvikling af lægemidler, fastsættelse af biologiske parametre ud fra eksperimenter og sandsynliggørelse af biokemiske teorier. Bl.a. er statistik en fuldstændig nødvendighed for gennemførelsen af målinger med DNA-mikroarrays, hvor der typisk køres forsøg med forskellige typer celler. Da det er umuligt at teste alle kræftceller i en bestemt kræftsygdom i et DNA-mikroarray, endsige bare i en enkelt tumor, er det nødvendigt at kunne gennemføre pålidelige forsøg, som kan generalisere udfaldet af få eksperimenter til teorier og hypoteser omkring kræftudvikling og kræftbekæmpelse. Hertil bidrager statistikken, ved at den med en vis procents sikkerhed kan estimere værdien af en parameter (ofte inden for et konfidensinterval) ud fra stikprøver af hele cellepopulationer. I forbindelse med biologiske forsøg accepteres det generelt, at konklusionerne på forsøgene kun er 95 % sikre (f.eks. i en t-test med α-værdi på 5 %, eller et konfidensinterval på 95 %), men undertiden i strenge medicinske forsøg kan kravene til sikkerhed være endnu højere (ofte 99 % sikkerhed). Det er naturligvis altid sværere at påvise en sammenhæng eller estimere en værdi, hvis kravene til sikkerheden i resultatet forøges. Derfor er det normalt at kræve, at ens resultat er mellem 95 % og 99 % sikkert. Dette krav giver et relativt pålideligt resultat, samtidig med at denne afvigelse fra 100 % sikkerhed giver en enorm tidsbesparelse. En mindre stikprøve på nogle tusind kræftceller vil ofte være nok (såfremt stikprøven er repræsentativ!) til f.eks. at vurdere med 95 % sikkerhed, om kræftcellerne har en højere produktion af et givent protein ift. raske celler. Dette må mildt sagt siges at være lettere end at teste samtlige celler i en menneskekrop.

    Til sidst bør det siges, at statistikken også har sine faldgruber. Ofte vil man gerne vise sammen-hænge (statistisk kaldt: at korrelere forsøgsresultater), men det kan undertiden være muligt at se statistiske sammenhænge mellem fænomener, som ikke er beslægtede. Det er f.eks. sandsynligt, at der ville kunne ses en sammenhæng mellem hudkræft og havbadning. Dette skyldes selvfølgelig ikke, at det at bade i havet er kræftfremkaldende. Derimod kunne det skyldes, at de personer, som bader i havet, sandsynligvis også er personer, som befinder sig meget i solen, og som derfor modtager en stråling, der kan være årsag til kræftudvikling. Det er derfor altid vigtigt nøje at overveje de sammenhænge og resultater, man vil prøve at vise, og være kritisk i ens analyse.

    Af Simmi Gehani

    Denne artikel skal give en kort introduktion til nogle emner og essentielle begreber inden for kræftbiologien. Den første del vil handle om, hvordan en kræftcelle adskiller sig fra en normal celle. Den sidste del vil beskrive, hvordan og hvorfor DNA muterer og kort behandle DNA-reparation. Den efterfølgende artikel vil handle om nogle af de gener, der er involveret i kræft. Det kan anbefales at kende til DNA’s opbygning, gener samt det centrale dogme for at få en bedre forståelse af denne artikel.

     

    Hvorfor opstår kræft?

    Kræft er en sygdom, som de fleste kender. Det er en sygdom, som har fået stor opmærksomhed, idet den er en af de mest hyppige sygdomsformer. Kræft kan opstå, når cellens DNA er blevet beskadiget. Hvis DNA-skaden ikke kan repareres af det menneskelige DNA-reparationssystem, giver det mutationer, der kan ændre sekvensen i det gen, hvor skaden er opstået. Kræft kan også opstå, hvis de proteiner, der normalt styrer reguleringen af gener, har ændret sig.  En kræftcelle er en normal celle, hvor enkelte gener i cellen er reguleret anderledes end normalt. Ændringer i aktiviteten af bestemte gener og mængden af genet, der kommer til udtryk, den såkaldte gen-ekspression, kan ændre cellen, så den får en kræftcelles karakteristika. Et af de klassiske karakteristika, som en kræftcelle har, er dens specielle evne til at gennemgå celledeling uhindret.

    Mutationer opstår af flere årsager, som vil blive beskrevet senere i afsnittet. Nogle mutationer har ingen betydning for cellens funktion, mens andre kan have helt katastrofale konsekvenser. I en normal levetid vil et menneske gennemgå ca. 1016 celledelinger. Selv i et miljø, der er frit for ydre skadelige påvirkninger, ville et menneske spontant pådrage sig 1010 mutationer gennem et helt liv pga. fejl i reparationen. Fra dette perspektiv er spørgsmålet ikke længere ”hvorfor opstår kræft?”, men nærmere ”hvorfor opstår kræft så sjældent?”

    Hvordan er kræft relateret til ligevægten mellem celledød og cellevækst?

    For at kunne forstå kræft, er det nødvendigt at vide, hvordan vores celler fungerer. Da en kræftcelle udvikles fra en normal celle, er det nødvendigt at kende funktionen af kroppens normale celler, for at indse, hvordan kræftceller adskiller sig.

    Under opvæksten er cellevækst nødvendigt for, at barnet kan vokse. Men også et voksent menneske har behov for cellevækst, da kroppens celler har en begrænset levetid. For at opretholde funktionsdygtige organer må der være en ligevægt mellem celledød og cellevækst.

     

    Cellernes funktion i kroppen

    Der findes ca. 200 forskellige celletyper, som hver har deres særlige funktion. Af eksempler kan nævnes hudceller, leverceller og immunceller. En bestemt type celle kan yderligere have forskellige underkategorier af celler. F.eks. udøver B-celler og T-celler forskellige funktioner i immunsystemet, men de er begge kategoriseret som immunceller.

    De forskellige typer af kroppens fuldtudviklede celler har en given levetid. Når cellerne dør, vil de fleste celletyper gendannes, således at antallet af en specifik celletype forbliver konstant. Nye celler dannes ved, at en celle kopierer sit DNA og efterfølgende deles for at blive til to identiske celler som illustreret i figur 1. En celle der opstår fra en anden celle og er identisk med denne, kaldes en klon. Hvor ofte en celle deler sig, er afhængig af celletypen. Hjerteceller menes ikke at dele sig efter fødslen. Leverceller deler sig normalt ikke, men kan gøre det, såfremt der opstår et behov. Leverceller er bl.a. med til at regulere makromolekyler i blodet, fjerne giftstoffer fra blodet, opbevare nogle typer af vitaminer og producere det blodfortyndende stof heparin. Visse typer af hudceller gennemgår celledeling hele tiden.

    Nogle af kroppens celler bliver let beskadiget eller slidt, og der er derfor brug for en konstant udskiftning eller nydannelse af celler. Miljøet i kroppen er meget dynamisk, og når celler hele tiden udskiftes, er der en vis sandsynlighed for, at noget kan gå galt under celledelingen – fx kan der opstå fejl i gensekvensen.

    Figur 1. Celledeling er en del af cellecyklus. Efter DNA-kopieringen sendes cellen med nu dobbelt så meget DNA ind i den normale celledeling, mitosen. I mitosen vokser cellen og de to identiske DNA-sæt separeres vha. specielle proteiner (kaldt mikrotubuli eller tentråde). Efter separationen, under cytokinesen, deles cellen til to identiske datterceller med hver deres cellekerne og  hver omsluttet af sin cellemembran.

    Det er en typisk opfattelse, at kræft er en enkeltstående sygdom, men det er faktisk en gruppe af sygdomme, hvor den enkelte kræftsygdom er specifik for den vævstype, hvor den opstår. Med andre ord kan leverkræft have andre mutationer end de mutationer, der typisk eksisterer i brystkræft.  Dette kan betyde, at de to kræfttyper udvikler sig forskelligt, og en kræfttype kan være nemmere at behandle i forhold til en anden kræfttype. Selv inden for den samme kræfttype kan patienter have forskellige gen-mutationer, men stadig få stillet den samme kræftdiagnose. Dette gør det svært at definere de forskellige kræftsygdomme, da de kan være så ens og samtidig så forskellige.

    Apoptose regulerer celleligevægten

    I gennemsnit producerer et voksent menneske hvert døgn milliarder af celler, og for at opretholde celleligevægt må et tilsvarende antal af celler afstødes eller dø. Hvis alle vores celler blev ved med at leve og dele sig, ville en 80-årig person have 2000 kg lymfevæv og 16 km tarme. Det er derfor vigtigt, at cellen også gennemgår apoptose (programmeret celledød).

    Hvad er apoptose?

    Apoptose er programmeret celledød, hvor celler kollapser, strukturerne nedbrydes, DNA i cellen fragmenteres, og resterne optages af nærliggende celler uden at skade omkringliggende væv. Det er en hurtig og meget kontrolleret proces, der sker inden for 30-120 minutter. Apoptose har flere funktioner, hvor den første rolle er i fosterudviklingen. Apoptose er med til at forme organer og er afgørende for dannelse af fingre og tæer i fosteret, da hudceller mellem fingre og tæer må nedbrydes, for at hænder og fødder bliver funktionelle. Derudover gennemgår de gamle og defekte celler apoptose, hvis de ikke kan repareres af vores DNA-reparationssystem – et system der uddybes senere i artiklen. Et eksempel på en defekt celle kan være en celle, der har været udsat for stress, blevet inficeret med et virus, eller på anden vis har erhvervet sig en mutation.

    Kræft bryder celleligevægt

    Under normale omstændigheder er produktion af nye celler og bortskaffelsen af gamle og defekte celler meget nøje reguleret for at kunne opretholde celleligevægt. Kræft er en genetisk sygdom, hvor flere forskellige mutationer opstår, og det giver enten cellen nyerhvervede funktioner eller tab af funktioner. Forandringen fra en normal celle til en kræftcelle sker i flere trin, hvor det kræver flere mutationer, før cellen får en fysiologisk ændring, der karakteriseres som kræft jf. figur 2. De voksende, muterede celler kan med deres nye egenskaber og fordele udkonkurrere de omkringliggende normale celler og med tiden udgøre en dominerende skare af genetisk ustabile celler. Denne genetiske ustabilitet øger tilbøjeligheden til at erhverve flere nye mutationer.

    Selvom der er flere end 100 forskellige kræfttyper med flere tusinde forskellige slags mutationer, så mener forskerne, at der er syv forskellige, essentielle cellebiologiske ændringer, der leder til ondartet vækst. De fleste kræfttyper har flere af disse ændringer og disse vil beskrives i det følgende.

    Under normale forhold eksisterer der en celle-til-celle-kommunikation, som er vigtig for at opretholde celleligevægt. Celle-til-celle-kommunikation kan foregå over både korte og lange distancer.

    Figur 2. Eksempel på en celle, der under kopieringen af sit DNA erhverver sig en mutation, som bliver videreført til næste celle. En af de muterede celler kan erhverve sig endnu en mutation. Med det rette antal af mutationer kan det medføre, at cellen opfører sig som en kræftcelle.

    Kommunikationen foregår ved, at en celle udsender særlige molekyler, som de andre celler opfatter, da de bindes til specielle receptorer på modtagercellens overflade. Mange kræftceller undgår celle-kommunikation fra andre celler.

    1. Kræftceller er selvforsynende med vækstsignaler

    Normale celler har brug for vækstsignaler, før de kan bevæge sig fra et hvilende stadie til et aktivt vækststadie. Normale celler kan ikke vokse og dele sig, uden at de har fået et vækststimulerende signal udefra. Kræftceller derimod synes at være mere uafhængige af eksterne vækstsignaler for at kunne vokse og dele sig. Når kræftcellerne er mindre afhængige af signaler fra det omkringliggende miljø, for at kunne vokse, er de heller ikke en del af sammenspillet mellem de forskellige celletyper i vævet, der sikrer vedligeholdelsen af ligevægten. Der findes en del gener, som er involveret i cellevækst, og i mange forskellige kræfttyper ses en overaktivitet af de gener, der fremmer cellevækst.

     

    2. Kræftceller er ikke påvirkelige af vækstblokerende signaler

    I et normalt væv findes både vækstfremmende signaler og vækstblokerende signaler. De vækstblokerende signaler spiller en vigtig rolle i at holde celler i et hvilende stadie for at sikre celleligevægt. En anden grund til at celler afholdes fra vækst og deling er, hvis cellen har DNA-skader. Her er det vigtigt, at kroppens DNA-reparationssystem får mulighed for at reparere DNA-skaden, så cellen ikke kopierer det ødelagte DNA under celledeling. For at en kræftcelle skal fortsætte med at dele sig, skal den ikke kun forsynes med vækstsignaler, men også undgå de vækstblokerende signaler. Kræftceller er i stand til at slukke for de vækstblokerende signaler. Denne egenskab er vigtig for kræftceller, da de kan fortsætte ind i mitosen og videredele sig på trods af de mange DNA-skader.

    3. Kræftceller undgår kontakt-inhibering

    En anden vigtig del af vækstkontrollen er kontakt-inhibering. En normal celle vil stoppe sin vækstproces, hvis den er for tæt på en anden celle. Kræftceller kan fortsætte med at vokse uafhængigt af de omkringliggende celler, upåvirket af kontakt-inhibering, hvis de har mutationer i de gener, der styrer kontakt-inhibering. Da normale celler stadig er påvirkede af denne kontakt-inhibering, vil de stoppe deres celledeling og vige tilbage for de voksende kræftceller.

    4. Kræftceller undgår apoptose-stimulerende signaler

    Hver celletype har en bestemt levetid, og når cellerne bliver gamle, er det tid til at lade nye celler komme til. Som tidligere nævnt spiller apoptosen, den programmerede celledød, en vigtig rolle i afskaffelsen af gamle celler. Denne mekanisme er anderledes end de vækstblokerende signaler, da apoptosen ikke lader cellen blive i et hvilende stadie, men sørger for at cellen dør. I mange kræfttyper er apoptose-funktionen gået tabt, og kræftceller kan fortsætte med at dele sig på trods af defekter og mutationer.

    5. Kræftceller har ubegrænset evne til at dele sig

    Hvis en celle kunne være selvforsynende i vækstsignaler, undgå de vækstblokerende signaler og apoptose, betyder det ikke, at den kan vokse og dele sig uendeligt. De fleste menneskeceller kan dele sig et vist antal gange (gennemsnit 50-70 celledelinger), før de holder op med at vokse – en tilstand der kaldes senescens. Det der bestemmer, om en celle fortsat kan dele sig, er dens telomerer. Telomererne er en gentagen basesekvens, som udgør kromosomernes ender. For hver gang en celle deler sig, forsvinder en lille del af telomeren (50-100 basepar). De fleste kræfttyper er i stand til at producere mere af enzymet telomerase, som laver flere af de gentagne basesekvenser på enden af kromosomet og derved øger kræftcellens levetid. Kræftceller undgår derved senescens.

    6. Kræftceller får næring ved at skabe nye blodkar

    Næring og oxygen transporteres gennem blodkar og tilfører cellen alt det, den behøver for at fungere, overleve og dele sig. Alle celler i kroppen ligger mindre end 100 mikrometer fra et blodkar. Under udvikling af organer dannes nye blodkar, så cellevævet kan få næring. Denne proces kaldes angiogenese (blodkardannelse). Når en kræftcelle fortsætter med at dele sig, vil den med tiden udgøre en tumor. Når en tumor vokser, vil mangel på ilt og næring og en naturlig vækstbarriere blive et problem. Vækstbarrieren opstår, når cellerne i tumoren ligger så tæt sammen, at især de celler, der ligger tættest i midten af tumoren, får svært ved at dele sig. Det er også disse celler, der har mindst tilførsel af næring og ilt. For at tumoren kan vokse videre, må enhver barriere overvindes, ved at kræftcellen tilegner sig en ny mutation. Mange kræftceller har mutationer, som giver en overproduktion af de gener, der er nødvendig for angiogenese, så nye blodkar kan dannes nær tumoren.

    7. Kræftceller er i stand til at invadere væv og sprede sig gennem blod og lymfesystemet

    En tumor, der bliver ved med at vokse, vil med tiden invadere det omkringliggende væv pga. dens forøgede størrelse og behov for næring og ilt. Tumoren betegnes da som ondartet. Med udgangspunkt i lungekræft kunne et eksempel på invasiv vækst være, at tumoren i lungen vokser så meget, at den bryder ud i lungehinden og derfra til brystvæggen. Her kan tumoren invadere musklerne eller nerverne, og kræften har dermed spredt sig.

    Metastase er en anden proces, hvorved kræften kan sprede sig. I denne proces løsriver små klumper af kræftceller sig fra tumoren og invaderer blod- og lymfekarrene. Gennem disse kar transporteres kræftceller til andre væv, hvor de kan sætte sig fast og fortsætte med at vokse. På denne måde kan en primær tumor i et væv give anledning til en sekundær tumor i et andet væv som vist i figur 3. Omkring 90 % af de dødsfald, der er forårsaget af kræft, skyldes metastaser.

     

    Opsummering 

    Basalt set er en kræftcelle en af kroppens egne celler, der har fået flere forskellige mutationer, som cellens DNA-reparationssystem ikke har kunnet reparere. Kræft er en fællesbetegnelse for en gruppe af sygdomme, der underinddeles efter deres specifikke celle- og vævstype. De forskellige celletyper har forskellige funktioner og opfører sig forskelligt fra hinanden. På samme måde vil de forskellige kræfttyper også have forskellige karakteristika. Derudover kan to kræftceller fra samme celletype, men som stammer fra to forskellige kloner have forskellige mutationer. Dette resulterer i, at der også er kræft-subtyper inden for samme organ eller væv.

    På trods af de mange tusinde forskellige mutationer har de fleste kræfttyper samlet set nogle essentielle egenskaber, der gør, at de ikke længere er styret af den kontrol, der opretholder celleligevægt. Kræftceller erhverver normalt 4-5 samtidige forskellige mutationer, som giver dem nogle eller alle af de funktioner, der leder til en aggressiv vækst. Mutationerne, der enten giver nye funktioner eller tab af funktioner, kan lede til en vedvarende vækst. Mutationerne kan gøre kræftceller uafhængige af eksterne vækstsignaler, give dem en forlænget levetid og evnen til at danne nye blodkar for at få næring og ilt. Desuden kan nogle mutationer give dem evnen til at undgå apoptose- og vækstblokerende signaler og kontakt-inhibering.

    Sidst men ikke mindst kan den aggressive vækst medføre invasiv vækst og metastase. Kræftcellerne kan derved sprede sig til resten af kroppen og fortsætte med at vokse og invadere omkringliggende væv. Dette vil virke ødelæggende for kroppen, efterhånden som mængden af kræftcellerne øges og spredes, da kroppens raske celler fortrænges, og deres funktion hindres. Dette leder ofte til organsvigt med døden til følge.

     

    Hvordan muteres DNA?

    I dette afsnit behandles dels de forskellige former for DNA-skader, der leder til mutation og dels de faktorer der kan lede til mutationer. DNA-reparationssystemet og de arvelige ændringer, som ikke skyldes en ændret DNA-sekvens, vil meget kort blive beskrevet.

    Hver dag udsættes kroppen for mere end 500.000 forskellige DNA-skader. Bliver skaderne ikke repareret, kan de lede til mutationer. Disse skader kan skyldes ydre faktorer fra miljøet, men også indre faktorer såsom fejl-kopiering af DNA under celledeling. Mutationer kan være somatiske eller gonadale (sker i kønscellerne). Kun de gonadale mutationer føres videre fra forældre til børn, og det er derfor disse, der er årsag til arvelige sygdomme.

    Vores DNA kan opfattes som en kode. Den måde, koden læses på, er afgørende for, hvordan vi fungerer og ser ud. Der er flere forskellige måder, hvorved der introduceres fejl i DNA, ligesom der er flere forskellige måder, man kan introducere fejl i en sætning.

     

    De forskellige slags mutationer

    Vores DNA består af baserne adenin (A), guanin (G), cytosin (C) og thymin (T). En kombination af tre af disse baser kaldes et codon, som angiver koden for én af de 20 aminosyrer, kroppen bruger til at danne proteiner.

    Sammensætningen af flere aminosyrer danner peptider (små kæder af aminosyrer) og proteiner (større kæder af aminosyrer). Der er forskellige former for mutationer, hvor nogle har en større betydning end andre. En ændret DNA-sekvens kan føre til en ændret aminosyresekvens. Dette kan derfor give en ændring i proteinets sekundære og tertiære struktur, hvorved funktionen af proteinet ændres eller ødelægges.

    Figur 3. Metastase. Kræft kan sprede sig fra dens originale sted til et nyt sted i kroppen og fortsætte med at vokse og dele sig. Her ses, hvordan en muteret celle deler sig mere end normalt. Over tid udvikles en stor klump af muterede celler, der har en unormal form, som kaldes dysplasi. Dysplasi er typisk forstadier til kræft. Når kræften ikke er brudt gennem grænserne mellem de forskellige væv og stadig er lokaliseret til et sted i kroppen, kaldes det kræft in situ (latin: på samme sted). I andre tilfælde løsrives en kræftcelle fra dens originale klump af celler, transporteres med blodet og lymfesystemet og forplantes til et andet sted i kroppen. Herved opstår sekundær kræft, også kaldet metastase. 

    Af forskellige mutationer kan nævnes: punktmutationer, indsættelse og sletning af baser/basesekvenser, hvilket kan medføre rammeskiftsmutationer, og inversionsmutationer. Disse mutationer kan illustreres ved at tage udgangspunkt i en sætning som ”den grå kat var fed”. Da et codon består af tre aminosyrer, vil sætningen også bestå af ord med tre bogstaver.

    Ved punktmutation erstattes en base med en anden:

    Original sætning:                Den grå kat var fed

    Punktmutation:                   Den grå hat var fed

    Ved rammeskift mutation fjernes/tilføjes en eller flere baser, men da cellerne kun kan læse DNA i ord med tre bogstaver, kan hele sætningen lyde forkert:

    Original sætning:                Den grå kat var fed

    Rammeskift:                       Deg råk atv arf ed

    Ved insertionsmutation indsættes en eller flere ekstra baser eller codons:

    Original sætning:                Den grå kat var fed

    Insertion:                           Den grå kat gdx var fed

    Ved deletionsmutation slettes en eller flere ekstra baser eller codons:

    Original sætning:                Den grå kat var fed

    Deletion:                            Den grå var fed

    Ved inversionsmutation vendes større eller mindre dele af DNA-sekvensen om:

    Original sætning:                Den grå kat var fed

    Inversion:                          Den def rav tak årg

    Aflæsningen kan enten betyde, at en anden aminosyre anvendes, hvorved der dannes et helt forkert protein, eller at genkoden ikke giver mening. Figur 4 illustrerer, hvordan mutationer i DNA-sekvensen, kan give en mRNA-sekvens med et rammeskift, hvilket resulterer i en ændret aminosyresekvens.

    Man skelner mellem gen-mutationer og kromosom-mutationer, hvor gen-mutationer ofte drejer sig om et par enkelte basepar, der muteres. Dette kan medføre, 1) at proteinsyntesen ikke kan startes, 2) at proteinsyntesen stoppes for tidligt, 3) at et andet protein dannes pga. ændret aminosyresekvens, 4) eller at et kun partielt funktionelt- eller et slet ikke funktionelt protein dannes. En kromosom-mutation er en større ændring i et DNA-fragment. DNA-fragmentetet kan indeholde mange gener, og hvis dette kromosom-fragment slettes, slettes alle generne på dette fragment naturligvis også.

    Figur 4. Mutationer i DNA-sekvensen kan medføre, at mRNA-sekvensen indeholder et rammeskift, som ændrer sekvensens codons. Dette kan medføre en ændret aminosyresekvens. Her burde mRNA-sekvensen aflæses som Glu, Pro, Gln, Leu og His, men pga. rammeskift mutation aflæses DNA-sekvensen som Ser, Arg, Asn og Phe.

    Nogle af disse mutationer er så katastrofale, at det vil ændre en celle til en kræftcelle. Kromosom-translokation af kromosom 9 og 22 DNA-fragmenter er et eksempel på transformation fra en normal celle til en kræftcelle.

     

    Translokation

    Translokation er bytning af et DNA-fragment fra et sted til et andet. Ved kromosom-mutation kan det betyde flytning af et DNA-fragment fra et kromosom til et andet kromosom.

    Kronisk myeloid leukæmi er et resultat af kromosom-translokation. I kronisk myeloid leukæmi findes en særlig kromosom-forandring, der giver det såkaldte Philadelphia- kromosom. Philadelphia-kromosomet er et nyt kromosom, som dannes ved translokation af genetisk materiale mellem kromosom nr. 9 og 22 – jf. figur 5. Der dannes derved nye arveegenskaber, det såkaldte BCR-ABL genkompleks. Dette nye genkompleks danner et nyt protein, som bevirker, at leukæmicellerne (de hvide blodceller) deler sig uhæmmet og lever længere end normale blodceller. Derved øges antallet af disse celler i blodet, i knoglemarven samt i milten, som bliver forstørret. Det er vigtig at understrege, at leukæmicellerne er på et umodent stadie og derved ikke kan udøve deres funktioner i immunforsvaret, men  de tager pladsen fra de raske blodceller.

    Figur 5. Den kromosomale defekt i Philadelphia-kromosomet er en translokation, hvor dele af to kromosomer, 9 og 22, bytter pladser. Dette resulterer i, at dele af BCR (“breakpoint cluster region”) genet fra kromosom 22 fusioneres med dele af ABL genet på på kromosom 9.

    Miljøpåvirkninger

    Mange af de mutationer, man får fra ydre påvirkninger, kommer fra stråling såsom røntgenstråling, ioniserende stråling fra radioaktive stoffer og stråling fra solen. Stråling kan give et enkeltstrenget brud, og i værste tilfælde et dobbeltstrenget brud, på cellens DNA. Dette brud kan være vanskeligt at reparere.

    Andre miljøpåvirkninger, der kan give mutationer i cellens DNA, er de såkaldte mutagene stoffer, som er kemiske forbindelser. Miljøpåvirkningen kan skyldes påvirkning fra tobaksrygning eller asbest samt påvirkning fra forskellige tungmetaller som arsen, kviksølv og bly. Arsen findes i visse farveprodukter og i pesticider. Tobak, asbest og visse kemikalier indeholder molekyler, som enten kan binde til DNA eller har en fri elektron (fri radikal) på sig. En fri radikal er et molekyle eller et atom, der har en uparret elektron, som gør det meget reaktivt. Frie radikaler kan tage elektroner fra DNA, hvilket kan medføre DNA-skader, da DNA’et derved gøres ustabilt.

    Figur 6. A. Benzo(a)pyren er et pro-karcinogen, dvs. det er på et stadie, før det bliver til et karcinogen. Dets cancerskabende mekanisme er afhængig af en enzymatisk reaktion, hvorved at benzo(a)pyren omdannes til benzo(a)pyren-diol-epoxid. Det er dette molekyle, der interkalerer med DNA og skaber DNA-mutationer. B. Guanin er en af de fire baser i DNA. Pga. dets aromatiske struktur og reaktive O- og OH- grupper kan benzo(a)pyren binde til guanin.

    Tobak indeholder fx benzo(a)pyren, som er en 5-ringet aromatisk hydrocarbon. Dette molekyle er meget mutagent. Når benzo(a)pyren indhaleres ved rygning, kan det ved en enzymatisk reaktion omdannes til benzo(a)pyren-diol-epoxid, jf. figur 6. Dette molekyle kan interkaleres i DNA (indsætte sig i DNA’et) ved at binde til DNA-basen guanin. Binding af benzo(a)pyren- diol-epoxid til guanin medfører en mutation i DNA’et.

    Flere livsstilsstudier viser, at specifikke kræftsygdomme er mere udbredt i nogle befolkningsgrupper end i andre. Dette kunne indikere, at bestemte livsstile også kan øge sandsynligheden for at få visse typer af kræft. Undersøgelser har vist, at kvinder der bor i USA, har seks gange større chance for at få brystkræft i forhold til kvinder, der bor i Asien. Mere interessante er de undersøgelser, der viser, at asiatiske kvinder, som har levet i USA og har taget den vestlige livsstil til sig, efter 1-2 generationer har lige så stor chance for at få brystkræft som kaukasiske (hvide) kvinder. I denne undersøgelse blev det sandsynliggjort, at ved at undgå den traditionelle asiatiske kost og tilegne sig den mere fede amerikanske kost kombineret med mangel på motion, kan asiatiske kvinder øge chancen for at få brystkræft i forhold til asiatiske kvinder, som bor i Asien. Det har altså vist sig, at miljøet har betydning for udviklingen af kræft.

     

    Virus og bakterier

    Når en celle inficeres med et virus, kan virussen integrere sit eget arvemateriale ind i værtscellens genom. Dette kan påvirke eller ødelægge værtsorganismens gener og dermed give anledning til kræft. Der findes flere virus med forskellige typer genetisk materiale. Af eksempler kan nævnes:

    –          Enkelt- og dobbeltstrenget RNA virus

    –          Enkelt- og dobbeltstrenget DNA virus

    –          Retrovirus

    DNA-virus bruger værtsorganismens DNA- og RNA-syntese maskineri for at inkorporere sit eget genetiske materiale ind i værtscellens. Da integreringen af virus sker i værtscellens DNA, foregår dette i cellekernen, og DNA-virus er nødt til at trænge ind i cellekernen for at integreringen kan finde sted.

    RNA-virus bruger deres egne RNA-enzymer til replikationen af virus-genomet i værtsorganismen. Replikationen foregår hovedsagelig i cytoplasma. Der findes nogle RNA-virus, som har en høj mutationshastighed, dels fordi de har en høj ustabilitet, dels fordi de mangler enzymet DNA polymerase. Dette enzym er vigtig for reparationen af ødelagt DNA.

    Retrovirus er i stand til at omdanne dets eget RNA til DNA, en proces der kaldes revers transkription. DNA dannet efter revers transkription integreres i værtcellens genom. RNA-virus omdanner sit genetiske materiale til DNA, mens DNA først omdannes til RNA og derefter til DNA vha. Revers transkription. Retrovirus har også en høj mutationsrate, da mange fejl opstår under den reverse proces fra RNA til DNA.

    Eksempler på DNA-virus:

    • Papillomavirus, der giver kønsvorter og kan give livmoderhalskræft
    • Herpesvirus, som giver forkølelsessår og kan give Kaposis sarkom
    • Hepatitis B virus, der giver leverbetændelse og i nogle tilfælde skrumpelever, kan også give leverkræft
    • Epstein-barr virus, som tilhører herpesfamilien og giver mononucleose, er involveret i flere kræftformer (herunder især B-cellelymfomer)

    Af RNA-virus findes HIV (AIDS-virussen), som også kan medføre Kaposis sarkom. Det er dog kun 15 % af de humane kræfttyper, der er virusbaserede.

    Undersøgelser har vist, at visse bakterier og parasitter også kan øge muligheden for mutationer i cellen ved at påføre skade og stress på cellerne efter infektion. Det drejer sig om bakterierne Helicobacter pylori og Chlamydia trachomatis, som er forbundet med hhv. mavekræft og livmoderhalskræft. Parasitterne Opisthorchis viverrini og Schistosoma haematobium er specielle orme fundet udelukkende i Asien. De er forbundet med kræft i galdeblæren og urinvejene.

     

    Hvordan repareres DNA?

    Trods det store antal af DNA-skader, vi udsættes for hver dag (pga. spontane tilfældige hændelser under celledelingen, mutagene stoffer eller stråling), så er det kun få skader i DNA, som resulterer i mutationer. De fleste skader i DNA repareres præcist og fejlfrit af de forskellige enzymer involveret i DNA-reparationen. Der findes forskellige typer af DNA-skader såsom baser, der er parret forkert under kopieringen, enkeltstrenget DNA-brud, dobbeltstrenget DNA-brud og oxidationsskader. Et enkeltstrenget DNA-brud er generelt lettere at reparere end et dobbeltstrenget brud, da den komplementære DNA-streng stadig vil være intakt og kan bruges som skabelon for cellen reparationsenzymer.

     

    Opsummering

    Hver dag udsættes vores DNA for over 500.000 skader, hvor de fleste skader effektivt repareres af vores DNA-reparationssystem. Skader sker som følge af fejl i kopieringen af DNA under celledeling og introduceres også af ydre faktorer såsom stråling, toksiske kemiske forbindelser, forskellige virus, bakterier og parasitter. Skaderne kan være alt fra små skift i DNA-baserne til ombytning af større kromosom-fragmenter. Hvis skaderne ikke kan repareres, resulterer det i, at cellen erhverver sig en mutation. Disse mutationer vil i nogle tilfælde ikke have nogen betydning for cellens funktion, mens de i andre tilfælde påfører visse gener ændringer, som kan forandre en normal celle til en kræftcelle. DNA-skader er ofte lettest at reparere, hvis de kun involverer den ene af DNA-strengene, da den komplementære streng således kan benyttes som skabelon af kroppens reparationsenzymer.

     

    Links

    Hvis du er interesseret i at læse mere om nogle af denne artikels emner:

    Det centrale dogme
    http://en.wikipedia.org/wiki/Central_dogma_of_molecular_biology

    Aminosyredannelse og proteiner
    http://www.netbiologen.dk/asp/Genetisk_Kode.htm

    Frie radikaler
    http://da.wikipedia.org/wiki/Radikal_%28kemi%29

    Mavekræft og Helicobacter pylori
    http://www.netdoktor.dk/sygdomme/fakta/mavesaekkraeft.htm 

    Kræftfremkaldende stoffer
    http://www.arbejdsmiljoforskning.dk/upload/toksik-II-kap-II.pdf

    Epigenetik og de skadelige påvirkninger, man får fra miljøet
    http://www.netbiologen.dk/miljoenedarves.htm

    Af Simmi Gehani

    Denne artikel forklarer vigtige begreber i forbindelse med kræftgener, bl.a.onkogener og tumorsupressorgener. Desuden giver artiklen eksempler på, hvorfor disse gener spiller en vigtig rolle i udviklingen af kræft. Det kan anbefales at læse artiklen Biologiske mekanismer i kræft, for at få en bedre forståelse af følgende artikels indhold.

    Dette afsnit vil beskrive nogle af de gener, der er involveret i forandringen af en normal celle til en kræftcelle. Udover at det kræver mindst fire til fem forskellige mutationer, før en normal celle bliver til en kræftcelle, er det også vigtigt, at det er de ”relevante” mutationer, der opstår. Mutationen skal ske i de gener, der normalt er involveret i fx cellevækst, celledød, dannelsen af nye blodkar, kontakt-inhibering, telomerase-syntese og migration (metastasering), som kan lede til de syv essentielle cellebiologiske ændringer som tidligere er diskuteret i artiklen Biologiske mekanismer i kræft.

    Et specifikt eksempel på, hvordan en tarmcelle udvikler sig til en kræftcelle gennem flere omgange af mutationer, kan ses i figur 1. Mutationer i de gener, der styrer celledeling, kan øge antallet af tarmceller dramatisk. Dette cellestadie kaldes tidligt adenom. Her er cellerne stadig godartede og lokaliseret inden for vævet. Andre gen-mutationer kan desuden bidrage til celledelingen  og herved minimere chancen for at eventuelle DNA-skader repareres. Det kan betyde, at tidligt adenom bevæger sig til et stadie, hvor cellemassen defineres som et karcinom (kræft udgået fra epitelceller, se artiklen De forskellige kræfttyper). Yderligere mutationer kan påvirke kræftcellernes evne til at metastasere, hvorved kræften kan spredes. Metastaserede og/eller invasive kræftformer betragtes som ondartede. Tumorsupressorgenerne APC(Adenomatosis Polyposis Coli), DCC (Deleted in Colorectal Carcinoma) og p53 (protein 53) hæmmer udviklingen af kræft på forskellige måder:

    • APC holder celledelingen under kontrol, så cellemængden i kroppen er konstant
    • DCC minimerer antallet af permanente DNA-skader, der leder til mutationer
    • p53 reducerer risikoen for metastasering

    Figur 1Et eksempel på muterede gener, der kan føre til tarmkræft. Der skal mere til end én mutation til, før at en tarmcelle udvikler sig til en kræftcelle. I dette tilfælde sker der en mutation på fire forskellige kromosomer. Kræften udvikles i flere trin. Mutationerne medfører enten en nedsat- eller mistet genfunktion eller en over-aktivering af genfunktionen.

    K-Ras er til gengæld et gen, der øger celledelingen. En mindskelse af APCDCC og p53 vil give cellen en forringet evne til at forhindre aggressiv vækst og celledeling. En øget aktivitet af K-Ras vil øge celledelingen ud over end den normale hastighed.

    Man har i dag identificeret flere tusinde forskellige muterede gener, som kan give kræft. Disse gener kan have en overordnet funktion, som gør det muligt at gruppere dem. De to grupper, som vil blive beskrevet her, er onkogener og tumorsupressorgener.

     

    Onkogener

    Et onkogen er et gen, hvis proteinprodukt, når det efter mutation eller af anden årsag produceres i højere mængder end normalt, kan ændre cellen til en kræftcelle. Dvs. et onkogen skal opreguleres, for at det kan føre til kræftudvikling. Et proto-onkogen er det normale gen, før det ændres til et onkogen. Der identificeres nye onkogener hele tiden, og gruppen er så stor, at den kan inddeles i undergrupper afhængig af, hvordan de påvirker cellen.

    Når et proto-onkogen bliver til et onkogen, kan det have flere betydninger for cellen som fx:

    1. Forøget aktivitet af enzymer eller produktion af proteiner, der er direkte eller indirekte er nødvendige for at starte celledeling og cellevækst
    2. Forøget produktion af proteiner, som fx transskriptionsfaktorer, der er nødvendige for aktivere gener, der er involveret i celledeling, vækst og differentiering
    3. Forøget produktion af proteiner, som stimulerer dannelsen af nye blodkar (angiogenese), for at opretholde tilførslen af næring og ilt til tumoren
    4. Forøget produktion af proteiner, der er nødvendige for at en celle kan bevæge sig. Dette giver kræftcellen mulighed for at flytte sig, når der ikke er nok næring eller plads til, at kræftcellen kan overleve. En større produktion af disse proteiner hjælper kræftcellen til at sprede sig, dvs. til at metastasere

    De proto-onkogener, som er involveret i cellevækst, kan ses som speederen i en bil, der holder bilen kørende med en konstant fart. Proto-onkogenerne hjælper cellen med at vokse og dele sig. Et onkogen er en speeder, der har sat sig fast og konstant holdes nede, hvilket får bilen til at køre meget hurtig uden kontrol. På denne måde får det cellen til at dele sig uhæmmet.

     

    Tumorsuppressorgener

    Tumorsupressorgener koder for proteiner, der forhindrer cellen i at forandres til en kræftcelle. Dvs. at et tumorsupressorgen skal nedreguleres for, at det kan føre til kræftudvikling. Generelt aktiveres tumorsupressorgener når der er stress i cellen, når der er ødelagt DNA og når homeostasen skal opretholdes. Tumorsupressorproteiner (som tumorsupressorgenerne koder for) har flere forskellige funktoner som fx:

    1. De kan slukke eller minimere aktiviteten af de gener, som fremmer celledeling
    2. De fungerer som kontrol-proteiner, som sørger for at cellen er ”rask”, før den kan gå ind i celledelingen. Hvis cellen indeholder muteret DNA, er det tumorsupressorproteiner, der tilbageholder cellen, så DNA kan repareres, før den kan indgå i celledelingen. På den måde bliver mutationerne ikke kopieret og overført til næste celle
    3. De kan starte apoptose-processen. Hvis en celle med muteret DNA ikke kan repareres, kan tumorsupressorproteiner sørge for, at den dør, så den ikke kan skade organismen
    4. De kan forhindre en celle i at sprede sig ved at producere flere af de gener, der sørger for, at en celle sidder bedre fast på en overflade. Desuden kan de  hæmme andre faktorer, der er involveret i metastasering. Desuden kan de forhindre, at kontakt-inhiberingsmekanismen går tabt i celler. Disse proteiner grupperes i en undergruppe kaldt metastasesupressorer

    Ligesom onkogener kan sammenlignes med speederen i en bil, kan de tumorsupressorgener, der er involveret i kontrol af cellevækst, sammenlignes med bremsen. De sørger for, at cellen ikke deler sig for hurtigt, ligesom bremsen forhindrer bilen i at køre for stærkt. Når noget går galt, som fx når en mutation opstår og bremsen ikke længere virker, mistes styringen, og celledelingen forløber ukontrolleret.

    Mennesket har to sæt af næsten identiske gener, da vi både har kromosomer fra vores mor og far. Nogle gange, når et af de to identiske gener er blevet muteret, tager det andet gen over. Dette betyder, at cellen fortsat fungerer normalt, da det stadig intakte gen virker som et reserve-gen. Hvis det er tilfældet, er det en recessiv mutant (hvilket vil sige at genet skal nedreguleres i begge kromosomer, for at det får betydning for organismen). Hvis dette ikke havde været tilfældet, ville det betyde, at det kun krævede en mutation i et af de to identiske gener, før funktionen var tabt, og så ville mutanten være dominant (hvilket vil sige, at genet skal være intakt på begge kromosomer for at virke).

    For at et proto-onkogen bliver til et onkogen, kræver det normalt kun mutation i det ene af de to identiske gener, for at effekten er manifesteret. Det kræver dog typisk en mutation i begge de to identiske tumor supressor-gener før effekten  kommer til syne. Dette betyder, at kræftfremkaldende mutationer i onkogener normalt er dominante, mens de i tumorsupressorgener normalt er recessive.

    En anden forskel mellem onkogener og tumorsupressorgener er, at onkogener er et resultat af aktivering af proto-onkogener, mens tumorsupressorgener kan forandre en normal celle til en kræftcelle, når tumorsupressorgenernes aktivitet er slukket eller nedsat.

    Det næste afsnit vil tage udgangspunkt i enkelte onkogener og tumorsupressorgener, som leder til nogle af de klassiske kræft-karakteristika.

    Cellecyklus

    Et eksempel på en proces, hvor både proto-onkogener og tumorsupressorgener spiller en vigtig rolle, er cellecyklus. Cellecyklus, hvor en celle kopierer sit DNA for at danne to identiske celler, er delt op i fire faser. Disse fire faser, illustreret i figur 2, kaldes G1SG2 og M.  Celler som ikke er i en egentlig delingsfase, men i øvrigt om nødvendigt er i stand til deling, siges at være i G0 fase.

    I S-fasen (syntesefasen) kopieres al DNA i en celle, således at cellen nu har dobbelt så meget DNA-materiale. I M-fasen (mitosen) deles cellen til to identiske celler, som kaldes datterceller. G-faserne (gap-faserne) er forberedelses- og stopfaser, som sørger for, at cellen har alt, hvad den skal bruge i den korrekte form og mængde, før den går videre til enten S-fasen eller M-fasen. I G1-fasen produceres de enzymer, der skal bruges i S-fasen til DNA-kopieringen. I G2-fasen produceres de proteiner, der skal bruges til at lave to datterceller i M-fasen. Dette er fx proteiner såsom mikrotubuli, der er en af komponenterne i ”celle-skelettet”.

    Figur 2. Oversigt over cellecyklus. Cellecyklus har 4 faser, G1, S, G2 og M.

    Der findes forskellige kontroller i cellecyklus, som sørger for, at cellen opfylder alle krav, før den kan gå videre til næste fase. Hvis en celle har DNA-mutationer, er det yderst vigtigt, at DNA’et bliver repareret, før cellen indtræder i S-fasen. Hvis dette ikke sker, bliver DNA-fejlen kopieret og overført til dattercellen. De to vigtigste tidspunkter, hvor cellen kontroller, at alt er ok, er G1/S-overgangen og G2/M- overgangen, hvor det hastighedsbestemmende trin i cellecyklussen er G1/S – også kaldt restriktionspunktet (R).

     

    Eksempler på proto-onkogener og tumorsuppressorgener

    Proto-onkogener og tumorsupressorgener spiller en væsentlig rolle i vækst, vækstblokering, apoptose-stimulering, angiogenese og metastasering, som er blandt de syv essentielle processer, der ændres under udviklingen af kræft, se artiklen Biologiske mekanismer i kræft. Eksempler på flere proto-onkogener og tumorsuppressorgener vil blive gennemgået i det følgende.

     

    Rb

    Det første tumorsuppressorprotein, der blev opdaget i 1950’erne, var Retinoblastoma proteinet (Rb). Dette protein tilbageholder cellen i G1-fasen ved at binde til E2F. Proteinet E2F er en transskriptionsfaktor, som starter DNA-kopieringen i S-fasen. Så længe Rb er bundet til E2F, kan cellen ikke kopiere sit DNA og dele sig i mitosen til to datterceller. Hvis Rb får en mutation, der medfører, at proteinet ikke kan binde til E2F, har E2F konstant grønt lys til at starte DNA-kopiering og celledeling. Dette protein er derfor en vigtig faktor i reguleringen af cellecyklussen, se figur 3. Rb er et eksempel på et tumor supressor-protein, der er vækstblokerende.

    CyklinD

    CyklinD er et proto-onkogen, som indirekte phosphorylerer Rb, når det får et ekstracellulært vækstsignal. Et ekstracellulært signal er et signal, der kommer til cellen udefra. Signalet, som ofte er et lille protein, sætter sig på en af cellens receptorer. Dette starter en kaskade af reaktioner, som til sidst sender signalet videre ind til cellekernen. Når Rb er phosphoryleret, kan det ikke længe binde til E2F, og cellen går fra G1-fase til S-fase, se figur 3. Hvis proto-onkogenet CyklinD muteres til et onkogen, overproduceres proteinet, hvilket øger cellevæksten og celledelingen. CyklinD er et eksempel på et vækstfremmende protein.

     

    APC

    Adenomatosis Polyposis Coli (APC) er også et tumorsuppressorgen, som regulerer spredningen af celler inde i vævet og ud af vævet. Desuden fremmer APC apoptose og kontrollerer cellecyklus indirekte ved at blokere de ekstracellulære vækstsignaler. APC kan blokere de transskriptionsfaktorer, som er med til at producere gener som CyklinD1 og c-MycAPC-mutationer er set hos patienter med tarmkræft, lungekræft og prostatakræft. Ved 80 % af alle tarmkræfttilfælde findes APC-mutationer. APC er et protein, der både blokerer vækstsignaler, fremmer apoptose og kontrollerer metastasering.

    Figur 3. Transskriptionel aktivering af DNA. Eksempel på proteiner, der regulerer cellecyklussen er CyklinD ogCyklinD kinasen. CyklinD produceres i cellecyklussen, hvis cellen fx er blevet stimuleret af en vækstfaktor. CyklinD binder til Cyklin-D kinase 4 (CDK4), som phosphorylerer retinoblastoma protein (Rb). Denne phosphorylering frigiver Rb fra et kompleks, hvor E2F indgår. E2F aktiveres, når det ikke længere er bundet af Rb. Aktiveringen af E2F leder til aktiveringen af en kaskade af andre gener og den efterfølgende produktion af proteinet CyklinE. CyklinE kan binde til cyklinD kinase 2 (CDK2). CyklinE-CDK2-komplekset tvinger cellen fra G1-fasen til S-fasen, hvor DNA’et kan kopieres.

    c-Myc

    c-Myc er et proto-onkogen, der også er involveret i cellevækst, og som menes at styre 15 % af alle vores gener. c-Myc er en transskriptionsfaktor, som fremmer aktiviteten af proteiner, der er vigtige i cellecyklus. Ændringer i c-Myc eller i reguleringen af c-Myc giver en overproduktion af genet eller et vedvarende aktivt protein. Et overaktivt c-Myc kan sammen med andre mutationer forandre en celle til en kræftcelle. Ændringer i c-Myc produktionen er ofte set i lymfomer og lungekræft. c-Myc er et eksempel på et protein, som fremmer cellevækst.

     

    p53

    p53 er et meget essentielt tumorsupressorprotein, som er med til at tilbageholde cellen i G1-fasen, hvis cellen har et muteret DNA. Herefter kan det aktivere DNA-reparationsenzymer til at reparere DNA’et. Hvis dette ikke lykkedes, kan p53 starte apoptose, så cellen dør, således at det muterede DNA ikke overføres til dattercellen. p53 aktiveres hovedsagligt af DNA-skader, som kan skyldes et stress-respons. Et stress-respons aktiverer kinaser, som har den funktion, at de kan phosphorylere proteiner. Stress-kinaserne phosphorylerer p53, som derved aktiveres, hvorefter p53 kan bremse cellecyklussen. I over 50 % af alle kræfttyper findes p53 mutationer, hvilket betyder, at p53 ikke kan stoppe den ukontrollerede cellevækst i kræftceller. p53 er et eksempel på et protein, der fremmer apoptose.

     

    Ras

    Ras er et proto-onkogen, som er muteret i de fleste kræfttyper. Ras-proteinet spiller en vigtig rolle i en af signaleringsvejene, der sætter gang i cellecyklussen. Når Ras er bundet til et andet protein, aktiverer dette protein-kompleks-specifikke vækstkinaser Disse kinase kaldes MAP-kinaser (mitogen-activated protein kinaser).

    Figur 4. Når DNA bliver beskadiget, fx pga. UV-lys, aktiveres forskellige proteiner, som er involverede i reparationsmekanismen. Samtidigt aktiveres tumorsupressorgenet p53, som standser cellecyklussen, indtil DNA’et er blevet repareret.  Proteinkinaser er enzymer, der kemisk tilføjer en phosphat-gruppe på andre proteiner og derved ændrer proteinernes struktur og aktivitet. Phosphoryleringen (addering af en phosphat-gruppe) på p53 vil aktivere proteinet, hvorefter p53 bremser cellecyklus.

    MAP-kinaserne aktiverer transskriptionsfaktorer, som aktiverer gener, hvis proteinprodukt er med til at igangsætte cellecyklussen. Ras er et eksempel på et protein, der indirekte øger cellevæksten.

     

    DCC

    Deleted in colorectal cancer (DCC) er et tumorsupressorgen, som er muteret, således at det enten mangler på kromosomet eller produceres i meget små mængder. Denne mutation findes i flere end 70 % alle tarmkræfttilfælde – deraf dets navn. Det er senere blevet vist, at DCC er muteret i andre typer af kræft, såsom forskellige typer af leukæmi, lungekræft og kræft i æggestokkene. DCC menes at være involveret i apoptose og i spredning af celler. Når DCC er slettet fra kromosomet, vil flere celler, som har muteret DNA undgå apoptose/celledød, som kan lede til kræftudvikling. Kræftceller med mutation i DCC vil også have nemmere ved at sprede sig, hvilket bidrager til, at kræftcellerne lettere metastaserer. DCC er et eksempel på et gen, der fremmer apoptose og forhindrer metastasering.

     

    BRCA

    Breastcancer (BRCA) er et tumorsupressorgen, hvis protein kan binde direkte til DNA, og er involveret i DNA-reparationssystemet. Det er især medvirkende i homolog rekombination, som er reparation af dobbeltstrengede DNA-brud. Der findes to typer af BRCA, nemlig BRCA1 og BRCA2. Begge er med til at øge stabiliteten af gener ved at reparere muteret DNA. Når BRCA1 eller BRCA2 er muteret, således at de ikke længere er funktionelle, vil det påvirke reparation af de dobbeltstrengede DNA-brud. Mutationer i BRCA-generne giver en forhøjet risiko for brystkræft. Kvinder med BRCA-mutationer har 85 % chance for at få brystkræft, inden de fylder 70 år, og 25-55 % chance for at få kræft i æggestokkene – afhængig af om det enten er BRCA2 eller BRCA1, der er muteret. Fordi chancerne for at få brystkræft er så store, hvis BRCA er muteret, bruges BRCA1 og BRCA2 som diagnostisk markør for brystkræft. Mutationer i BRCA1og BRCA2 kan også lede til prostatakræft og forskellige former for leukæmi og lymfomer. Mutationer i BRCA1 og BRCA2er ofte mutationer, der nedarves. BRCA er et eksempel på protein, der er vigtig for DNA-reparation. En mutation i dette protein øger sandsynligheden for mutationer i andre gener.

     

    E-cadherin

    Epithel-calcium dependent adhesion molecules (E-cadherin) er et metastasetumorsupressorgen. Dets protein er lokaliseret i huden, hvor det sidder i cellens yderste lag – cellemembranen. Her hjælper det cellen til at sidde fast og knytte sig til andre hudceller, som holder celler inden for vævets grænser. Hvis cellen har mutationer i E-cadherin, som medfører en nedsat eller mistet funktion, kan cellen lettere løsrive sig fra vævet og sprede sig til andre væv gennem blod- og lymfesystemet. Det er blevet vist i flere kræfttyper, at der er en sammenhæng mellem lav produktion af E-cadherin og kræftcellernes evne til at sprede sig (metastasere). I en undersøgelse af kvinder, der havde brystkræft og mutationer i BRCA, viste man, at de kvinder, hvor kræften spredte sig, også havde en specifik mutation i E-cadherin. Kvinder med brystkræft, hvor kræften ikke spredte sig, havde derimod normalt E-cadherin. Nedsat eller mistet funktion af E-cadherin, der ofte leder til metastasering, er set i bryst-, tarm-, prostata-, mave-, lever-, spiserørs-, hud-, nyre- og lungekræft. E-cadherin er et eksempel på et protein, der stabiliserer celle-til-celle-kontakt og nedsætter risikoen for metastasering.

     

    Opsummering

    De findes to hovedgrupper af gener, der forandrer en celle til en kræftcelle, hvis gener er muteret eller reguleringen af dem er forandret. De to grupper kaldes onkogener og tumorsupressorgener. Proto-onkogener er normale gener, der, når de muteres eller produceres i højere mængder, ændres til onkogener. Mutationer i proto-onkogener er ofte dominante, mens mutationer i tumorsupressorgener ofte er recessive. Et eksempel på en proces, hvor proto-onkogener og tumorsupressorgener spiller en vigtig rolle, er cellecyklus. En cellecyklus består af fire faser, hvor cellens DNA kopieres i S-fasen, hvorefter cellen deles til to identiske celler i M-fasen. I G1- og G2-faserne dannes de nødvendige værktøjer (proteiner), der kræves for DNA-kopieringen og celledelingen. Onkogener, der er involverede i cellecyklus, leder typisk til en accelereret cellevækst og celledeling. Tumorsupressorgener har til opgave at sørge for, at cellen ikke deler sig, medmindre der er et behov, og cellens DNA er intakt og fri for mutationer. Hvis dette ikke er tilfældet, stoppes cellerne i G1- fasen, lige før de indtræder S-fasen, og det muterede DNA repareres. En mutation i tumorsupressorgenerne betyder typisk, at funktionen af genet mistes eller nedsættes. Cellen kan herved ikke længere kontrollere cellecyklus og forhindre DNA mutationer. Andre onkogener er involveret i angiogenese og i at fremme metastasering, mens tumorsupressorgener kan hæmme metastasering og fremme kontakt-inhibering.

    CyklinDc-Myc, og Ras er eksempler på onkogener, mens RbAPCp53DCCBRCA og E-cadherin er eksempler på tumorsupressorgener.

     

    Links

    Hvis du er interesseret i at læse mere om nogle af denne artikels emner:

    Cellecyklus
    http://vidensbanken.blogspot.com/2009/04/p53-og-cellecyklus.html
    http://www.biokemi.org/biozoom/issues/492/articles/1957

    Ras og kræft
    http://www.biokemi.org/biozoom/issues/520/articles/2346

    BRCA og arvelighed
    http://www.bionyt.dk/ejabon/70FM_ART01.asp

    Angiogenese
    http://www.kemi-online.dk/files/side24-25dak6-02.pdf

    Generelt om gener og kræft
    http://www.netdoktor.dk/sygdomme/fakta/kraeftoggener.htm
    http://www.biokemi.org/biozoom/issues/514/articles/2290

    Af Simmi Gehani

    Denne artikel omhandler DNA-mikrochipteknologien. Artiklen beskriver, hvordan DNA-mikrochipplatformen er opbygget og hvordan den fungerer. Desuden behandles fluorescens-mærkningen af biologiske materialer.

     

    Hvad kan man bruge en DNA-mikrochip til?

    I første halvdel af 1990’erne kunne forskerne kun studere ét gen eller højst en håndfuld af gener ad gangen. Isolering, identifikation og karakterisering af et gen kunne med datidens biologiske værktøjer være ret tidskrævende. Derudover kan det ved analyse af ét gen ad gangen være svært at undersøge samspillet mellem generne, og hvordan dette samspil har betydning i sygdomme.

    Det er i dag muligt at undersøge aktiviteten af alle menneskets gener ved brug af DNA-mikrochipteknologi. Det er en teknik, der oprindeligt var udviklet til computerindustrien – deraf ordet chip. I dag bruges mikrochipteknologien primært i forskningen og i medicinalindustrien. Her bruges den til at undersøge funktionen af et gen, dets placering i de biologiske signalveje og til at studere vekselvirkningen mellem flere gener. Derudover kan mikrochipteknologien bruges til at klassificere tumorer baseret på deres genaktivitet, udvikle ny medicin og undersøge toksiske parametre.

    Mikrochipteknologien bruges med stor fordel i flere sammenhænge inden for sygdomsforskning. Det er en såkaldt high-throughput screeningsmetode (HTS), da man vha. af en mikrochip kan undersøge tusindvis af faktorer på en gang. Med denne teknologi er det blevet hurtigere og nemmere at få viden om de molekylære ændringer, der kan opstå i menneskets celler som følge af sygdomme, som er relaterede til generne. Dermed er der åbnet for muligheden for at opdage forstadierne til en specifik sygdom og endda måle meget små ændringer i kroppen, inden eventuelle symptomer skulle vise sig.

    Som en del af denne high-throughput metode måles oftest på flere parametre, flere processer og/eller flere gener for at undersøge en række sammenhænge mellem disse. Et eksempel på, hvordan en mikrochip kan bruges i biologisk sammenhæng, kunne være at undersøge hvilke gener, der påvirkes, når en person har kræft. Dette kan gøres ved at sammenligne en kræftcelle med en almindelig celle fra det samme væv i den samme person. I en sådan model kan man få mere viden om de underliggende mekanismer, der får en normal celle til at forandre sig til en kræftcelle. Man kan tilføje yderligere en parameter ved at tage en vævsprøve fra kræftpatienten før behandling og efter behandling for at undersøge, om aktiviteten af de forskellige gener i kræftcellen har generhvervet de normale aktivitetsniveauer.

    En stor forskel ved denne high-throughput metode i forhold til den mere traditionelle ”low-throughput” metode, hvor ét gen undersøges ad gangen, er det enorme mængde datasæt, man får som output. At håndtere et datasæt med flere tusind værdier kræver en systematisk organisering.

    For at kunne analysere resultatet fra et mikrochipforsøg kræves, ud over en biologisk viden, også en matematisk viden. Ved at anvende værktøjer, som kan måle gen-information fra det enkelte menneskes celler og kombinere dette med biologisk og matematisk viden, er man i dag blevet bedre til at designe nye og mere avancerede behandlinger mod mange sygdomme. Dette vil ultimativt også åbne muligheden for, at man i fremtiden vil kunne give patienter individualiseret behandling på baggrund af deres personlige genetiske profil. Dermed vil patienterne opnå større overlevelsemulighed og evt. få færre medicinske bivirkninger.

     

    Design af eksperiment

    Hvordan skal man designe et eksperiment, når det nu er muligt at måle på aktiviteten af alle menneskets gener? Hvis man leder i blinde blandt 25.000 gener, kunne man bruge meget unødvendig tid på dette uden at blive klogere. Man er nødt til at konkretisere, hvilke spørgsmål man ønsker svar på. Typisk vil man opstille en hypotese, der skal bevises om den er falsk.

    Et eksempel kunne være, at man ønsker at få viden om de genændringer, der forekommer i en kræftcelle i forhold til en normal celle. Hypotesen kunne være, at der er forskel på gen-aktiviteten i en kræftcelle i forhold til en normal celle. Her vil man forvente, at de fleste gener ikke viser en forskel i gen-aktivitet, men der vil dog være få gener, som fx proto-onkogener og tumor supressor-gener, som man vil forvente viser forskel i gen-aktivitet.

    Hvad er en DNA-mikrochip og hvordan er den opbygget?

    En DNA-mikrochip er et lille stykke firkantet materiale, som kan være lavet af glas, plastik eller silicium. På en DNA-mikrochip er der plads til hundredtusindvis af spots/felter, som er dækket af en masse syntetisk fremstillet, enkeltstrenget DNA. Chippen kan sammenlignes med en lille kvadratisk græsplæne, hvor jorden er platformen, og alle de mange tusinde græsstrå er DNA strenge, som betegnes DNA-prober.  Disse DNA-prober er designet således, at de kan binde til en komplementær basesekvens, der er specifik for kun ét gen. I den prøve, man ønsker at undersøge, findes DNA-strenge for alle de gener, der er aktive. Prøverne varmebehandles, således at det dobbeltstrengede DNA omdannes til enkeltstrenget DNA. De enkeltstrengede DNA-strenge har mulighed for at binde til deres komplementære streng, der er repræsenteret på DNA-platformen. Det er på den måde muligt at bestemme hvilke gener, der er aktive i en given celle. Den biologiske prøve sammenlignes da med en reference eller en standard.

     

    Forskellige typer af DNA mikrochips

    I takt med at mikrochipteknologien har udviklet sig, og flere laboratorier bruger DNA-mikrochips som en standardmetode, er der også kommet flere forskellige typer af DNA-mikrochipplatforme, der bruges til gen-ekspressionsanalyser. Nogle mikrochips kan man designe selv. Her skal man foretage en udvælgelse af hvilke gener, man ønsker at undersøge. Andre mikrochips har hele det humane genom på chippen med over hundredtusind forskellige spots/felter. På mikrochippen vil der være flere probe-spots pr. gen, så man har muligheden for at kvantificere, hvor meget gen og derved protein, der er produceret.

    Figur 1. A. Opbygningen af en DNA-mikrochip. På chippen er forskellige DNA-prober bundet til overfladen. Disse prober vil binde sig til fragmenter af DNA, når en prøve placeres på chippen. Der kan være flere tusind prober på en DNA-mikrochip.

    Opsummering

    Sekvensering af det humane genom og identificering af menneskets 25.000 gener har forøget muligheden for at lave omfattende analyser, der undersøger flere gener under flere forskellige forhold på én gang. Denne high-througput (HTS) metode er både tidsbesparende og giver information om sammenhænge og vekselvirkninger mellem de forskellige gener, som forsøg, der kun studerer et eller to gener ad gangen, ikke ville kunne give. En DNA-mikrochip består typisk af et lille kvadratisk keramisk materiale. På DNA-mikrochippen kan der sidde flere enkelstrengede prober, som repræsenterer en specifik sekvens af det gen, man ønsker at undersøge. Der vil være flere prober på chippen, som repræsenterer det samme gen, så man har muligheden for at bestemme mængden af aktivt gen.

    For at kunne genkende hvilke gener, der er aktive i den biologiske prøve, man ønsker at undersøge, mærkes prøvens RNA, således at transkriberede/aktive gener kan identificeres ved fotoluminiscens.

    Hvordan mærker man den biologiske prøve?

    Der er forskellige måder at mærke sit materiale. Radioaktivitet og fluorokromer er eksempler på dette. Fluorokromer er molekyler, der udsender lys, dvs. fluorescerer, når man lyser på dem med UV-lys.  Fluorescens er en proces, hvor energi absorberes (ved excitation) fra lys af én bestemt bølgelængde, og energien afgives (emitteres) ved en anden længere bølgelængde. Fluorokromerne har en del aromatiske ringe, som har dobbeltbindinger mellem C-atomerne. Disse bindinger kaldes konjugerede bindinger. De konjugerede bindinger indeholder elektroner, som absorberer lys fra et område af lysspektret (som ikke behøver være synligt lys) og emitterer lys i det synlige område. Bølgelængdeskiftet fra exitation til emittation kaldes Stokes skift. Jo større Stokes skift er, jo nemmere er det at adskille det fluorescerende lys fra det lys, fluorokromet belyses med (fx UV-lys). Der findes forskellige fluorokromer, som absorberer og emitterer lys ved forskellige bølgelængder, og dette udnyttes i mikrochipteknologien. De fleste fluorokromer, der bruges i mikrochipteknologien, har et Stokes skift på 20-60 nm. Forbinder man kemisk et fluorokrom til DNA, vil DNA’et også lyse op, hvorved DNA kan identificeres.

    Figur 3. Stokes skift er forskellen i bølgelængde mellem absorptionstoppen og emissionstoppen.

    Det første led i at mærke den biologiske prøve er at isolere mRNA – en teknik der uddybes senere i artiklen. Derefter omdannes mRNA til komplementært, enkeltstrenget cDNA vha. enzymet DNA Revers Transkriptase.

    Der er to primære trin i reverse transkriptase processen, som illustreres i figur 4:

    1. Genkendelse af mRNA i total RNA poolen
    2. Syntese af cDNA fra mRNA

    Følgende punkter beskriver processen for dannelsen af det cDNA, som skal bruges i ens mikrochipeksperiment.

    • mRNA kendetegnes ved dets poly(A)-hale. Derfor tilsættes Oligo (dT) primers (TTTTTTT…), som genkender mRNA-transkripter ved at binde til mRNA poly(A)-halen.
    • Enzymet DNA revers transkriptase tilsættes for at katalysere dannelsen af cDNA-strengen, der er komplementær til mRNA. Byggestenene til syntese af cDNA er dATP, dGTP, dCTP og dTTP, som samlet kaldes dNTP (deoxyribonucleosidtriphoshate).
    • dNTP’erne tilsættes i overskud så de er tilgengængelige til at syntetisere cDNA.

    • Når dNTP-enheden er inkorporeret i cDNA-strengen, bliver den til et nukleotid. Hvis fx dATP bliver inkorporeret, vil den resulterende cDNA-streng indeholde et nukleotid med basen A.
    • mRNA nedbrydes efterfølgende med NaOH, og tilbage er kun enkeltstrenget cDNA (som et stabilt over for basisk hydrolyse med NaOH). cDNA vil indeholde den samme information som DNA, men hvor intronsekvenserne er splejset væk. Introns er den ikke-kodende del af DNA/RNA.

    Figur 4. Revers transkription. mRNA fra RNA-poolen genkendes ved poly(A)-halen. Oligo (dT) primers bindes til poly(A)-halen ved komplementær binding. Her kan primeren og enzymet revers transkriptase begynde syntesen af DNA-strengen med de tilgængelige dNTPs (base-byggesten). Efter at DNA er syntetiseret, nedbrydes resterende RNA med NaOH.

    Mærkning til DNA-mikrochip

    I nogle typer af DNA-mikrochips blandes både reference cDNA og test cDNA sammen og loades på DNA-mikrochippen. For at kunne skelne mellem referenceprøven og testprøven bruges to forskellige slags fluorokromer. Typisk anvendes det grønne cyanin fluorokrom Cy3 og det røde cyanin fluorokrom Cy5.

    Ved direkte mærkning inkorporeres Cy3 mærket-dNTP under syntesen af den første cDNA-streng fra reference mRNA. Reference cDNA’et vil derfor være grønt. Tilsvarende inkorporeres Cy5 mærket dNTP i test RNA. Test cDNA’et vil derfor være rødt. Efter at Cy3 og Cy5 er inkorporeret i cDNA, bliver alt overskydende mRNA nedbrudt med NaOH. Det inkorporerede Cy3- og Cy5-mærkede cDNA oprenses for at fjerne ikke-inkorporeret C3- og Cy5-mærket dNTP, salte og enzymer. Binding af RNA/DNA til den komplementære streng er en proces, der kaldes hybridisering. Efter oprensningen blandes Cy3-mærkede og Cy5-mærkede prøver sammen og hybridiseres til DNA-mikrochippen. Efter hybridiseringen vaskes chippen for at fjerne ikke-bundet fluorescensmærket cDNA og bufferopløsninger. Figur 5 skitserer hele den direkte mærkning med Cy3 og Cy5 under revers transkription til cDNA.

     

    Opsummering

    Det fundamentale princip bag DNA-mikrochipteknologien er hybridiserings-processen mellem mRNA/DNA-strenge og komplementær DNA. Metoden består af kendte oligoneukleotidsekvenser og en ukendt mærket RNA-prøve, som kan identificeres gennem fotoluminiscens. cDNA mikrochip anvender fluorescensmærkning, hvor mRNA under revers transkription eller ved in vitro transkription inkorporerer et fluorokrom, der gør det muligt at detektere transkriberede gener. Det mærkede RNA/DNA vil hybridisere til de komplementære oligonukleotider, som vil resultere i et positivt signal, når pladen belyses af en laser og registreres af en lysscanner. Dette giver mulighed for at kunne se hybridiseringen. Dette kombineret med viden om sekvensen og lokaliseringen på chippen kan transformeres til et datasæt, der giver en værdi for hvert gen. Ud fra dette datasæt skal der efterfølgende udføres en statistisk analyse, som skal danne grundlag for biologiske vurderinger og konklusioner.

    Figur 5. cDNA-mikrochip fluorescensmærkning. Reference- og testprøven tilsættes på samme chip.To forskellige farver er påkrævede for at kunne skelne mellem prøverne. Cy3 og Cy5 inkorporeres under revers transkription og blandes derefter sammen på chippen. Et grønt signal vil betyde, at genet i kontrollen er højere udtrykt end genet i testprøven, mens et rødt signal vil betyde det omvendte. Et gul signal indikerer, at genet er udtrykt i lige store mængder for både reference og test.

    Figur 6. DNA mikrochip.

    Figur 7. Et scanningsbillede af en DNA mikrochip.

    Links

    Hvis du er interesseret i at læse mere om nogle af denne artikels emner:

    Fremtidsaspekterne for individualiseret behandling
    http://www.biokemi.org/biozoom/issues/511/articles/2238

    James Watson’s humane genom projekt
    http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml

    Hvordan museforsøg bliver brugt til at forstå stamceller og fedme bedre
    http://www.sundisyd.dk/page155.aspx

    cDNA mikrochip og Affymetrix mikrochip
    www.microarray.org
    www.affymetrix.com

    Den første artikel der blev publiceret om DNA mikrochip  
    http://www.sciencemag.org/cgi/content/abstract/270/5235/467

    UniGene
    http://www.ncbi.nlm.nih.gov/unigene

     

    Af Andreas Hougaard Laustsen

    Klik her for t-tabel. (Tabellen kan benyttes til t-tests).

    Hvad er statistik, og hvorfor er det overhovedet relevant i biologien? Det korte svar kunne være, at det er en matematisk genvej til at spare tid og penge i forbindelse med f.eks. laboratorieforsøg. Men statistik kan også benyttes til at verificere resultater, således at man kan bevise en sammenhæng og konkludere, at resultaterne ikke bare er en tilfældighed. Kort sagt ville det meste videnskabelige arbejde (og meget andet arbejde) være stærkt hindret, hvis det ikke kunne bevise noget, eller hvis det ikke kunne foretage rationelle vurderinger om, hvor ens tid og penge skulle sættes ind for at opfinde ny viden. Det er her statistikken bliver en hjælp.

    I denne korte artikel vil statistik blive præsenteret som fagdisciplin og relateret til biologien og forsøgsarbejdet i projektet Mennesket på en DNA-mikrochip. Specielt vil t-test blive gennemgået, som er af stor værdi for analysen af DNA-mikrochipeksperimenter. Statistik kan opdeles i flere forskellige kategorier, men er generelt en fagdisciplin under den anvendte matematik. I denne artikel benyttes to overordnede kategorier til inddelingen af den statistiske teori, nemlig den deskriptive statistik og statistisk inferens.

     

    Den deskriptive statistik

    Deskriptiv statistik dækker over den del af statistikken, der benyttes til at beskrive (engelsk: describe) data. Dette kan f.eks. være gennemsnit, største- og mindsteværdier og variation. I det følgende vil flere af de mest essentielle begreber blive defineret og beskrevet kort. Flere af disse  begreber benyttes i statistisk inferens.

     

    Gennemsnit

    Det måske vigtigste nøgletal, der kan udregnes af en mængde data er gennemsnittet (også kaldt middelværdien). Dette tal kan f.eks. beskrive to fodboldspilleres præstationer og fortælle, at en spiller, der har scoret 10 mål i 13 kampe, scorer oftere end en spiller, der har scoret 30 mål i 500 kampe (selvom den sidstnævnte har scoret flest). Den konkrete matematiske formel for gennemsnittet er angivet herunder.

    Gennemsnit – (1.1)

    I ovenstående udtryk er der tre udgaver af samme formel, som kan benyttes til at beregne et gennemsnit. I korthed fortæller den første formel, at gennemsnittet, μ, beregnes ved at lægge alle data (xi) sammen og dele med antallet af data (n). Summationstegnet angiver, at summen af alle værdier (fra værdi nr. 1 frem til n) skal lægges sammen. Dette skrives ved, at i går fra 1 (dvs. første dataværdi) til n (dvs. n’te dataværdi). Alternativt kan den første formel også skrives som den midterste. Summationstegnet er således en forkortet skrivemåde. Den tredje formel benytter sig imidlertid af frekvensen, f(xi), for de forskellige dataværdier (dvs. hvor ofte en given dataværdi optræder). Frekvensen er defineret som:

    Hvor ni er antallet af gange en given værdi optræder ud af det totale antal værdier i et datasæt, ntotal.

    Median

    En anden værdi, som minder om gennemsnittet, er medianen. Medianen angiver det midterste tal i en sorteret talrække. F.eks. er medianen af tallene 1, 4 og 7 lig med 4. Følgende korte eksempel viser, hvordan medianer findes:

    Eksempel 1 – Median

    Data: 2   4   6   7   8   9   11                     Median = 7

     

    Hvis der er et lige antal dataværdier, så er medianen gennemsnittet af de to midterste værdier, som eksemplificeret nedenfor:

    Eksempel 2 – Median

    Data: 2   4   6   7   8   9                         Median = 6,5

     

    Men hvad kan medianen fortælle, når man ligeså godt kan beregne gennemsnittet (median og gennemsnit ligger ofte tæt på hinanden)? Medianen er mere stabil over for ekstreme værdier, hvorfor medianen kan være en fordel at beregne i tilfælde med såkaldte ”outliers” (dataværdier som helt tydeligvis er usandsynlige i eksperimenter). Fordelen ved medianen kan illustreres ved følgende eksempel, hvor en ekspedient har noteret prisen for en liter mælk i ni dage:

    Eksempel 3 – Median vs. Gennemsnit

    Data:  5   6   5   6   7   8   6   5   99999 (enhed: kr.)

    Gennemsnit, μ  = 11116,33 kr.

    Median             = 6 kr.

    I dette tilfælde, hvor ekspedienten tydeligvis har tastet forkert (eller læst en forkert pris) blev gennemsnittet stærkt påvirket (og størrelsen af gennemsnittet er ubrugelig), mens medianen ikke ville have ændret sig – uanset størrelsen af den niende værdi.

     

    Varians

    En anden vigtig faktor i den deskriptive statistik er variationen. Som det kan ses i eksempel 3 kan en stor variation i datasættet (den højeste værdi var 99999 kr. og laveste 5 kr.) føre til en  ubrugelig værdi for gennemsnittet (ingen priser var i nærheden af 11116,33 kr.). Til at beskrive variationen i datasættet beregnes variansen af datasættet. Formlen for varians er angivet herunder:

    Varians – (1.2)

     

    Variansen σ2 beregnes som beskrevet: Først findes forskellen på hver enkelt dataværdi (xi) og gennemsnittet (μ), og denne forskel kvadreres. Derefter lægges alle disse (xi– μ)2-værdier sammen, og denne sum divideres med (n – 1), som er antallet af dataværdier minus 1. Den sidste udgave af formlen for varians benytter sig af frekvensen for dataværdierne. Denne udgave kan ofte være mere brugbar, hvis der haves en stor datamængde, men såfremt antallet af dataværdier er mindre end 20 bør denne formel ikke benyttes, da den leder frem til et andet resultat. Dette skyldes, at denne formel benytter sig af frekvens (hvor der divideres med n, og ikke (n – 1) som egentligt er korrekt).

    Variansen kan forstås som den gennemsnitlige kvadratiske afvigelse på alle dataværdierne. Årsagen til, at forskellene kvadreres, er, at negative afvigelser og positive afvigelse ikke må gå ud med hinanden. Effekten af dette kan ses i eksempel 4. Årsagen til at der divideres med (n – 1) og ikke n, er rent matematisk, at det ikke er antallet af værdier, men antallet af frihedsgrader, der skal divideres med. Dette gør næsten ingen forskel, når n er tilstrækkelig stor, men vil have større betydning for små n. Antallet af frihedsgrader vil ikke blive uddybet i denne artikel, men det bør noteres, at denne værdi (ofte kaldet v) benyttes i de fleste statistiske sammenhænge af årsager, som ligger uden for denne artikels formål at beskrive.

    Eksempel 4 – Varians

    Data: 2   3   5   6

    Gennemsnit, μ = 4

    Hvis ikke forskellene, (xi– μ), havde været sat i anden potens, ville regnestykket have set således ud:

    Dette ville fejlagtigt have givet det indtryk, at der ingen variation er i datasættet

     

    Standardafvigelse

    Standardafvigelsen, σ, er tæt beslægtet med variansen, idet standardafvigelsen netop er kvadratroden af variansen (variansen er standardafvigelsen i anden potens, σ2). Formlen for standardafvigelsen kan ses herunder:

    Standardafvigelse – (1.3)

    Igen bemærkes det, at den sidste formel kun bør benyttes, såfremt man har mere end 20 dataværdier. Standardafvigelsen er ofte angivet i stedet for variansen af datasættet. Et eksempel på, hvordan standardafvigelsen beregnes kan ses i eksempel 5.

    Eksempel 5 – Standardafvigelse

    Data: 2   6   9   11

    Gennemsnit, μ  = 7

     

    Statistiske plots

    For at visualisere data findes der et hav af forskellige typer af plots og diagrammer. I denne artikel vil to af disse plots blive beskrevet – nemlig boksplottet (boks-plottet) og histogrammet.

    Boksplot

    Et boksplot afbilder data på en sådan måde, at området mellem 1. kvartil og 3. kvartil er et rektangel, 2. kvartil (medianen) en streg beliggende i dette rektangel, og fra rektanglet udgår en linje ud til både største- og mindsteværdien. To eksempler på et boksplot kan ses  figur 1.

    Boksplottets funktion er at skabe et hurtigt overblik over omfanget af et datasæt og angive beliggenheden af de forskellige kvartiler for at give en idé om, hvorvidt data primært er samlet omkring medianen, eller om data ligger spredt mere ud over hele skalaen. Undertiden hvis datamængden er meget stor vil de linier, der udgår fra rektanglet ikke gå ud til hhv. største- og mindsteværdi, men derimod til 5’te procentilen og 95’te procentilen.

    Figur 1. Boksplots af to forskellige datasæt. Et boksplot afbilder data, således at både mindsteværdi, størsteværdi, median samt 1. og 3. kvartil kan aflæses.

    Histogram

    Et histogram er en anden og meget typisk måde af afbilde data på. I et histogram inddeles data i forskellige intervaller af tal såsom [1;3[, [3;5[ osv. (fra og med 1 til 3, hvor værdien 3 først er med i det næste interval, fra og med 3 til 5, osv.). Antallet af observationer inden for disse intervaller angives. Ved afbildning af intervaller vil det midterste tal i intervallet ofte være angivet på x-aksen i histogrammet og bredden af søjlerne svarer til intervallernes bredde. Antallet af observationer eller frekvensen i et givent interval vil kunne aflæses på y-aksen. Et eksempel på et histogram kan ses i figur 2, hvor intervallerne er [131;133[med midterværdien 132, [133;135[ med midterværdien 134 osv.

     

    Statitisk inferens

    Indtil nu i artiklen har det handlet om deskriptiv statistik. Dvs. at statistikken har været brugt til at beskrive data, uden at denne beskrivelse har kunnet føre frem til konklusioner omkring udfald af nye forsøg. Statistisk inferens betegner metoder til at konkludere og fastsætte generelle tendenser og kvantitative egenskaber ud fra stikprøvetagning. Som beskrevet i indledningen til artiklen ligger betydningen af statistikken netop i at kunne forudsige- og fastsætte værdier og planlægge forsøg, f.eks. stikprøvetagning, på en økonomisk fordelagtig måde. Det ville f.eks. være uoverskueligt dyrt for en avis i en meningsmåling at udspørge alle danskere om deres politiske holdning. Derfor undlader alle aviser dette ved at tage repræsentative stikprøver i befolkningen. Herved kan de med en eller anden grad af konfidens (f.eks. med 95 % sikkerhed) lave en meningsmåling ud fra et par tusind danskere. Men hvordan tager man en repræsentativ stikprøve, altså en stikprøve, der repræsenterer befolkningen? Dette er altid en udfordring for de folk, der skal foretage en statistisk undersøgelse. En metode til at udtrække en tilfældig stikprøve i befolkningen kunne være at give alle danskere et nummer fra 1 til 5,4 mio. (befolkningstallet) og så udtrække helt tilfældige numre i denne række. Hvis man ville undersøge kornet fra en mark kunne man flyve højt op over marken og kaste nogle hulahopringe tilfældigt ud og så undersøge (tage målinger af) det korn, som var inden for de forskellige ringe. En dårlig måde at foretage en tilfældig stikprøveudvælgelse kunne f.eks. være at spørge alle gymnasieelever om deres politiske holdning og ud fra denne stikprøve udtale sig om hele befolkningen. Dette ville højst sandsynligt give et skævt billede, da alle gymnasieelever er i ca. samme aldersgruppe og alle har prioriteret deres uddannelse frem for arbejde.

    En anden fejlagtig metode, som blev brugt i USA i starten af 1900-tallet var at ringe rundt og spørge, hvem folk stemte på til næste præsidentvalg. Da det kun var de rigeste, der havde råd til en telefon, gav dette også et helt forkert indtryk af den politiske situation. Den kandidat, som ifølge meningsmålinger klart ville vinde, tabte stort ved selve valget. Nu om dage ville en telefonrundspørge dog næppe være helt så fejlbehæftet.

    Når man har taget en repræsentativ stikprøve, skal det ud fra statistiske tests vurderes, hvor overbevisende resultatet fra forsøget er. En typisk metode at gøre dette på er hypotesetests. Her defineres to hypoteser, som oftest kaldes nulhypotesen, H0, og den alternative hypotese, H1. Oftest vil den alternative hypotese være det, man ønsker at vise. Og for at vise denne må man forkaste nulhypotesen (vise at denne ikke kan gælde). F.eks. kunne nulhypotesen være, at et gennemsnit er lig med 3, og den alternative hypotese, at gennemsnittet ikke er 3. Hvis man således kan forkaste/afvise nulhypotesen, har man vist, at den alternative hypotese med stor sandsynlighed gælder.

    t-test for ét gennemsnit

    En klassisk metode til at foretage en hypotesetest er den såkaldte t-test. Denne metode benyttes typisk til test af et gennemsnit ved en stikprøvetagning. t-testen gælder kun, når det kan antages, at det datamateriale, der skal undersøges, er normalfordelt. Normalfordelingen gælder f.eks. for vægten af mandlige studerende, den præcise vægt af 100 gram slikposer og højden af 25-årige kvinder. Men den gælder ikke, hvis data fra forskellige stærkt inhomogene grupper er blandet sammen, f.eks. vægten af blåhvaler og mandlige studerende. Her vil data på ingen måde være normalfordelte. Det er desuden vigtigt at bemærke, at det ikke nødvendigvis er den stikprøve, man har taget, som i sig selv skal være normalfordelt. Derimod er det den samlede mængde data, som stikprøven tages fra, som skal være normalfordelt. Dette vil f.eks. sige, at en stikprøve bestående er fire højder af tilfældige mandlige studerende ikke behøver at være normalfordelt i sig selv, men derimod, at samtlige højder af alle mandlige studerende (i hele Danmark) skal være normalfordelt, for at man kan foretage en t-test på datamaterialet (f.eks. de fire højder). Normalfordelinger vil ikke blive beskrevet nærmere i denne artikel, men på figur 3 kan typiske normalfordelingskurver ses. Det fremgår, at disse er symmetriske med toppunkt i gennemsnitsværdien, μ. Desuden bør det bemærkes, at variansen eller standardafvigelsen ofte er angivet på sådanne kurver, eftersom 95,4 % af data i en normalfordelingskurve ligger i intervallet μ ± 2σ, også skrevet [μ – 2σ; μ + 2σ].

    Figur 3Forskellige normalfordelingskurver.

    Hvis det kan antages, at data er normalfordelte, skal nulhypotesen og den alternative hypotese defineres, inden der foretages beregninger. Typisk vil dette kunne skrives således:

    Nulhypotese:                    μ = μ0

    Alternativ hypotese:          μ ≠ μ0

                         Eller:          μ < μ0

                         Eller:          μ > μ0

    De to ”eller” betyder, at man enten kan undersøge, om det faktiske gennemsnit er forskelligt fra, mindre end eller større end det gennemsnit, som nulhypotesen er defineret til. Herefter foretages beregningerne. Formlen, der benyttes til en t-test, er angivet herunder:

    t-test for ét gennemsnit – (3.1)

     

    Antal frihedgrader: v = n – 1

    I denne formel betegner n størrelsen af stikprøven, X betegner gennemsnittet på stikprøven (i modsætning til μ, der betegner det ”sande” gennemsnit for samtlige dataværdier, som ikke nødvendigvis er med i ens stikprøve), μ0 betegner det gennemsnit, der er defineret i nulhypotesen, S betegner standardafvigelsen for stikprøven (i modsætning til σ, som er standardafvigelsen for alle dataværdier, som ikke nødvendigvis er med i stikprøven), og t er den parameter, der beregnes. Antallet af frihedsgrader, v, benyttes i forbindelse med opslag i t-tabel og vil blive beskrevet senere.

    En sidste parameter, der skal defineres, er α. Denne parameter angiver graden af usikkerhed for den endelige konklusion (f.eks. hvis α = 0,05, kan man konkludere noget med 95 % sikkerhed eller 5 % usikkerhed). Når denne parameter er defineret (α skal ligge mellem 0 og 1, også skrevet mellem 0 og 100 %), foretages beregningerne, og ud fra følgende skema foretages konklusionen:

                     t-test for ét gennemsnit
      Alternativ hypotese H1       Forkast hvis H0

    μ < μ0

    t < –tα

     

     

    μ > μ0

     

     

    t > tα

     

     

    μ ≠ μ0

     

     

    t < –tα/2

    Eller t > tα/2

     

     

    tα-værdierne benyttes til at afgøre t-testens udfald, og disse findes ved opslag i en t-tabel. Oftest vil der i tabellerne kun være tα-værdier for udvalgte α og for udvalgte v (antal frihedsgrader). Derfor er man tit nødt til at finde den tætteste, brugbare værdi. I eksempel 7 udføres en t-test på en stikprøve.

    t-test for to gennemsnit

    Nogle gange er det nok kun at foretage en t-test for ét gennemsnit, men ofte er meningen med beregningen at påvise en forskel på to grupper (populationer). F.eks. i biologien kan det i forbindelse med DNA-mikroarrays være relevant at kunne påvise, at der rent faktisk er en forskel på en gruppe celler og en anden (f.eks. en gruppe raske celler og en gruppe kræftceller) ved målinger på en given celleparameter (f.eks. udtrykkelsen af et protein). Til dette formål kan en t-test for to gennemsnit benyttes. Ligesom før skal data (for begge grupper) være normalfordelte, og der skal defineres en nulhypotese og en alternativ hypotese. Typisk ønskes det vist, at to gennemsnit er forskellige. Nulhypotesen vil derfor være, at de to gennemsnit er ens, og den alternative hypotese at de er forskellige:

    Nulhypotese:                    μ– μ2 = 0

    Alternativ hypotese:          μ1 – μ2 ≠ 0

                         Eller:          μ1 – μ2 < 0

                         Eller:          μ1 – μ2 > 0

    Igen er der flere muligheder for den alternative hypotese. Konklusionen foretages på baggrund af et lignende skema som før, efter at en α-værdi er blevet valgt.

        Alternativ hypotese H1            Forkast hvis H0            

    μ1 – μ2 < 0

     

     

    t < –tα

     

     

    μ1 – μ2 > 0

     

     

    t > tα

     

     

    μ1 – μ2 ≠ 0

     

     

    t < –tα/2

    Eller t > tα/2

     

     

     tα-værdierne benyttes igen til at afgøre t-testens udfald. Disse tα-værdier findes igen ved opslag i en t-tabel. Formlen, der benyttes til en t-test for to gennemsnit, er angivet herunder:

    t-test for to gennemsnit – (3.2)

    Antal frihedgrader: v = n1 + n2 – 2

    I denne formel betegner n1 og n2 størrelsen af stikprøven fra hhv. population 1 og population 2, X1 og X2 betegner gennemsnittet på stikprøven fra hhv. population 1 og population 2. Sp  betegner den poolede standardafvigelse (den ”fælles” standardafvigelse, som er en slags gennemsnitlig standardafvigelse for stikprøverne). Den beregnes efter ovenstående formel ud fra S1 og S2, som er standardafvigelsen for stikprøven for hhv. population 1 og population 2. Igen er t den parameter, der bestemmes. Bemærk, at antallet af frihedsgrader nu beregnes efter en ny formel. Et eksempel på hvordan en t-test for to gennemsnit benyttes, er givet i eksempel 8.

     

    Konfidensinterval

    Et sidste statistisk begreb, der vil blive præsenteret i denne artikel, er konfidens-intervallet. Konfidensintervallet benyttes til at udtrykke, at et gennemsnit for nogle data med en given sikkerhed ligger inden for et interval (f.eks. at gennemsnittet for antallet af æbler på et æbletræ med 90 % sandsynlighed ligger mellem 100 og 200). Til at lave et konfidensinterval benyttes mange af de samme parametre som ved t-test, og ofte laves der et konfidensinterval efter en t-test er udført. Formlen for konstruktionen af et konfidensinterval er givet ved:

    Konfidensinterval – (3.3)

    Antal frihedsgrader: v = n – 1

    Her betegner n  størrelsen af stikprøven, X betegner gennemsnittet på stikprøven, μ betegner hele populationens gennemsnit, S betegner standardafvigelsen for stikprøven, og tα/2 er en t-parameter, der slås op i en t-tabel ud fra valg af α og antallet af frihedsgrader. Et eksempel på, hvordan et konfidensinterval beregnes, er givet i eksempel 9.

    En vigtig pointe ved konfidensintervaller er, at når et sådant interval er beregnet, kan man udelukke alle værdier, som ikke indgår i intervallet med den givne procents sikkerhed. Dvs. hvis man startede med at udregne konfidensintervallet fra eksempel 9, kunne man hurtigt konkludere, at gennemsnittet for hele populationen med 95 % sikkerhed ikke er 10 (som det blev vist i eksempel 7). Det kan derfor være en stor fordel at udregne et konfidensinterval for et gennemsnit, når man har taget en stikprøve. Man kan så, uden at skulle lave mange t-tests, hurtigt afvise alle værdier, der ikke ligger inden for intervallet.

    For sammenligning af to gennemsnit kan et konfidensinterval også benyttes. I dette tilfælde er konfidensintervallet givet ved følgende formel:

    Konfidensinterval for forskellen på to gennemsnit – (3.4)

    Antal frihedsgrader: v = n1 + n2 – 2

    I denne formel betegner n1 og n2 størrelsen af stikprøven fra hhv. population 1 og population 2, X1 og X2 betegner gennemsnittet på stikprøven fra hhv. population 1 og population 2. Sp betegner den poolede standardafvigelse. Den beregnes efter ovenstående formel ud fra S1 og S2, som er standardafvigelsen for stikprøven for hhv. population 1 og population 2. Størrelsen tα/2 er en t-parameter, der slås op i en t-tabel ud fra valg af α og antallet af frihedsgrader. I eksempel 10 kan det ses, hvordan et konfidensinterval for forskellen på to gennemsnit kunne have været benyttet til nå til samme konklusion som i eksempel 8.

     

    Relation til biologien

    Statistik benyttes som redskab i mange fag. I biologien  benyttes statistik specielt i forbindelse med udvikling af lægemidler, fastsættelse af biologiske parametre ud fra eksperimenter og sandsynliggørelse af biokemiske teorier. Bl.a. er statistik en fuldstændig nødvendighed for gennemførelsen af målinger med DNA-mikroarrays, hvor der typisk køres forsøg med forskellige typer celler. Da det er umuligt at teste alle kræftceller i en bestemt kræftsygdom i et DNA-mikroarray, endsige bare i en enkelt tumor, er det nødvendigt at kunne gennemføre pålidelige forsøg, som kan generalisere udfaldet af få eksperimenter til teorier og hypoteser omkring kræftudvikling og kræftbekæmpelse. Hertil bidrager statistikken, ved at den med en vis procents sikkerhed kan estimere værdien af en parameter (ofte inden for et konfidensinterval) ud fra stikprøver af hele cellepopulationer. I forbindelse med biologiske forsøg accepteres det generelt, at konklusionerne på forsøgene kun er 95 % sikre (f.eks. i en t-test med α-værdi på 5 %, eller et konfidensinterval på 95 %), men undertiden i strenge medicinske forsøg kan kravene til sikkerhed være endnu højere (ofte 99 % sikkerhed). Det er naturligvis altid sværere at påvise en sammenhæng eller estimere en værdi, hvis kravene til sikkerheden i resultatet forøges. Derfor er det normalt at kræve, at ens resultat er mellem 95 % og 99 % sikkert. Dette krav giver et relativt pålideligt resultat, samtidig med at denne afvigelse fra 100 % sikkerhed giver en enorm tidsbesparelse. En mindre stikprøve på nogle tusind kræftceller vil ofte være nok (såfremt stikprøven er repræsentativ!) til f.eks. at vurdere med 95 % sikkerhed, om kræftcellerne har en højere produktion af et givent protein ift. raske celler. Dette må mildt sagt siges at være lettere end at teste samtlige celler i en menneskekrop.

    Til sidst bør det siges, at statistikken også har sine faldgruber. Ofte vil man gerne vise sammen-hænge (statistisk kaldt: at korrelere forsøgsresultater), men det kan undertiden være muligt at se statistiske sammenhænge mellem fænomener, som ikke er beslægtede. Det er f.eks. sandsynligt, at der ville kunne ses en sammenhæng mellem hudkræft og havbadning. Dette skyldes selvfølgelig ikke, at det at bade i havet er kræftfremkaldende. Derimod kunne det skyldes, at de personer, som bader i havet, sandsynligvis også er personer, som befinder sig meget i solen, og som derfor modtager en stråling, der kan være årsag til kræftudvikling. Det er derfor altid vigtigt nøje at overveje de sammenhænge og resultater, man vil prøve at vise, og være kritisk i ens analyse.

  • Øvelse

    I dette eksperimentelle afsnit finder du Det Virtuelle Kræftlaboratorium og en øvelse i brug af t-test. Det Virtuelle Kræftlaboratorium omhandler, hvordan DNA mikrochipteknologi og statistik bliver benyttet i kræftforskningen. I det Virtuelle Kræftlaboratorie skal den studerende selv designe sin egen DNA mikrochip, som skal benyttes til at teste, hvilke gener, der er involverede i en ny, fiktiv kræfttype. Øvelsen kræver forståelse af det centrale dogme inden for molekylærbiologien, proteiners opbygning og statistisk t-test. Det kan derfor anbefales, at øvelsen i brug af t-test er gennemgået forud for Det Virtuelle Kræftlaboratorium i forbindelse med matematikundervisningen.

    Gå til Det Virtuelle Kræftlaboratorium

    Elevvejledning til Det Virtuelle Kræftlaboratorium

    OBS! Desværre foreligger Det Virtuelle Kræftlaboratorium kun i en beta-version, hvorfor det stadig indeholder mindre skønhedsfejl, samtidig med at “tilbageknappen” undertiden giver problemer. Det anbefales derfor ikke at bruge “tilbageknappen”. Der arbejdes på at få udbedret fejlene hurtigst muligt.

    Øvelse i brug af t-test findes her.

    Øvelse 1

    Der er foretaget målinger på niveauet for en kræftcelles genekspression for genet c-Myc. Følgende måleresultater blev opnået:
    Genekspression for c-Myc:

     

    Kræftcelle:

    114,6

    112,9

    98,5

    106,7

    109,8

    103,6

    Beregn gennemsnittet for måleserien (svar = 107,6833)

    1. Beregn standardafvigelsen for måleserien (svar = 6,0251)
    2. Hvad er antallet af frihedsgrader for måleserien?
    3. Vurder vha. t-test for ét gennemsnit hvorvidt det med 95 % sikkerhed kan konkluderes, at det gennemsnitlige niveau for kræftcellens ekspression af c-Myc er højere end 100 (svar = ja, idet t = 3,1236 > 2,0151)
    4. Kan dette også konkluderes med 99 % sikkerhed (svar = nej, idet t < 3,3649)
    5. Lav et 95 % konfidensinterval for det gennemsnitlige niveau for kræftcellens ekspression af c-Myc (svar = [101,3604 ; 114,0063])

    Øvelse 2

    For genet DCC blev en rask celles cDNA mærket med grøn og en kræftcelles med rød. Begge celletypers cDNA blandes sammen, og der foretages målinger af flourescens. Målingen vil være negativ, hvis der er mest rød farve (svarende til at kræftcellen har højere genekspression), mens den vil være positiv, hvis der er mest grøn farve (svarende til at den raske celle har højere genekspression).  Følgende måleresultater for ekspressionen af DCC blev opnået:

    Genekspression for DCC:
    Fluorescence

    2,0

    -0,12

    -0,5

    1,5

    0,98

    0,647

    0,21

    0,12

    -0,42

    -0,32

    3,1

    1. Beregn gennemsnittet for måleserien (svar = 0,6543)
    2. Beregn standardafvigelsen for måleserien (svar = 1,1459)
    3. Hvad er antallet af frihedsgrader for måleserien?
    4. Vurder vha. t-test hvorvidt det med 95 % sikkerhed kan konkluderes, at det gennemsnitlige niveau for måleserien er over 0 (svar = ja, idet t = 1,8936 > 1,8125)
    5. Hvad svarer nulhypotesen til?
    6. Lav et 90 % konfidensinterval for det gennemsnitlige flourescens-niveau (svar = [0,0280 ; 1,2805])

    Øvelse 3

    For genet p53 blev der foretaget målinger af genekspression for en rask celle og en kræftcelle. Følgende måledata blev opnået:

    Genekspression for p53:

    Rask celle Kræftcelle
     100  33,2
     97,5  45
     101,2  12,2
     87,4  10,1
     120  34,9
     114  27,8
     99,9  46,2
    92,5 30,6
    88,6 5,9
    102,3 10,6
    104 17,8

     

    1. Beregn gennemsnittet for måleserierne (svar X1 = 100,6727, X2 = 24,9363)
    2. Beregn standardafvigelsen for måleserien (svar S1 = 9,8233, S2 = 14,3656)
    3. Beregn den poolede standardafvigelse (svar Sp = 12,3059)
    4. Hvad er antallet af frihedsgrader for måleserien (v = 20)?
    5. Vurder vha. t-test for to gennemsnit hvorvidt det med 95 % sikkerhed kan konkluderes, at det gennemsnitlige niveau for den raske celles ekspression af p53 er højere end kræftcellens (svar = ja, idet t = 2,6243 > 1,7247)
    6. Hvad kan der på baggrund af ovenstående resultat konkluderes angående genet p53?
    7. Lav et 95 % konfidensinterval for forskellen på de to celletypers genekspressions-niveauer (svar = [64,7908 ; 86,6819])

    Øvelse 4

    For genet K-Ras blev der foretaget målinger af genekspression for en rask celle og en kræftcelle. Følgende måledata blev opnået:

    Genekspression for K-Ras:

    Rask celle Kræftcelle
    104,2 1110,8
    112 809,8
     98,5  975,6
     87,3  1020,5
     91,4  878,6
    98,9  956,2
     101,8  975,2
    110,4 1001,2
    89,7 988,6
    77,8 951,2
    104,6 906,7
    1. Beregn gennemsnittet for måleserierne (svar X1 = 97,8727, X2 = 961,3091)
    2. Beregn standardafvigelsen for måleserien (svar S1 = 10,4022, S2 = 78,4159)
    3. Beregn den poolede standardafvigelse (svar Sp = 55,9342)
    4. Hvad er antallet af frihedsgrader for måleserien (v = 20)?
    5. Vurder vha. t-test hvorvidt det med 95 % sikkerhed kan konkluderes, at det gennemsnitlige niveau for den raske celles ekspression af K-Ras er lavere end kræftcellens (svar = ja, idet t = -6,5822 < -1,7247)
    6. Kan dette også konkluderes med 99 % sikkerhed (svar = ja, idet t = -6,5822 < -2,5280)
    7. Hvad kan der på baggrund af ovenstående resultat konkluderes angående genet K-Ras?
    8. Lav et 95 % konfidensinterval for forskellen på de to celletypers genekspressions-niveauer (svar = [813,6853 ; 913,1874])
  • Ekstra materiale

    Under denne side finder du ekstra materialer, som med fordel kan læses i forbindelse med projektet, såfremt man ønsker at beskæftige sig mere med emnerne kræft og mikrochipteknologi. Dette materiale er dog ikke nødvendigt for at gennemføre projektets øvelse.

    Ekstra materiale:

    God fornøjelse med dette ekstramateriale!

    Af Simmi Gehani

    Denne artikel gennemgår nogle af de forskellige typer af kræft og en del navne på de forskellige celle- og vævstyper vil blive nævnt. De er ikke altafgørende for forståelsen af artiklen, men mere beregnet til at give en fornemmelse af kroppens forskellige celletyper. Kræft er ikke en enkelt sygdom, men en gruppe af sygdomme der har fælles karakteristika såsom uhæmmet vækst og tendens til metastasedannelse. Den specifikke kræftsygdom defineres oftest efter histologisk inddeling, dvs. efter den vævstype, hvor kræftcellen opstod. Kræftcellen vil derfor også have fællestræk med den normale celletype, som det specifikke væv består af. En celle indeholder alle menneskets gener, men det er aktiviteten af de enkelte gener, der afgør, om en celle fx bliver til en hudcelle eller til en muskelcelle.

    Eksempler på forskellige kræfttyper:

    Karcinom

    Kræft, der stammer fra tætliggende celler, som danner hud og slimhinder på kroppens ydre og indre overflader, samt udgør kirtelvæv. Overfladecellerne kaldes også epitel. Karcinomer er ofte forbundet med infiltrativ vækst (vækst der infiltrerer andet væv) og metastasedannelse. Denne gruppe inkluderer kræftformer som bryst-, lunge-, tarm- og prostatakræft og udgør mere end 80% af de forekommende kræfttilfælde.

    Figur 1. En oversigt over menneskekroppen og dens organer.

    Sarkom

    Kræft, der stammer fra mesodermalt væv, dvs. bindevæv, bruskvæv, knoglevæv, fedtvæv (der alle betegnes som støttevæv) samt fra muskelvæv. Eksempler på kræfttyper i denne kategori er liposarkom (kræft i fedtvævets celler), kondrosarkom (kræft i bruskvævets celler) og leiomyosarkom (kræft i glatte muskelceller). Sarkomer er mere sjældne end karcinomer og udgør ikke mere end 1% af de forekommende kræfttilfælde.

     

    Leukæmi og lymfom

    Kræft, der stammer fra det bloddannende væv i knoglemarven. Helt overvejende er det tilstande med ondartet vækst af kloner af hvide blodlegemer (leukocytter). Der findes 4 hovedtyper af leukæmi:

    1. Akut myeloid leukæmi, AML
    2. Kronisk myeloid leukæmi, CML
    3. Akut lymfatisk leukæmi, ALL
    4. Kronisk lymfatisk leukæmi, CLL

    Myeloid leukæmi er en sygdom, der opstår i knoglemarvens bloddannende stamceller, og som påvirker cellevæksten af granulocytter. I kronisk myeloid leukæmi har 95% af tilfældene den karakteristiske kromosom-defekt, der resulterer i det såkaldte Philadelphia-kromosom, som kort er blevet beskrevet i den tidligere artikel Biologiske mekanismer i kræft.

    Lymfatisk leukæmi er en sygdom, der rammer de lymfoide celler, hvor de defekte, umodne lymfoide celler ophobes og fortrænger dannelsen af raske celler.

    Akut leukæmi rammer oftest børn, mens kronisk leukæmi ofte forekommer hos ældre. Hvor leukæmierne er diffust spredt i blodbanen og knoglemarven, er lymfomer derimod karakteriseret ved faste tumorer, der er lokaliserede til et lymfoidt væv.

     

    Hjernekræft

    Kræft, der stammer fra støttevæv i centralnervesystemet. Centralnervesystemet udgør hjernen og rygmarven. Den unormale og ukontrollerede celledeling kan finde sted i mange af hjernens forskellige celler såsom gliaceller, astrocytter, oligodendrocytter, de myelin-producerende Schwanske celler, neuroepitelceller og i det lymfatiske væv. Tumoren kan påvirke vitale centre i hjernen ved tryk eller lukke/hæmme afløbet af rygmarvsvæsken, en tilstand der kaldes hydrocephalus.

    De hyppigste kræftformer

    Som tidligere nævnt er nogle typer af kræft mere hyppige end andre. De celler, der har størst risiko for at blive til kræftceller, vil typisk være hurtigt-delende celler (celler med højt turn-over), som ofte er udsat for skadelige ydre påvirkninger. Et eksempel på dette er hudkræft, som hører under kategorien karcinomer. På den anden side er tyndtarmen et af de væv med hurtigst turn-over, og i det organ forekommer kræft praktisk taget ikke.

    Desuden er der forskel på antallet af kræfttilfælde, og hvilke kræfttyper der er mest fremtrædende i de forskellige dele af verden. I den vestlige verden og andre industrialiserede lande er kræft ansvarlig for omkring 25% af alle dødsfald. I Danmark er antallet af nye kræfttilfælde steget fra ca. 9.000 mennesker i 1940’erne til 34.161 mennesker i 2003. Disse tal stammer fra en opgørelse af Cancerregisteret i Sundhedsstyrelsen fra september 2007.

    Tabel 1. Diagrammer der viser de hyppigste kræftformer for kvinder og mænd i 2007. Tallene er fra NORDCA.

    I Danmark i 2007 var antallet af nye kræfttilfælde blandt mænd 16.686 og blandt kvinder 16.250. Stigningen skyldes faktorer såsom moderne livsstil med ændrede kost og motionsvaner. Vi udsættes muligvis også for større yderligere påvirkninger end tidligere, fx et reduceret ozonlag og hormonforstyrrende stoffer i vores tøj, mad og rengøringsmidler. En anden vigtig grund til denne stigning skyldes, at vi i gennemsnit lever længere, da det efterhånden er blevet nemmere at kurere andre sygdomme, som tidligere var årsag til at folk døde. Desuden har opmærksomheden på kræft og nyudviklede teknologier sørget for, at man hurtigere kan stille en diagnose, og man er blevet bedre til at registrere sygdommene, som kan bruges i statistiske undersøgelser.

    Mens nogle kræfttyper er arvelige, er andre kræfttyper livsstilsafhængige. Desuden findes der også mange kræfttyper, som både er afhængige af arv og miljø. Hyppigheden af de forskellige typer af kræft vil højst sandsynligt ændres i takt med at vores livsstil ændres. Mindre tid i solen og større forbrug af høj solfaktorcreme vil med stor sandsynlighed om nogle år kunne ses som en reduktion i antallet af hudkræfttilfælde. Ligeledes ville et rygeforbud reducere risikoen for at få lungekræft.

    I dag er det desuden muligt at blive vaccineret mod livmoderhalskræft. Dette er muligt, fordi denne kræfttype ofte er forårsaget af et virus, som rammes af vaccinen. Sandsynligvis vil denne sygdom ikke  rangere blandt de ti mest hyppige kræfttyper om ca. ti år (ca. 2020).

     

    Kræftsymptomer

    Man opdeler typisk kræft i fire stadier afhængig af, hvor meget kræften har spredt sig. Desuden defineres et nul stadie, hvor kræften endnu ikke har spredt sig. Stadierne tager højde for størrelsen af tumoren, hvor dybt tumoren trængt igennem andet væv, om den har spredt sig til de naboliggende organer, eller spredt sig til de forskellige lymfeknuder. Det er vigtig at kende det stadie, kræften er nået, da det er afgørende for, hvilken behandling man skal give.

    De fire kræftstadier defineres således:

    Stadie 0: Kræftcellerne er stadig lokaliseret på stedet, hvor de stammer fra.

    Stadie I: Kræftcellerne er lokaliseret til et afgrænset område af kroppen.

    Stadie II: Kræftcellerne har spredt sig lidt mere end i stadie I, men er stadig i et afgrænset område af kroppen.

    Stadie III: Minder meget om stadie II, men kræftcellerne kan have spredt sig til en lokal lymfeknude.

    Stadie IV: Kræftcellerne har dannet metastaser og har spredt sig gennem blod eller lymfesystemet til andre organer eller i hele kroppen.

    Når kræften kun er i stadie 0 og I ved diagnosetidspunktet, er sandsynligheden for at kurere patienten stor. Den bliver mere vanskelig at helbrede, jo længere tid kræften har haft mulighed for at udvikle sig. At opdage kræften i tide kan derfor være altafgørende for ens overlevelseschancer. Nogle kræfttyper er mere vanskelige at opdage i tide, da disse ofte kun opdages ved kirurgiske indgreb eller omstændige analyser. Andre kræfttyper viser sig at være symptomatiske i et tidligere stadie (symptomerne viser sig fysisk) og er derfor nemmere at fange i tide. Der arbejdes ihærdigt på at udvikle teknologier, som effektivt kan screene kroppen for de forskellige typer af kræft i de tidligere stadier.

    Overlevelsesraten afhænger også af hvilken type kræft, man har. Nogle kræfttyper er nemlig mere aggressive i vækst end andre pga. mutationer, de har erhvervet sig. Overlevelsesraten for fx testikelkræft er 95%, mens overlevelsesraten for leverkræft kun er 10%.

    Symptomerne kan også variere, men man inddeler dem generelt i tre forskellige grupper:

    Lokale symptomer: Unormale knuder og hævelser på kroppen, indre og ydre blødninger og sårdannelse. Smerte eller andre symptomer som følge af tryk på omkringliggende væv.

    Metastase symptomer: Forstørrede lymfeknuder, hoste, opkast af blod, forstørret lever, smerter i knoglerne, knoglebrud og neurologiske symptomer.

    Almene symptomer: Vægttab, forringet appetit, overdreven svedning, træthed, energiløshed og blodmangel.

    Symptomerne kan variere mellem de forskellige kræfttyper og sygdommens stadie. Desuden kan symptomerne variere afhængig af den enkelte persons generelle konstitution.

    Undersøgelser har vist, at danske kræftpatienter generelt er for sent ude med at fortælle deres symptomer til lægen, hvilket giver dem dårligere vilkår for behandling i forhold til kræftpatienter i andre lande. Forhåbentligt vil den rivende udvikling i behandlingsformer med tiden ændre på dette. Nogle af de nyeste behandlingsstrategier involverer bl.a. målsøgende medicin (medicin som kun rammer kræftceller) og medicin, der er defineret ud fra patientens genetiske profil.

     

    Opsummering

    Der findes mange forskellige former for kræft, som relateres til det væv, de stammer fra. Overordnet kan de inddeles i fire store grupper; karcinomer, sarkomer, leukæmi og hjernekræft. Disse fire grupper af kræfttyper er ikke lige store. Karcinomerne udgør fx 80% af  alle kræfttilfælde. Kræft opstår typisk i celler, der deler sig ofte og tit er udsat for ydre skadelige påvirkninger såsom stråling fra Solen. Derfor vil de kræfttyper, som rammer hurtigt-delende og udsatte celler, forekomme oftere end kræft, der rammer langsomt-delende, beskyttede celler. Ved livsstilsændringer kan risikoen for nogle kræfttyper mindskes. Det er i dag muligt at vaccinere mod livmoderhalskræft. Der er fire forskellige stadier af kræft, som defineres ud fra, hvor meget kræften har spredt sig. Det er nemmere at kurere kræft, når den er lokaliseret og kan fjernes kirurgisk, end hvis kræften har spredt sig. Hvis kræften har spredt sig, er man nødt til at bruge andre metoder som fx kemoterapi.

     

    Links

    Hvis du er interesseret i at læse mere om nogle af denne artikels emner:

    Brystkræft, som er et karcinom
    http://www.netdoktor.dk/sygdomme/fakta/brystkraeft.htm

    Sarkomer, diagnostikken og behandling
    http://www.bionordic.dk/indhold/sygdom/cancer/blodcancer.html

    De forskellige leukæmi-former, symptomer og behandling
    http://www.bionordic.dk/indhold/sygdom/cancer/blodcancer.html

    Hjernekræft
    http://www.sundhedsguiden.dk/da/temaer/alle-temaer/kraeft-i-hoved-og-hals/hjernetumorer-(hjernesvulster—inkl.-kraeft-i-hjernen)-/

    Hudkræft
    http://www.netdoktor.dk/sygdomme/fakta/hudkraeftnonmelanom.htm
    http://politiken.dk/indland/article759556.ece

    Rygning, kræft og madvaner
    http://www.cancer.dk/hjaelp-viden/fakta-om-kraeft/aarsager-til-kraeft/veldokumenteret-aarsag/overvaegt/
    http://politiken.dk/oekonomi/art4936500/Fokus-på-mad-og-kræft

    Forskernes bud på et værktøj der kan opdage kræft i tide:
    http://ing.dk/artikel/38650-ny-skanner-kan-finde-tidlige-stadier-af-kraeft

    Kræft i tal
    http://www.cancer.dk/hjaelp-viden/fakta-om-kraeft/kraeft-i-tal/

    Symptomer på kræft | Kræftens Bekæmpelse
    Kræftsymptomer

    Af Simmi Gehani

    Denne artikel vil gennemgå RNA-isolering, der er et altafgørende trin, for kvaliteten af en mikrochipanalyse.

     

    Hvorfor isoleres RNA og ikke DNA?

    Den store forskel mellem fx en kræftcelle og en almindelig celle ligger ikke i genernes DNA, men derimod i hvilke gener, der transskriberes eller ikke transskriberes – og i hvor ofte de transskriberes. Ved at analysere de mRNA-molekyler, en celle indeholder, kan det afgøres, hvilke gener der bliver transskriberet,  og i hvor stort omfang det sker. Når man skal skaffe sig mRNA, vil man oftest benytte celler fra blodet eller celler fra et specifikt væv, hvorfra man udtrækker mRNA vha. specielle teknikker. For at få et vellykket mikrochipeksperiment er det meget vigtigt, at kvaliteten af RNA er god. Med god kvalitet menes, at RNA’et ikke er nedbrudt under isoleringen. Nedbrudt RNA vil i forsøgsresultaterne give et meget højt baggrundssignal og lave værdier af intakt RNA, hvilket helt kan ødelægge den efterfølgende dataanalyse.

    Hvordan isoleres RNA?

    Kroppens RNA findes inde i cellen. For at få isoleret RNA til eksperimenter skal cellevæggene og plasmamembranen ødelægges, så RNA’et kan komme ud. Her bruger man ofte både en enzymatisk og mekanisk fremgangsmåde. Enzymerne går ind og nedbryder proteinstrukturerne i cellerne ved at nedbryde forskellige bindinger i cellens strukturelle proteiner. Den mekaniske fremgangsmåde kan være sonikering (ødelæggelse vha. lyd), centrifugering, homogenisering med en dounce (kan sammenlignes med en morter) eller ved brug af kanyler. I takt med at cellen ødelægges, frigives ribonucleaser (RNaser), som er enzymer, der nedbryder RNA. Hvis man arbejder hurtigt og samtidigt med den enzymatiske og mekaniske metode, sikrer man sig, at cellevæggene bliver nedbrudt, så enzymet kan komme ind og virke, og man mindsker derved  RNA-nedbrydningen.

    Ud over cellens frigivelse af RNase, frigiver vi naturligt RNase fra olien på vores hænder, ansigt, hår osv. Desuden kan overflader og støvpartikler indeholde bakterier og virus, som også har RNaser. Det er derfor vigtig, at man arbejder sterilt med specielle RNase-fri handsker, -eppendorf-rør og -pipette-spidser. Holdes prøverne på is vil man med stor sandsynlighed inaktivere RNasen, da enzymet er inaktivt ved dinne temperatur. Der findes også stoffer, som kan inaktivere RNAser, men de er ikke nødvendige, hvis man blot sørger for et sterilt RNase-frit miljø.

    Når cellen er smadret, kan RNA’et udfældes af opløsningen. Det kan gøres med ethanol eller isopropanol. Da DNA ligner RNA i struktur, kan DNA også udfælde ved denne metode. En måde at undgå dette er at tilsætte DNAse (enzymer der nedbryder DNA) til prøven, efter cellen er blevet ødelagt. Alternativt kan man bruge LiCl til fældning, da man vha. dette salt ikke får DNA med under udfældningen. Det færdigisolerede RNA opbevares i RNase frit vand og fryses ved -80 grader for at undgå nedbrydning. I dag findes mange forskellige kits, der gør RNA-oprensningen lettere. En meget brugt metode er til oprensning af mRNA er specielle mRNA-søjler, som tilbageholder mRNA fra den homogeniserede blanding, mens alt andet (inklusiv DNA) vaskes væk. I disse søjler udnyttes, at mRNA som den eneste type RNA indeholder poly(A)-haler. I søjlerne er der nemlig små kugler med poly(T)-haler, som parrer sig med mRNA’et poly(A)-haler, når prøven hældes over i søjlen. Mens mRNA’et er bundet til kuglerne, vil alt andet cellemateriale og andet RNA løbe igennem søjlen. Til sidst frigives RNA fra søjlen ved at tilsætte en buffer, der får poly(A)-halerne til at give slip på poly(T)-halerne, og det frigivede mRNA opløses i RNase-frit vand.

    Det næste trin er at undersøge kvaliteten af ens RNA, da ødelagt/nedbrudt RNA ikke kan bruges i de efterfølgende genanalyser. En almindelig metode er at køre en lille prøve af det isolerede RNA på en agarose-gel. I en menneskecelle vil der være en vedvarende aktivering af to gener 18S og 28S. Disse to gener bruges til at undersøge, hvor god kvalitet, dvs. hvor intakt det isolerede RNA, er. Intakt RNA vil have to meget distinkte bånd (18S og 28S rRNA-bånd), hvorimod nedbrudt RNA har et større ”smear” hen over hele brønden jf. figur 1.

    Figur 1. Et billede af en gel taget i en UV-transilluminator. Fra venstre: RNA-standard,  nedbrudt RNA og intakt RNA med distinkte S18 og S28 bånd.

    Opsummering

    I mikrochipteknologien måles der på mRNA for at få information om, hvilke gener der er aktive, og i hvilke mængder genet udtrykkes. RNA kan isoleres fra f.eks blod og væv. For at få RNA ud af cellen, skal cellemembramen ødelægges. Dette skal gøres hurtigt og prøven skal ofte på is for at undgå, at cellens RNaser kommer i kontakt med RNA, hvilket vil resultere i, at RNA’et nedbrydes. RNA skal derpå oprenses og isoleres fra DNA og proteiner. Dette kan gøres ved forskellige metoder, hvor specielle RNA-søjler, der tilbageholder RNA’et er en populær metode. RNA’ets kvalitet undersøges ved at køre en lille prøve af det isolerede RNA på en gel. Meget klare og skarpe bånd af de to gener 18S og 28S er en indikation af god RNA-kvalitet.

    Af Andreas Hougaard Laustsen

    Klik her for tilhørende ordliste over relevante ord brugt i artiklen.

    I starten af det 20. århundrede var infektionssygdomme (sygdomme hvor bakterie-infektion er årsagen til sygdommen) ofte dødelige. Nu om dage er disse og en lang række andre sygdomme ofte relativt nemme at behandle, hvilket har medført en enorm forøgelse af den gennemsnitlige levealder i den vestlige verden. Denne forøgelse i levealder har gjort, at hjerte-/karsygdomme og kræft nu om dage er de sygdomme, som hvert år koster flest menneskeliv, idet disse sygdomme oftere opstår hos ældre personer. Mens der siden 1960’erne er sket store fremskridt i behandlingen af hjerte-/karsygdomme (ift. at den forventede levealder for en patient er steget med adskillige år), har den medicinske kræftbehandling haltet bagefter. Hver gang aviserne skriver, at der er sket et enormt fremskridt i behandlingen af en bestemt kræfttype, er dette fremskridt sjældent større, end at den gennemsnitlige levealder for denne type kræftpatienter er øget med et halvt år. Ydermere oplever mange kræftpatienter tilbagefald, efter de egentligt er erklæret “raske”. F.eks. er der for danske patienter med tyktarmskræft, hvor denne kræft har spredt sig til lymfeknuderne, kun 47 % i live fem år efter endt succesfuld behandling (hvor patienten blev “kureret”). Selvom den traditionelle kræftmodel, som er beskrevet i de første artikler i Mennesket på en DNA-mikrochip, forsøger at forklare dette fænomen, er det sandsynligt, at modellen ikke til fulde kan forklare den store kompleksitet af kræft. En ny teori, som forsøger at forklare årsagen til patient tilbagefald samt flere af kræftens karakteristika er Kræftstamcelleteorien, som vil blive introduceret i denne artikel.

     

    Stamceller

    Inden beskrivelsen af selve kræftstamcelleteorien er det relevant kort at forklare, hvad en stamcelle er. En stamcelle er en type celle, som besidder den egenskab, at den kan dele sig asymmetrisk. Dette vil sige, at den kan dele sig til nye stamceller, men også til andet mere differentieret celleafkom. Kroppens stamceller virker derfor som et lager af ”moderceller”, som kan opretholde kroppens cellepopulation (der dør hele tiden celler i vores krop af forskellige årsager, og det er derfor nødvendigt med tilførsel af nye, friske celler). I modsætning til alle kroppens andre celler er stamceller desuden i stand til at forlænge deres telomerer i enden af deres kromosomer vha. enzymet human telomerase revers transkriptase (hTERT). Telomererne er ikke-kodende DNA, som sidder i enden af hvert kromosom for at beskytte de rigtige gener. Ved alle celledelinger mister hvert kromosom nemlig et stykke af DNA’et, og uden telomererne ville dette stykke blive taget fra generne. Det vil efter et antal celledelinger medføre, at cellen ikke længere kan fungere. Cellen vil derpå undergå apoptose (programmeret celledød). Telomererne virker derfor som en slags ”bufferzone”, der bevirker, at en celle kan dele sig mange gange uden at påvirke generne. Vha. enzymet hTERT kan stamcellerne efter hver celledeling forlænge deres telomerer, således at deres gener er beskyttede. Stamcellen kan derfor i princippet leve uendeligt. Ydermere bør det nævnes, at stamceller er langsomt delende celler, og at de pga. deres hTERT-enzym ofte lever i mange år.

    Det interessante ved kræftceller er, at de på nogle områder minder om stamceller. Bl.a. er det i mange typer kræft blevet påvist, at en subpopulation af kræftcellerne også er i stand til at producere hTERT, hvilket giver dem den egenskab, at de også kan leve uendeligt.

    Kræftstamcelleteori

    Ud over ovenstående observation (at nogle kræftceller kan producere hTERT) er det også blevet observeret, at metastaser (kræfttumorer der er udsprunget af ”den første tumor”) i den samme patient ofte har den samme komposition (cellesammensætning) som den oprindelige tumor. Tumorer består nemlig af mange forskellige undertyper af kræftceller, og ifølge den traditionelle kræftteori ville kompositionen af hver enkelt tumor være stærkt påvirket af, hvor tumoren befandt sig i kroppen. En tumor i lungen ville f.eks. have højere iltniveau og højere pH end en tumor i mavesækken, hvilket ville favorisere nogle typer af kræftceller frem for andre. Dette kaldes Cancer Darwinisme pga. den ”udvælgelse”, der sker, når vækstbetingelserne for en type celle er bedre end for en anden. Dog er det, som tidligere beskrevet, blevet oberveret, at kompositionen af metastaser beliggende forskellige steder i kroppen er slående identisk. Denne observerede homogenitet samt observationen af hTERT i kræftcellepopulationer har ledt frem til formuleringen af Kræftstamcelleteorien.

    Figur 1. A) Den forventede sammensætning af en ny metastase udsprunget af den originale tumor. Denne metastase ville pga. Cancer Darwinisme have en markant anderledes sammensætning end den originale. B) Den observerede metastase har slående lighed med den originale tumor.

    Ifølge kræftstamcelleteorien er det ikke tilfældigt, at tumorer udvikler forskellige undertyper af kræftceller, og at kompositionen er nogenlunde konstant for forskellige metastaser i samme patient. Teorien foreslår nemlig, at der eksisterer såkaldte kræftstamceller, som opretholder tumoren, ligesom stamceller opretholder organer og væv. Teorien sammenligner derfor en tumor med et dysfunktionelt organ, som har en meget heterogen (forskelligartet) cellesammensætning, og som opretholdes af en meget lille mængde kræftstamceller. Det er dog vigtigt at pointere, at ordet ”kræftstamceller” dækker over en celletype, som har flere karakteristika tilfælles med stamceller, men ikke at en ”kræftstamcelle” nødvendigvis er en type stamcelle. Derfor er der opstillet en definition på en kræftstamcelle, som bygger på tre egenskaber, der skal være opfyldt.

     

    Definition af en kræftstamcelle

    1. Kræftcellen skal være i stand til at starte tumorvækst, når den transplanteres ind i en mus med svækket immunsystem.
    2. Kræftcellen skal have en bestemt, karakteristisk profil af overfladeproteiner.
    3. En tumor startet af kræftcellen skal udvise fuld heterogenitet. Dvs. at den skal indeholde både andre kræftstamceller samt mere differentieret kræft-celleafkom.

    Ifølge denne definition er det således kræftstamcellen, som besidder egenskaben at kunne metastasere. Det er endvidere observeret, at kræftceller, som opfylder ovenstående definition, er ikke-adhererende, hvilket vil sige, at de i modsætning til f.eks. hudceller ikke sætter sig fast i hinanden eller binder sig til overflader. Denne observation stemmer godt overens med evnen til at metastasere, da det netop kræver en celle, der let kan bevæge sig gennem blodbanen, og som kan starte en tumor et andet sted. I henhold til definitionen er det også relevant at bemærke, at mange af de overfladeproteiner, som er karakteristiske for kræftstamceller, også er karakteristiske for stamceller. Dette har været en af årsagerne til at ordet ”kræftstamcelle” er blevet benyttet.

     

    Kræftstamcelleteoriens effekt

    Kræftstamceller findes kun i meget små antal, f.eks. er det blevet vist, at kun 1 ud af 57.000 tyktarmskræftceller er i stand til at starte en ny tumor. Denne observation kunne være en del af forklaringen på, hvorfor så mange patienter får tilbagefald efter endt behandling. Når en patient får konstateret kræft, bliver det meste af tumoren ofte fjernet kirurgisk. Derefter får patienten kemoterapi, som primært angriber hurtigt-delende celler (ud over kræftceller er bl.a. hårceller også hurtigt-delende. Det er grunden til, at mange kræftpatienter mister håret). Kræftstamceller menes at være langsomt-delende celler, hvorfor disse ikke bliver nær så påvirkede af kemoterapien som de differentierede kræftceller (kræftstamcellerne er mere resistente). Når patienten bliver erklæret rask, har han/hun gennemgået adskillige medicinske prøver og scanninger. Men da kræftstamceller kun findes i et meget lille antal, er det umuligt, i både scanninger og i andre medicinske tests, at registrere det lille antal kræftceller. Hvis de tilbageblevne celler var normale kræftceller, ville disse have begrænset levetid, inden de mister deres telomerer og langsomt dør. Men hvis de tilbageblevne kræftceller er kræftstamceller, ville enkelte af disse celler være i stand til at opbygge en ny tumor. Som tidligere beskrevet observeres det netop, at mange patienter oplever tilbagefald et halvt til et helt år efter, de har gennemgået kemoterapi. Dette stemmer overens med, at kræftstamcellerne har brug for en periode, hvor de kan opbygge en ny tumor.

    Hvilke celler bliver kræftstamceller?

    Relationen mellem kræftstamceller og normale stamceller er endnu ikke klarlagt. Det er muligt, at disse to celletyper intet har med hinanden at gøre, men det er også tænkeligt, at kræftstamceller faktisk er stamceller, som pga. mutation er blevet til kræftstamceller. En sådan sammenhæng ville forklare både, hvorfor stamceller og kræftstamceller har mange ens overfladeproteiner, og hvorfor nogle kræftceller er i stand til at producere hTERT. Årsagen er, at stamcellerne i forvejen besidder disse egenskaber. Desuden kræver det ofte adskillige mutationer i både onkogener og tumor-suppressor gener for at en celle bliver til en kræftcelle, og denne proces kan ofte tage længere tid. Da en normal hudcelle eller tarmepitelcelle sjældent lever mere end få dage, er det næsten utænkeligt, at en sådan celle skulle kunne nå at anskaffe sig mange mutationer (f.eks. menes tarmkræft at skyldes over fem forskellige uafhængige mutationer). Alligevel er disse typer kræft nogle af de mest hyppige.

    Stamceller befinder sig overalt i kroppen og i særdeleshed tæt på væv, hvor der er hyppigt behov for udskiftning af celler (f.eks. hud og tarm). Derfor er det tænkeligt, at stamcellerne pga. deres lange levetid netop lever så længe, at de er i stand til at akkumulere nok mutationer til at blive til kræftceller. Dette ville også forklare, hvorfor kræftstamceller er mere resistente over for kemoterapi. Det skyldes, at de allerede har stamcelleegenskaber og derfor er langsomt-delende og ikke bliver ramt af kemoterapi rettet imod ”normale” hurtigt-delende kræftceller.

    Figur 2. A) Kræftudvikling ifølge den traditionelle kræftmodel. Hver kræftcelle deler sig i to identiske celler, som efter deling kan ophobe mutationer på egen hånd og ændre karakter. B) Kræftudvikling ifølge Kræftstamcelleteorien. Kræftstamcellerne er i stand til at dele sig i nye kræftstamceller og andre mere differentierede celler.  Heterogniteten skyldes ikke alene nye mutationer.

    Selvom kræftstamcelleteorien giver plausible forklaringer på flere af de observationer, der er gjort inden for kræftudvikling, skal det siges, at teorien hverken er be- eller afkræftet. Teorien er helt ny og derfor stadig under udvikling, men repræsenterer et af de helt nye og spændende felter inden for kræftforskningen. Hvis teorien skulle vise sig at holde stik, er det tænkeligt, at dette i fremtiden ville medføre store ændringer i kræftbehandlingen.

     

    Kræftstamcelleteorien i perspektiv

    Hvis kræftstamcelleteorien i fremtiden bliver bekræftet, kan teorien give helt nye muligheder inden for behandlingen af kræft. Fordi kræftstamcellerne efter denne teori er de ”rigtige syndere” i kræftudvikling, vil det derfor sandsynligvis blive målet at udrydde disse celler, når en patient behandles. Det vil derfor blive vigtigt at finde ny medicin, som specifikt rammer kræftstamcellerne, hvilket måske vil føre til nye behandlingsmetoder. Én måde at behandle på kunne være, sammen med den normale kemoterepi, at ordinere ekstra kemoterapi rettet specifikt mod kræftstamcellerne. I så fald ville det måske være muligt at dræbe alle kræftcellerne.

    Figur 3. Farvning af kræftceller. Her er en kræftcelle, som udtrykker et af de karakteristiske ”kræftstamcelle” overfladeproteiner blevet farvet vha. antistoffer, som er bundet til et farvestof.

    En endnu mere radikal behandlingsmetode, som ville være langt mindre ødelæggende for patienten, kunne være alene at dræbe kræftstamcellerne. En sådan behandling ville kun slå meget få kræftceller ihjel (måske kun 1 ud af 57.000, som det er foreslået, at forholdet mellem kræftstamceller og normale kræftceller er i en tumor), og resultatet af behandlingen ville ikke kunne ses på en scanning. Hvis alle kræftstamcellerne blev ramt af behandlingen, ville tumoren efter nogen tid muligvis langsomt skrumpe ind, da den ikke længere ville have nogen kræftstamceller til at opretholde sin vækst. De normale kræftceller ville netop miste deres telomerer efter nogle celledelinger og langsomt dø én efter én. Denne anden behandlingsmetode ville således undgå, at patienten skulle opereres. Patienten ville så undgå en meget uspecifik kemoterapi, som ville ramme alle kroppens hurtigt-delende celler.

    Fordi kræftstamcelleteorien er helt ny, og fordi det er meget svært at isolere nok potentielle kræftstamceller, er der endnu ingen specifik strategi til, hvordan et kræftstamcelle-specifikt lægemiddel skal findes. Eksisterende screeningsmetoder kræver for mange celler til at give et pålideligt resultat, og pga. teoriens unge alder kendes der endnu ingen oplagte biologiske targets (mål) for nye lægemidler.

    Derfor foregår der en del forskningsmæssigt arbejde med at udforske og underbygge teorien og forsøge at finde nye metoder, som kan give pålidelige resultater, når nye lægemidler testes.

    Figur 4. A) Normal kemoterapi som slår hurtigt-delende kræftceller ihjel. Efter endt terapi opbygger kræftstamcellerne langsomt en ny tumor. B) Såfremt der gives normal kemoterapi og kræftstamcelle-specifik kemoterapi kan kræften måske helt kureres. C) Hvis der kun gives kræftstamcelle-specifik kemoterapi er det muligt, at tumoren langsomt vil svinde hen, og patienten vil blive kureret.

    Disse metoder er bl.a. mere fintfølende screeningsforsøg, som skal kunne teste enorme mængder potentielle lægemidler på et meget lille antal celler.

    Det er værd at huske, at kræft er en meget individuel sygdom, hvor en patients egne celler (som har denne persons unikke genetiske sammensætning) muterer og bliver til kræftceller. Det er derfor utrolig svært at finde et oplagt mål for nye lægemidler, da én patients kræft kan adskille sig markant fra en andens, selvom de er diagnosticeret med samme kræfttype. Dette komplicerer yderligere udviklingen af ny kræftmedicin (uanset om kræftstamcelleteorien gælder eller ej). Det vil komme til at tage mange år, inden det første kræftstamcelle-specifikke lægemiddel ville kunne komme på markedet.

    Til sidst skal det nævnes, at kræftstamcelleteorien ikke er i modstrid med den traditionelle kræftmodel, men er en viderebygning, som fungerer som et ekstra lag af kompleksitet i kræftudvikling. Mange firmaer og forskere er allerede i gang med at undersøge teorien, og bliver den bekræftet, kan den bidrage til et større fremskridt i behandlingen af kræft. Teorien er stadig ikke bekræftet, men formår dog at give gode forklaringer på patienttilbagefald, tumorheterogenitet og kræftcellers evne til at ”leve uendeligt”. Derfor er teorien værd at udforske.

     

    Læs mere om Kræftstamcelleteorien:

    Læs Andreas Laustsens rapport om kræftstamceller (udarbejdet i samarbejde med Mikael Engmark og Jakob Berg Jespersen).

null

Projektet er udarbejdet af Simmi Gehani.
Simmi er civilingeniør i Bioteknologi og Ph.D i kræftforskning.

Simmi Gehani

null

Projektet er udarbejdet af  Andreas Laustsen. Andreas er civilingeniør i Sundhed og Produktion.

Andreas Laustsen

null

Institut for Systembiologi har Danmarks største biovidenskabelige og bioteknologiske forskning på universitetsniveau.
Instituttet har været partner og sponsor på projektet.

Institut for Systembiologi