• CRISPR/Cas9 - Den Genteknologiske Revolution

    Introduktion

    Alt, der kan defineres som liv, har en enestående ting tilfælles. Alle de informationer, der danner de enkelte organismer, er kemisk lagret i et makromolekyle, som fungerer på den samme grundlæggende måde i mennesket og alle andre organismer. DNA er det molekyle, der udgør vores genetiske informationer igennem sin genetiske kode. Det har en enorm betydning, at livet deler grundlagene for denne genetiske kode, da det betyder, at det er muligt at tage informationer fra én organisme og bruge dem i anden. Gensplejsning gør det muligt at flytte rundt på gener og styre deres aktivitet, hvormed vi faktisk kan kontrollere livets udformning. Genteknologi kan bruges til at skabe uanede mængder af genetiske kombinationer, der eksempelvis kan give os bedre fødevarer, bruges til produktion af medicin eller ligefrem kurere sygdomme. Det er kun fantasien og teknologien, der sætter grænser for mulighederne.

    En af de nyeste teknologier er CRISPR/Cas9, der har et stort potentiale, fordi det giver muligheden for at kunne klippe i DNA med enorm præcision og effektivitet, på en lettere og billigere måde. Denne teknologi er baseret på ét protein, kaldet Cas9. Proteinet er styret af et stykke RNA, kaldet guide RNA (gRNA), som giver proteinet dets egenskab til at nøjagtigt identificere DNA-sekvenser, binde sig til dem og klippe dem over, ved at danne præcise dobbeltstrengsbrud i DNA. Grunden til, at Cas9 har så stort potentiale er, at proteinet let kan omprogrammeres til at ramme nye DNA-sekvenser ved at udskiftning af det gRNA, der styrer proteinet. Cas9’s nøjagtige dannelse af dobbeltstrengsbrud tillader eksempelvis indsættelse af DNA-sekvenser i helt bestemte positioner, hvormed man kan opnå nye genfunktioner. Man kan også danne mutationer, der kan deaktivere specifikke gener og dermed fjerne specifikke egenskaber fra organismen.

    CRISPR-teknologien stammer fra prokaryoters immunforsvar, hvor det eksempelvis fungerer som beskyttelse imod virusangreb. CRISPR er en forkortelse af Clustered Regularly Interspaced Short Palindromic Repeats, hvilket beskriver den genomiske struktur af det prokaryote immunforsvar. CRISPR associerede (Cas) proteiner er immunsystemets funktionelle enheder. Den mest anvendte type Cas9 indenfor genteknologi stammer fra bakterien Streptococcus pyogenes.

    CRISPR/Cas9 er et pragteksemplar på et bioteknologisk værktøj, der er udviklet fra naturens egne funktionsmekanismer.

    I dette projekt vil der ses på hvordan CRISPR/Cas9-genteknologien virker, og hvordan vi kan bruge den til at genmodificere organismer, kontrollere geners ekspression, kurere genetiske sygdomme ved genterapi, og selv genmodificere hele arter ved brug af gene drives – eksempelvis udrydde malariamyggen. Der vil også tages et blik på det prokaryote immunforsvar, som CRISPR/Cas9 stammer fra.

    Grundteorien vil give en god forståelse for den molekylære funktion af CRISPR/Cas9 og hvordan vi kan udnytte den til genmodifikation. Herefter kan de forskellige cases læses uafhængigt af hinanden.

  • Grundteori - CRISPR/Cas9

    Cas9-proteinet danner præcise dobbeltstrengsbrud i selvvalgte positioner i DNA. Placeringen af dobbeltstrengsbruddet afhænger af det valgte gRNA, som er bundet i Cas9. Dobbeltstrengsbrud er oplagte muligheder for modificering af DNA-sekvensen. Det er enten muligt at indsætte sekvenser i dobbeltstrengsbrud eller lave mutationer i sekvensen, hvilket udføres ved udnyttelse af cellens egne DNA-reparationsmekanismer. Selve genmodifikationen ligger altså i, hvordan man udnytter dobbeltstrengsbrudene. Dobbeltstrengsbrudenes nøjagtige placering er helt essentiel for resultatet, da man gerne vil ramme specifikke gener eller regulatoriske sekvenser i DNA’et.
    Dobbeltstrengsbrud i DNA er en meget alvorlig situation for en celle, hvis de ikke er skabt under cellens egne kontrollerede processer. Et dobbeltstrengsbrud adskiller genomet rent fysisk, idet begge DNA-strenge brydes, og kan have alvorlige konsekvenser, såsom celledød. Derfor vil cellen gøre alt for at samle DNA’et igen med sine reparationsmekanismer. De to hovedtyper af reparationssystemer er non-homologous end joining (NHEJ) og homology directed repair (HDR), der reparerer dobbeltstrengsbrud ved hver deres mekanisme.

    Figur 1 – Cas9 danner dobbeltstrengsbrud i DNA ud fra placeringen valgt med det bundne gRNA. Dobbeltstrengsbrud repareres enten af non-homologous end joining (NHEJ) eller homology directed repair (HDR). Disse reparerer DNA ved to forskellige mekanismer og derfor kan man opnå forskellige resultater af reparationen. NHEJ samler enderne af DNA, men kan begå fejl, der danner mutationer. Foregår NHEJ korrekt, vil Cas9 blot kunne genkende DNA-sekvensen igen og danne et nyt brud. Dette gentager sig indtil en mutation er dannet. HDR anvender en DNA-skabelon til at reparere bruddet. Denne DNA-skabelon kan man selv bestemme indholdet af, så længe den har homologe ender til dobbeltstrengsbruddet. Man udnytter disse reparationssystemer til genmodificering i den position, hvor man har placeret sit dobbeltstrengsbrud.

    Non-homologous end joining (NHEJ) er en reparationsmekanisme, der sammensætter de to løse ender af DNA-strengene efter et dobbeltstrengsbrud. DNA-enderne sammensættes af enzymet DNA ligase IV. Denne reparationsmekanisme er meget effektiv, men kan forårsage mutationer. Disse mutationer kan både være insertioner (indsættelse) og deletioner (fjernelse) af basepar, som begge har potentiale til at forårsage frame-shift mutationer. Proteinkodende DNA aflæses som codons, som er intervaller af 3 nukleotider. En ændring der ikke følger dette system vil forstyrre fortolkningen af koden. DNA-læserammen forskydes af frame-shift mutationer, da der indsættes eller fjernes basepar i et antal, der ikke er et multiplum af 3. Det kan også ske, at frame-shift mutationen tilfældigvis indfører et stop-codon i koden, der stopper proteintranslationen utidigt. Mutationerne betyder, at DNA-sekvensen ikke længere kan aflæses korrekt og at proteinet, som sekvensen koder for, vil blive dysfunktionelt.

    Reparationen er sandsynligvis succesfuld i de fleste tilfælde. Den vigtige pointe er her, at Cas9 kan genkende den reparerede sekvens igen og lave et nyt dobbeltstrengsbrud, som igen kan blive repareret af NHEJ. Denne proces vil gentage sig, indtil NHEJ fejlagtigt laver en mutation i DNA-sekvensen. Så vil Cas9 ikke længere kunne genkende DNA-sekvensen, da den er permanent ændret med en mutation. Det smarte er, at mutationen er blevet indført på positionen, som var bestemt ved det selvvalgte gRNA. På denne måde kan man anvende Cas9 til dannelse af permanente mutationer i selvvalgte positioner i en DNA-sekvens. Dette er illustreret på figur 1.

    Homology directed repair (HDR) er en mere nøjagtig og kompliceret reparationsmekanisme, der anvender en DNA-sekvens som skabelon til at reparere et dobbeltstrengsbrud. Her indsættes en DNA-sekvens i bruddet, som er lig den anvendte skabelon. DNA-skabelonen skal have ender, der er homologe til enderne af dobbeltstrengsbruddet. Det betyder, at enderne har overlappende sekvenser mellem de to stykker DNA. Dette er smart, da der ofte findes flere kopier af de samme DNA-sekvenser i cellen. Herved kan et stykke identisk DNA findes ud fra de homologe ender og fungere som skabelon til genskabelsen af den originale sekvens efter et brud.
    HDR kan kun basere sin reparation på baggrund af de homologe ender af DNA-skabelonen, men ikke hvad der er imellem. Derfor kan man få reparationssystemet til at indsætte selvvalgte DNA-sekvenser, så længe de har homologe ender. Når man vil indsætte en sekvens i en bestemt position i DNA’et, danner man først dobbeltstrengsbruddet med sit Cas9. Ved at indføre en kunstig DNA-skabelon med homologe ender, kan man indsætte sekvensen i bruddet ved udnyttelse af reparationsmekanismen. Dette er illustreret på figur 1.

     

    Kort opsummeret kan det siges, at NHEJ kan samle DNA-enderne og eventuelt indføre små tilfældige mutationer. HDR kan genoprette den originale DNA-sekvens eller indføre en ny DNA-sekvens afhængigt af en DNA-skabelon med homologe ender til dobbelstrengsbrudet.

    Beskrivelse af Cas9-proteinet og identifikation af en specifik DNA-sekvens

    Dette genmodificeringssystem behøver kun to komponenter for at være aktivt, nemlig Cas9-proteinet og det valgte gRNA.

    Cas9-proteinet målsøger specifikke DNA-sekvenser ved at bruge gRNA, som er bundet i Cas9 og kan udskiftes. Dette gRNA har en sekvens på 20 nukleotider i den ene ende, der er komplementær til den målsøgte DNA-sekvens, som tilsvarende også er 20 nukleotider lang. De 20 nukleotider i gRNA genkender DNA-sekvenserne ved at binde sig til dem og derfor bestemmer gRNA hvilken DNA-sekvens Cas9 eftersøger. På denne måde kan man omprogrammere Cas9 til at genkende forskellige DNA-sekvenser, ved at vælge sekvensen af det bundne gRNA.

    Der findes et yderligere krav udover gRNA-sekvensen. Den målsøgte DNA-sekvens skal indeholde en PAM-sekvens. Denne er 5’-NGG-3’ for Cas9 fra S. pyogenes, hvor den første base (N) kan være enhver base, efterfulgt af 2 guanin-baser i 5’ til 3’ retningen af DNA-strengen. PAM-sekvensen ligger altid på den modsatte streng end den hvorpå de 20 nukleotider der genkendes ligger. De 20 nukleotider skal ligge i direkte forlængelse af PAM-sekvensen.

    På figur 2 ses hvordan kan målsøge forskellige DNA-sekvenser, ved udskiftning af gRNA i Cas9 og placeringen af PAM-sekvensen i forhold til de målsøgte 20 nukleotider.

    Figur 2 – Omprogrammering af Cas9 med forskellige gRNA. Cas9-proteinet genkender forskellige DNA-sekvenser alt efter de 20 nukleotider i det bundne gRNA. Der skal være en 5′-NGG-3′ PAM-sekvens tilstede på den modsatte streng ved siden af de 20 eftersøgte nukleotider, for at genkendelsen af DNA-sekvensen kan finde sted.

    Cas9-proteinstruktur

    Proteinet består af to hoveddele, identifikationsdelen (REC), der er ansvarlig for identifikationen af den specifikke DNA-sekvens og nukleasedelen (NUC), som står for kløvningen af DNA-sekvensen. Et PAM-interagerende (PI) domæne sidder i NUC og er delen af Cas9, som genkender PAM-sekvensen 5’-NGG-3’. REC fastholder gRNA i den ene ende, således at de genkendende 20 nukleotider i den anden ende er blottet på overfladen af Cas9, hvilket muliggør identifikationen af den specifikke DNA-sekvens. Når gRNA har bundet sig til det eftersøgte DNA, befinder det sig i grænsefladen mellem REC og NUC, hvilket kan ses på figur 3.

    At Cas9 er en endonuklease, betyder at den kan spalte inde midt i DNA og ikke blot i enderne. I NUC haves to endonuklease-domæner, der kløver hver deres streng af det eftersøgte DNA. HNH-domænet kløver den DNA-streng, som indeholder sekvensen der eftersøges af gRNA. RuvC-domænet kløver den modsatte DNA-streng, som indeholder PAM-sekvensen. Til sammen danner de to endonukleaser det præcise dobbeltstrengsbrud i DNA’et.

    Figur 3 – Strukturen af Cas9 med gRNA. Cas9 består af 2 hoveddele, kaldet REC og NUC. gRNA er bundet i REC, der står for identifikation af DNA-sekvenser. NUC indeholder et domæne der genkender PAM-sekvensen (5’-NGG-3’). NUC står for kløvningen af DNA og har 2 endonuklease-domæner, hvoraf RuvC klipper DNA-strengen med PAM-sekvensen og HNH klipper DNA-strengen der genkendes af gRNA. Dobbeltstrengsbruddet dannes mellem 3. og 4. bp efter PAM-sekvensen, indeni den genkendte sekvens.

    Denne komplekse proteinstruktur udgør altså et biokemisk apparat, der er designet til at identificere DNA-sekvenser nøjagtigt, og derefter spalte dem præcist.

    Mekanismen bag identifikationen af DNA-sekvenser og dannelsen af dobbeltstrengsbrud

    Nu da Cas9 proteinstrukturen er beskrevet, kan der tages et nærmere blik på hvordan de enkelte dele udnyttes i dannelsen af et dobbeltstrengsbrud i en specifik DNA-sekvens. Denne interaktion er meget vigtigt for Cas9, da det er den som man udnytter, når man bruger Cas9 som et genteknologisk værktøj. De følgende trin beskriver identifikationen og spaltningen af DNA, samt de krav der skal opfyldes, for at det er muligt.

    1. Cas9 finder DNA
      Cas9-proteinet, med sit gRNA, rammer tilfældigvis et stykke DNA. Forbindelsen mellem DNA og Cas9 skabes altså ved en tilfældig kollision.
    1. PAM-genkendelse
      PAM-sekvensens tilstedeværelse er en nødvendighed for at Cas9 vil kunne genkende DNA-sekvensen, og dermed søger den primært efter disse. Det PAM-interagerende (PI) domæne binder sig til PAM-sekvensen, 5’-NGG-3’, hvilket forårsager at de to DNA-strenge skilles ad. Ifølge eksperimentelle resultater er denne interaktion absolut nødvendig og indleder identifikationen af de 20 nukleotider i DNA-sekvensen. Uden en PAM-sekvens, kan intet ske. Hver gang Cas9 finder en PAM-sekvens, afprøver proteinet om gRNA-sekvensen passer med resten af DNA-sekvensen.
    1. Identifikation: skabelsen af gRNA-DNA-bindingen
      Bindingen af PAM-sekvensen i PI-domænet medfører at bindingen mellem DNA-strengene brydes og tillader at gRNA-sekvensen kan sammenlignes med DNA-sekvensen. Dette giver anledning til, at gRNA’ets 20 nukleotider kan danne hydrogenbindinger til DNA’et, som nu ligger imellem REC og NUC i Cas9 proteinet. Bindingen mellem gRNA og DNA sker ved normal Watson-Crick baseparring, som starter ved PAM-sekvensen og fortsætter ud af DNA-strengen. Dette danner gRNA-DNA-bindingen, hvis formation medfører at Cas9 binder sig fast om DNA-strengene. En succesfuld bindingsdannelse mellem gRNA og DNA er ensbetydende med en korrekt identifikation af DNA-sekvensen.
      De sidste nukleotider i den genkendte DNA-sekvens, længst fra PAM-sekvensen, kan afvige fra gRNA-sekvensen med acceptable mismatches, da disse ikke har lige så stor betydning for bindingsdannelsen. Altså, kan DNA-sekvenser, der afviger en smule fra gRNA-sekvensen stadigvæk genkendes.
    1. Spaltning af DNA: Endonuklease-domænerne aktiveres
      Den succesfulde dannelse af gRNA-DNA-bindingen, samt binding til den korrekte PAM-sekvens er et krav for aktiveringen af endonukleaserne i NUC-delen af Cas9. RuvC kløver DNA-strengen med PAM-sekvensen og HNH kløver DNA-strengen, der indgår i gRNA-DNA-bindingen. Kløvningen sker i begge strenge mellem det 3. og 4. basepar efter PAM-sekvensen, hvilket skaber et dobbeltstrengsbrud i DNA’et. Bruddet forekommer derved inde i den sekvens, som blev genkendt af Cas9. Herefter giver Cas9 slip på DNA-strengene og er klar til at genkende flere sekvenser.

    Opsummering af Cas9-interaktion med DNA
    De vigtigste informationer for dannelsen af dobbeltstrengsbrud med Cas9 kan ses på figur 4.

    • I DNA-sekvensen findes en PAM-sekvens, 5’-NGG-3’, der genkendes af Cas9 PI-domænet. Denne er absolut nødvendig for efterfølgende identifikation med gRNA og endonuklease-aktivitet.
    • Der haves en 20 nukleotider lang sekvens, der genkendes af gRNA.
    • PAM-sekvensen aflæses på den ene streng, mens identifikationen med gRNA sker på den anden streng.
    • Cas9 danner sit dobbeltstrengsbrud mellem det 3. og 4. basepar efter PAM-sekvensen, hvilket er inde i den genkendte sekvens.

    Figur 4 De vigtige elementer for Cas9 i genkendelsen og kløvningen af en specifik DNA-sekvens. Tilstedeværelsen af PAM-sekvensen 5’-NGG-3’ tillader at de efterfølgende 20 nukleotider på den modsatte streng kan genkendes af det bundne gRNA i Cas9. Cas9 danner dobbeltstrengsbruddet mellem det 3. og 4. basepar efter PAM-sekvensen indeni den genkendte sekvens.

    Molekylære strategier med Cas9

    Man kan anvende Cas9 på mange forskellige måder, som resulterer i forskellige molekylære ændringer af DNA-sekvensen. Der vil nu tages et nærmere blik på nogle af de grundlæggende strategier, som værktøjet kan bruges til og hvordan de resulterende DNA-sekvenser vil se ud. De forskellige strategier afhænger af hvordan man har designet sit gRNA og hvilken reparationsmekanisme man udnytter. Ved at variere hvilke komponenter man anvender, kan forskellige resultater af genmodifikationen opnås. Det er eksempelvis muligt at udnytte flere stykker gRNA. Denne taktik kaldes multiplexing og tillader at man kan modificere flere DNA-sekvenser på én gang eller klippe store stykker DNA ud. Tilføjer man en DNA-skabelon, kan man opnå indsættelser af DNA-sekvenser.

    De molekylære strategier defineres af hvordan DNA-sekvensen bliver påvirket.

    Destruktion
    Ødelæggelse af genstrukturen ved små insertioner eller deletioner (samlet kaldet indels) i DNA-sekvensen. Cas9 anvendes med gRNA til at udvælge lokationen for dobbeltstrengsbruddet, hvorefter en indel opstår som resultat af mutationel NHEJ-reparation af bruddet. Multiplexing med flere stykker gRNA kan anvendes til at lave flere destruktioner af det samme gen eller forskellige gener på én gang. Se figur 5.

    Figur 5 – Destruktion af en DNA-sekvens ved brug af Cas9 og gRNA, samt udnyttelse af non-homologous end joining (NHEJ).

    Insertion
    Indsættelse af større sekvenser i genomet. Cas9 anvendes sammen med ét gRNA til at finde indsættelsespunktet, yderligere indføres en DNA-skabelon til indsættelse ved udnyttelse af HDR. Indsættes sekvensen midt i en anden sekvens, vil denne sekvens sandsynligvis ødelægges. Se figur 6.

    Figur 6  Insertion af en DNA-sekvens ved brug af Cas9, gRNA og en DNA-skabelon, samt udnyttelse af homology directed repair (HDR).

    Excision
    Deletion af større sekvenser. Cas9 anvendes sammen med to stykker gRNA, der hver især markerer endepunkterne for den sekvens man vil fjerne. Efter excisionen af sekvensen, kan det større brud eksempelvis repareres ved NHEJ, der samler de to endepunkter. Se figur 7.

    Figur 7 – Excision af en DNA-sekvens ved brug af Cas9 og to stykker gRNA, samt udnyttelse af non-homologous end joining (NHEJ).

    Erstatning
    Større sekvens substitueres med en anden sekvens. Cas9 anvendes med to gRNA, der hver især markerer endepunkterne for sekvensen der skal erstattes, som gjort ved excision. En DNA-skabelon indføres, ligesom ved insertion, der indsættes i det større brud ved udnyttelse af HDR. Se figur 8.

    Figur 8 Erstatning af en DNA-sekvens ved brug af Cas9, to stykker gRNA og en DNA-skabelon, samt udnyttelse af homology directed repair (HDR).

    Påvirkning af genfunktioner

    De molekylære ændringer af genernes DNA-sekvenser har direkte indflydelse på funktionen af generne. Man kan både fjerne genfunktionalitet, ved gen knock-outs, og tilføje nye funktioner til et gen, ved gen knock-ins. Når man arbejder med genmodifikation, er man interesseret i, hvordan ændringer i genotypen udtrykker sig i fænotypen af organismen. Disse ændringer af organismen kan være meget voldsomme, eller næsten usynlige, afhængigt af genets funktion.

    Gen knock-out

    Gener koder for proteiner, som har en bestemt funktion. Hvis man ødelægger genet, forhindrer man produktionen af proteinet, hvormed man ikke vil observere den bestemte funktion. Mutationelle indgreb kan forårsage loss-of-function mutationer. En loss-of-function mutation medfører et knock-out af et gen, som er karakteriseret ved, at genet producerer dysfunktionelt protein eller ikke producerer nok protein. Dermed reduceres eller fjernes funktionen af proteinet. Med gen knock-outs er det dermed muligt at forhindre specifikke funktioner og fænotypiske træk, ved at påvirke funktionen af de udøvende proteiner. Man kan eventuelt lave et knock-out med Cas9 ved destruktion eller excision. Knock-outs kan også udføres med en insertion midt i en gensekvens eller ved erstatning af noget af sekvensen.

    Ved at lave knock-out mutanter og sammenligne dem med vildtyper (ikke-modificerede organismer), hvor genet stadigvæk er funktionelt, kan man undersøge et gen og dets tilhørende proteins funktioner i en given organisme.

    Et eksempel på anvendelsen af gen knock-outs, er ændringen af en organismes metabolisme. Ofte bliver cellens molekyler produceret af en lang række processer, kaldet metaboliske pathways. Hvert trin af processen er tilknyttet bestemte enzymer, der katalyserer modifikationen ved det enkelte trin. Enzymer er proteiner og derfor kodet af gener, hvormed det er muligt at lave knock-outs af dem. Et knock-out i et gen, der koder for et enzym i den metaboliske pathway, vil betyde at processen vil stoppe ved det trin som enzymet katalyserer, grundet manglen på funktionelt enzym. Det kunne være, at man var interesseret i at få fat i et stof, som ikke var produktet af den metaboliske pathway, men blot et mellemtrin. Herved kunne man lave et knock-out i genet for enzymet, der videreomsætter det ønskede stof, hvormed stoffet vil ophobe sig ved det bestemte trin, da det ikke kan blive videreomsat i den metaboliske pathway.

    Gen knock-in

    Et gen knock-in er indsættelsen af en ny DNA-sekvens på en helt specifik position i DNA’et. Denne DNA-sekvens kan indsættes i forlængelse med det DNA, der allerede haves eller erstatte en DNA-sekvens. Et knock-in kan medføre en gain-of-function mutation, hvor man ved indsættelsen af en DNA-sekvens ændrer funktioner eller tilfører funktioner til proteinet, som genet koder for. Man kan også forstærke funktioner, ved at forøge genets ekspression, hvormed der kommer mere protein. Ved knock-in af hele kodende sekvenser, kan man indføre nye proteiner og dermed nye funktioner til organismen. Knock-ins kan udføres med Cas9, ved at lave en insertion eller en erstatning af en DNA-sekvens.

    Knock-ins har været brugt meget til at lave sygdomsmodeller, hvor man undersøger geners effekt på en sygdom. Knock-ins kan også indsætte reporter gener i forlængelse med andre gener, som man vil undersøge. Reporter gener producerer et protein, som nemt kan ses er blevet produceret. Da reporter genet er knyttet til et andet gens transskription, kan man se hvor meget protein der bliver produceret fra det undersøgte gen. Et klassisk eksempel på en reporter er green fluorescent protein (GFP), der er et grøntlysende protein. Ved at knytte genet for GFP til et andet gen ved et knock-in, kan man se hvor meget det undersøgte gen bliver udtrykt og hvorhenne i organismen proteinet er, ud fra observation af det lysende protein.

    Design af sgRNA

    For at udføre genmodifikation med Cas9 i et gen i en given organisme, må man først designe gRNA, der kan genkende sekvensen. Single chimeric guide RNA (sgRNA) er en type kunstigt gRNA, som man selv kan designe alt efter hvilke DNA-sekvenser, der skal modificeres.
    Den mest anvendte type Cas9 stammer fra S. pyogenes immunforsvar. Her bruger Cas9 en type gRNA som består af et kompleks af to RNA-fragmenter. Det kunstigt fremstillede sgRNA er en fusion af disse to RNA-fragmenter. I 5’-enden af sgRNA haves det 20 nukleotider lange segment, der anvendes til at identificere DNA-sekvenser. Disse udvælges blot som komplementære til den DNA-sekvens man vil modificere. Den anden ende af sgRNA har en fast struktur, som tillader at Cas9 kan binde sig til det.

    Figur 9 – Strukturen af sgRNA, hvor identifikationssekvensen på 20 nukleotider i 5′-enden kan varieres efter eget valg, sådan at forskellige DNA-sekvenser kan eftersøges og blive kløvet af Cas9. ‘N’ er ensbetydende med, at der kan være en enhver nukleotid på positionen. Den faste struktur mod 3′-enden bruges af Cas9 til at binde gRNA.

    En strategi for design af sgRNA kunne være:

    1. Identifikation af et gen, som skal modificeres i en given organisme. Genets DNA-sekvens skal være kendt, for at kunne designe sgRNA til sekvensen. Hvis genets DNA-sekvens ikke er kendt, kan man først sekventere genet.

     

    1. Søgning efter PAM-sekvenser (5’-NGG-3’). Det er vigtigt at huske, at PAM-sekvensen stadigvæk skal genkendes af Cas9, og dermed skal man tage denne med i overvejelserne, når man designer sgRNA. PAM-sekvenser skulle gerne eksistere i stor grad, da et krav om en vilkårlig nukleotid efterfulgt af to guanin-nukleotider ikke er stort. Det er faktisk meget uspecifikt, når man taler om DNA-sekvenser, som kan være mange tusindvis af basepar lange. Teoretisk set, vil man kunne forvente at finde 5’-NGG-3’ for hvert 8. basepar, ved den antagelse at alle nukleotider optræder tilfældigt med lige stor sandsynlighed.

     

    1. Design af den 20 nukleotider identifikationssekvens. Nu skal der tages højde for PAM-sekvensen og dens placering. Her er det vigtigt at huske genkendelsesmekanismen for Cas9, da design af korrekt sgRNA er altafgørende for om genmodifikationen bliver en succes. Først findes DNA-sekvensen, som Cas9 skal binde til ud fra PAM-sekvensen og derefter oversættes sekvensen til den korresponderende sgRNA-streng.De vigtige informationer for identifikation med de 20 nukleotider er:

      PUT–  DNA-sekvensen ligger i direkte forlængelse af PAM-sekvensens 5’-retning.

      PUT–  DNA-sekvensen ligger på den modsatte streng af PAM-sekvensen.

      Placeringen af de 20 genkendte nukleotider kan ses på figur 4.
      Da sekvensen nu er identificeret, skal sekvensen blot oversættes ved brugen af viden om Watson-Crick baseparring. Her husker man, at Adenin (A) og Thymin (T) er et par, og at Cytosin (C) og Guanin (G) er et par. For RNA gælder det at Thymin skiftes ud med Uracil (U), der også danner par med Adenin.
      Eksempelvis kunne man have fundet DNA-sekvensen 3’-ACTGGCTAGTACTGCAATGC-5’, denne ville blive oversat til de 20 nukleotider af sgRNA på denne måde:

      DNA-sekvens:                     3’-ACTGGCTAGTACTGCAATGC-5’
      PUT_CHARACTERS_HERECHARACTERS
      sgRNA-sekvens:                 5’-UGACCGAUCAUGACGUUACG-3’

      Denne sekvens kan dermed indsættes som de 20 nukleotider i ens sgRNA, angivet med ’N’ i figur 9. Dermed har man designet sit sgRNA færdigt, som nu kan genkende DNA-sekvensen.

    
    

    Det designede sgRNA kan nu blive fremstillet, hvilket let kan gøres ved at indsende sgRNA-sekvensen til et firma, der specialiserer sig i at lave syntetisk RNA. Der findes flere versioner af gRNA, hvor man har prøvet at ændre længderne af de forskellige segmenter for at optimere effektiviteten og specificiteten for Cas9-identifikationen. Man har før brugt den naturlige form af gRNA bestående af RNA-komplekser til genmodificering, hvilket ikke er lige så effektivt. Heldigvis er det også mere praktisk at lave et helt stykke syntetisk RNA, der er klar til brug, fremfor at skulle rode med produktionen af flere stykker RNA, der først skal danne komplekser med hinanden før brug.

    Leveringsmetoder

    For at kunne udføre en genmodificering, må Cas9 og sgRNA indføres i cellerne gennem cellemembranen og trænge ind i cellekernen til det genomiske DNA. Denne levering kan foregå ved forskellige tilgange. Cas9 kan indføres som kodende DNA, mRNA eller færdigt protein. sgRNA kan indføres direkte i cellerne på RNA-form, eller kan kodes som DNA. Skal der udføres en insertion eller erstatning af en gensekvens, skal DNA-skabelonen også indføres. De forskellige metoder som genmodificeringssystemet kan leveres på, har forskellige fordele og ulemper, og man må derfor vælge den leveringsmetode, der passer bedst på den givne situation. Leveringen af genmodificeringssystemet kan gøres ved at designe en vektor, der indeholder alle komponenter af systemet. En sådan vektor er baseret på genetisk materiale, som har til funktion at kode for komponenterne og kunne levere dem samlet til cellerne, hvori modificeringen skal foregå.

    DNA-baseret levering: Plasmider

    Det er muligt at kombinere Cas9-kodende DNA (cas9-genet) og sgRNA-kodende DNA i et plasmid, som er et cirkulært stykke DNA. Dermed bliver hele systemet samlet i ét enkelt stykke DNA. Heri kan også en DNA-skabelon indkodes. Disse plasmider fungerer som vektorer for genmodificeringssystemet og kan fremstilles ved rekombinant DNA-teknologi. Overføres plasmidet til en organisme, bliver det udtrykt og dermed vil genmodificeringssystemet dannes og blive aktivt. Man får komponenterne udtrykt ved at indsætte promotere foran de kodende sekvenserne i plasmidet, som er regulatoriske sekvenser, der medfører transskriptionen af DNA’et. Disse plasmider designes specifikt efter den organisme, som man vil genmodificere, da forskellige organismer har forskellige måder at udtrykke DNA på. Promotorerne skal dermed også fungere i den givne organisme, for at de kan udtrykke genmodificeringssystemet fra plasmidet. Plasmidet bør ikke være replikativt, da den ellers kan kopiere sig selv til mange eksemplarer, hvilket ville være unødvendigt for genmodifikationen og kan være ufavorabelt for cellen. DNA-baseret levering ved et plasmid er illustreret på figur 10. Plasmidet skal generelt leveres til cellekernen, hvor komponenterne konstant transskriberes til RNA, altså Cas9-kodende mRNA og sgRNA. Her kan plasmidet ligge stabilt i en længere periode. mRNA’et translateres til Cas9-protein i cytoplasmaet, hvorefter det danner kompleks med det valgte sgRNA. Til sidst trænger Cas9 ind i cellekernen, hvor genmodificeringen af det genomiske DNA vil foregå.

    RNA-baseret levering

    Dette er en levering af Cas9-kodende mRNA og sgRNA. Her skal mRNA’et blot translateres til det færdige Cas9 protein i cytoplasmaet, hvorefter det kan danne kompleks med sgRNA. Det kan være fordelagtigt at mRNA er mere ustabilt end DNA, da translationen af Cas9 dermed kun er kortvarig. Dosen af Cas9 kan dermed reguleres mere end ved DNA-baseret levering, da et plasmid vil blive ved med at danne nyt mRNA, som vil danne mere Cas9. RNA-baseret levering er illustreret på figur 10. RNA’et leveres til cytoplasmaet, hvor det Cas9-kodende mRNA translateres. Efterfølgende kan Cas9-proteinet danne kompleks med sgRNA og trænge ind i cellekernen og foretage genmodificeringen, som ved DNA-baseret levering.

    Protein-baseret levering

    En direkte levering af det færdigproduceret Cas9 i kompleks med sgRNA, betyder at genmodificeringen kan foregå øjeblikkeligt efter leveringen, da der hverken skal foregå transskription eller translation. Denne metode har vist sig at give en mere effektiv og præcis genmodifikation, men det kan være svært at levere et stort protein, i forhold til at levere RNA eller DNA. Protein-baseret levering giver den mest kortvarige tilstedeværelse af Cas9, da proteinet ikke kontinuerligt bliver dannet ud fra indført RNA eller DNA, hvilket menes at sænke risikoen for fejl og muligvis mindske uønskede immunologiske responser. Protein-baseret levering er illustreret på figur 10. Det leverede Cas9 med sgRNA skal blot trænge ind i cellekernen, hvorinde genmodificeringen foretages, som ved de andre leveringsmetoder.

    Figur 10 – Forskellige leveringsmetoder for genmodificeringssystemet. Både Cas9 og sgRNA skal leveres til cellen der skal genmodificeres, hvilket kan gøres ved flere forskellige formater; DNA, RNA eller protein. Afhængigt af metoden, kan cellens egen transskription og translation udnyttes til at danne det aktive Cas9 med gRNA.

    Fysiske leveringsmetoder

    DNA-, mRNA- og protein-baseret levering kan foregå ved metoder som mikroinjektion, elektroporation, og ved pakning i nanopartikler. Mikroinjektion foregår ved en manuel injektion af genmodificeringssystemet i en enkelt celle, med en mikroskopisk nål, der kan gennemtrænge cellemembranen. Elektroporation er en proces hvor cellemembraner gøres mere permeable, ved at udsætte cellerne for et elektrisk felt. Genmodificeringssystemet kan passere membranen fordi den bliver ustabil under elektroporationen. Nanopartikler, der kan passere cellemembranen, kan bruges til at indpakke genmodificeringssystemet. Eksempelvis kan lipide nanopartikler der indeholder genmodificeringssystemet optages af cellen ved endocytose.

    Viral leveringsmetode

    Der findes virale vektorer, som er uskadeliggjorte viruspartikler, der kan levere genetisk materiale til celler. Virus er specialiseret i at inficere celler, hvilket de gør ved at binde sig til specifikke overfladeproteiner af celler og indføre genetisk materiale, som overtager cellefunktioner og sørger for reproduktionen af nye viruspartikler. Virale vektorer modificeres så de ikke er skadelige og ikke kan reproducere sig selv. De tilføres i stedet selvvalgt genetisk materiale, der koder for sgRNA og Cas9. De virale vektorer kan stadigvæk binde sig til cellerne, og overfører nu det selvvalgte genetiske materiale, og helst uden at der forekommer bivirkninger og immunologisk respons. En udfordring ved virale vektorer, kan være manglen på plads i viruspartiklen til alt det DNA man vil levere, hvormed man må planlægge hvordan man pakker sin virus. Den mest anvendte virale vektor brugt til levering af Cas9 er adeno-associeret virus (AAV).

    Komplikationer

     

    Off-target effekter og mulige løsninger

    Det første problem man møder ved genmodifikation med Cas9 er off-target effekter. Disse ses når Cas9-proteinet interagerer med en anden sekvens, end den man havde planlagt at modificere. Det er klart, at dette kan skabe store problemer, da eksempelvis vigtige gener kan blive ødelagt ubevidst. Problemet opstår hovedsageligt fordi sekvensen, som det givne sgRNA genkender, findes flere steder i genomet, eller at der findes sekvenser, der minder tilstrækkeligt om den. De alternative PAM-sekvenser 5’-NAG-’3 og 5’-NGA-3’ kan også blive genkendt i mindre grad, hvilket sænker specificiteten. Off-target effekter er vanskelige at forudse for de enkelte sekvenser i et genom, hvilket gør usikkerheden større ved brugen af Cas9. Man kan reducere mængden af off-target effekter ved at prøve at sikre sig, at sit sgRNA er mest muligt unikt i forhold til én sekvens i genomet. Med specificiteten fra PAM-sekvensen og de 20 genkendende nukleotider, er det let at opnå i organismer med små genomer, men kan være langt mere kompliceret i komplekse organismer med store genomer, såsom mennesker.

    Cas9-nickasen (Cas9n) er en alternativ modificeret version af Cas9-proteinet, som kan reducere off-target effekter betydeligt. Her er enten RuvC- eller HNH-nukleasen deaktiveret, ved punktmutationer i den kodende DNA-sekvens for Cas9-genet. Dette betyder, at Cas9-nickasen ikke laver dobbeltstrengbrud, men i stedet såkaldte nicks, der kun er brud i den ene DNA-streng. Funktionsmekanismen er fuldkommen ens med den naturlige form af Cas9 bortset fra, at det kun er en enkelt DNA-streng, der klippes i. Pointen er, at man til dannelsen af et DNA-brud, så skal anvende to Cas9-nickaser, der hver især skal genkende hver af de to DNA-strenge med forskellige sgRNA. Der skal altså ske dobbelt så meget identifikation af DNA-sekvenser i forhold til brugen af naturlig Cas9, for at opnå samme resultat. Herved opnås en forøgelse af præcisionen. Hvis Cas9-nickasen fejlagtigt genkender et andet sted, vil der kun laves et nick i den ene DNA-streng, som repareres langt mere præcist end et dobbeltstrengsbrud. Dobbeltstrengsbrud dannet af to nicks kommer til at have løse ender, men kan stadigvæk udnyttes til genmodificering. Se figur 11. Med denne tilgang øger man nøjagtigheden af genkendelsen, da flere identifikationer kræves, mens man samtidigt sænker off-target effekters betydning, da off-target nicks ikke er lige så alvorlige som off-target dobbeltstrengsbrud. I et forsøg med anvendelsen af Cas9-nickase, blev specificiteten forøget 1500 gange i forhold til naturlig Cas9.

    Figur 11 – Cas9-nickasen (Cas9n) har kun ét fungerende endonukleasedomæne, HNH eller RuvC, og kan derfor bruges til at lave nicks i enkelte DNA-strenge. På denne måde kan man bruge to Cas9n til at lave ét dobbeltstrengsbrud, og dermed sikre en højere præcision, da der skal bruges to forskellige sgRNA, A og B, der binder omtrent det samme sted. Der skal altså ske mere korrekt sekvensidentifikation, før man opnår et dobbeltstrengsbrud.

    SpCas9-HF1 (Streptococcus pyogenes Cas9 High Fidelity 1) er en variant af Cas9, som sænker off-target effekter, men bevarer effektiviteten af genmodificering i de valgte DNA-sekvenser, som man har designet sit sgRNA til at ramme. For SpCas9-HF1 betyder alle 20 nukleotider i genkendelsessekvensen mere og mismatches er ikke accepteret, fremfor at det primært er de første nukleotider efter PAM-sekvensen, som betyder mest. Der kræves altså et bedre match, før SpCas9-HF1 binder sig, og dermed undgås off-target effekter, som er grundet manglende specificitet. SpCas9-HF1 er dannet ved at udskifte 4 specifikke aminosyrer i Cas9 ved mutationer. Cas9n og SpCas9-HF1 er gode eksempler på hvorledes man kan manipulere med proteinstrukturen af Cas9, for at forbedre præcisionen af genmodifikationer. En anden lovende tilgang til at undgå disse ufavorable off-target effekter er igennem bioinformatikken, hvor man ved hjælp af computeralgoritmer og databehandling kan forudse hvilke sgRNA-sekvenser, der giver bedste resultater. Denne computer-tilgang til genetikken tillader behandling af store mængder genetisk information, og spiller allerede nu en stor rolle i moderne genteknologi. Der findes op til flere online algoritmer, der prøver at forudse off-target effekter ud fra genetisk data.

    NHEJ sænker effektiviteten af homology directed repair

    I eukaryoter, som svampeceller og dyreceller, er NHEJ en dominerende reparationsmekanisme i behandlingen af et dobbeltstrengsbrud. Dette betyder, at effektiviteten af indsættelse af DNA-sekvenser begrænses ved genmodificering, da HDR undertrykkes. For at opnå en højere effektivitet af genmodificering med sekvensindsættelser, kan man hæmme NHEJ midlertidigt, således at HDR kan anvendes. Der findes forskellige metoder, hvorpå man kan hæmme NHEJ midlertidigt. Dette opnås, ved at hæmme aktiviteten af de enzymer, der udfører reparationen. Når NHEJ er hæmmet, bør genmodifikationen foregå, da HDR har sin største effektivitet her. Efterfølgende bør NHEJ reparationssystemet genaktiveres, da et permanent blokeret NHEJ-system svækker organismens naturlige forsvar overfor DNA-skader, hvilket ikke er favorabelt. Det lykkedes et hold forskere at øge effektiviteten af HDR 8 gange i menneskeceller, ved at midlertidigt hæmme NHEJ, hvilket bekræfter at det er en vigtig faktor at tage højde for.

    Cas9-baseret knock-out af albA-genet i Aspergillus aculeatinus

    Et gen knock-out ved destruktion af en gensekvens i en metabolisk pathway til undersøgelse af fænotypen.  

    Den filamentiøse svamp Aspergillus aculeatinus har en overflade bestående af mange spore, som kan falde af, flyve væk og blive til nye svampe. Disse spore indeholder et pigment, der giver svampen sin mørke farve. Dette pigment produceres ved en metabolisk pathway af flere enzymer, kaldet polyketid-syntaser. Et af disse enzymer i pathwayen kodes af albA-genet, hvormed et knock-out af dette gen med en destruktion af sekvensen burde stoppe produktionen af det færdige pigment. I så fald må svampen miste sin mørke farve. For at undersøge dette, blev der fundet en PAM-sekvens og en tilhørende 20 nukleotider lang sekvens i albA-genet til genkendelse med Cas9 og sgRNA.  Herudfra blev der designet sgRNA, som sammen med Cas9-genet blev indsat i et plasmid designet til svampe. Dette plasmid blev indført i A. aculeatinus ved en midlertidig nedbrydning af deres cellemembran. En oversigt over forsøgsresultaterne kan ses på figur 12. I figuren kan det tydeligt ses, at der er en fænotypisk forskel på vildtypesvampen og den genmodificerede mutantsvamp. Vildtypen indeholder det mørke pigment, mens mutanten mangler pigmentet, hvormed den er hvid. Tages et nærmere kig på svampenes spore under et mikroskop, kan det ses at mutanten ikke producerer det sorte pigment i sporerne længere. Sekventering af DNA-sekvenserne for området som Cas9 ramte, viser at der er sket en deletion af 8 basepar i mutanten, hvilket er ensbetydende med en frame-shift mutation. Dette må være grundet en mutationel NHEJ-reparation af det dobbeltstrengsbrud, som Cas9 har forårsaget. Mutationen er en loss-of-function mutation, der har medført et dysfunktionelt enzym, hvilket har stoppet produktionen af mørk pigment. Denne implementering af CRISPR/Cas9 i A. aculeatinus blev udført på DTU Bioengineering, Danmarks Tekniske Universitet.

    Figur 12 – Et gen knock-out i Aspergillus aculeatinus til undersøgelse af ekspressionen af albA-genet, der udtrykker et enzym, der indgår i en metabolisk pathway, som producerer mørkt pigment. Vildtypen angiver den normale svamp, mens mutanten er blevet udsat for genmodifikation med Cas9. Bemærk farveskiftet, som er resulteret af destruktionen af DNA-sekvensen for albA-genet. Sekventering afslører, at det er en deletion på 8 basepar.

    Cas9-baseret knock-in af resistens overfor ukrudtsfjerner i risplanter

    Et gen knock-in ved erstatning af en sekvens, der ændrer proteinfunktion og danner resistente risplanter.  

    Figur 13 – Risplanter sprøjtet med ukrudtsmiddel. Til venstre ses den resistente genmodificerede risplante, og til højre ses vildtype risplanten.  Kilde: “Engineering Herbicide-Resistant Rice Plants through CRISPR/Cas9-Mediated Homologous Recombination of Acetolactate Synthase”, Y. Sun, X. Zhang, C. Wu, Y. He, Y. Ma, H. Hou, X. Guo, W. Du, Y. Zhao, L. Xia, Molecular Plant, 9(4):628-631 (2016).  

    Planter producerer et enzym kaldet acetolactat-syntase (ALS), der katalyserer det første trin i produktionen af de livsnødvendige aminosyrer valin, leucin, og isoleucin, der bruges til opbygningen af andre proteiner. Ved at inhiberer enzymet, kan man stoppe produktionen, hvilket vil dræbe planten. Dette kan man gøre med en række forskellige ukrudtsfjernere, som binder til enzymet og forhindrer dets funktion. Spreder man disse ukrudtsfjernere over en rismark, vil man dræbe alt ukrudt, men også risplanterne. Dermed ville det være meget brugbart at lave risplanter, der var resistente overfor ukrudtsfjerneren. Det lykkedes for et kinesisk forskerhold at lave genmodificerede resistente risplanter, ved brug af CRISPR/Cas9 og HDR til at lave et gen knock-in i ALS-genet ved en erstatning af en del af sekvensen. Risplanterne blev tilført et plasmid indeholdende Cas9-genet, en DNA-skabelon, samt to stykker sgRNA. De to stykker sgRNA blev anvendt til at udskære en sekvens midt i ALS-genet, og denne DNA-sekvens blev erstattet med DNA-skabelonen ved HDR. Denne DNA-skabelon var næsten ens med vildtypens sekvens, bortset fra at den indeholdte nogle specifikke mutationer. Disse mutationer medførte, at det producerede acetolactat-syntase ikke var modtageligt for binding af ukrudtsfjerneren, hvormed der ikke kunne ske en inhibering af produktionen af de essentielle aminosyrer. Dermed er der tale om en gain-of-function mutation grundet et gen knock-in. Denne genmodificering gav levedygtige resistente risplanter, men der blev også set fejlmutationer grundet uhensigtsmæssig reparation af NHEJ. Ved anvendelse af de risplanter der blev modificeret korrekt, ville man kunne plante en rismark af resistente planter. På denne rismark vil man kunne fjerne alt ukrudt med ukrudtsfjerneren, men lade risplanterne trives. På figur 13 kan forsøgsresultaterne ses, hvor det er tydeligt at kun den genmodificerede plante trives trods tilstedeværelsen af ukrudtsfjerner.

  • Case 1 - Oprindelsen fra et Prokaryot Immunforsvar

    Oprindelsen af CRISPR/Cas9 – et prokaryot adaptivt immunforsvar

    CRISPR/Cas-systemer er prokaryote immunsystemer, designet til at forsvare bakterier og arkæer imod invasivt genetisk materiale. Dette kunne for eksempel være plasmider, der er små ringformede DNA-sekvenser, som kan påvirke prokaryotens genom, eller virus, som overtager prokaryotens cellefunktioner således at virussen kan reproducere sig selv. Generelt kan det siges om invasivt genetiske materiale, at det prøver at ændre cellens DNA, hvormed det udgør en potentiel trussel imod genomet.

    CRISPR/Cas-systemer består overordnet af to komponenter, en DNA-sektion kaldet CRISPR-regionen, der findes i prokaryotens eget genom, og de funktionelle Cas-proteiner, der bevæger sig rundt i cytoplasmaet. Ved eksempelvis et virusangreb på en prokaryot, vil der injiceres viralt DNA i cellen, som må destrueres hurtigt, før det overtager cellens funktioner og dræber den. Her aktiveres CRISPR/Cas-systemet hurtigt, hvorved Cas-proteiner sendes ud i cellens cytoplasma, for at søge efter det invasive DNA. Så snart det fremmede DNA bliver lokaliseret, bliver det klippet i stykker ved dobbeltstrengsbrud og derefter nedbrudt, så det ikke udgør en trussel mere. Systemet siges at være adaptivt, da der ved en infektion opsamles en lille prøve af det invasive DNA, som gemmes i CRISPR-regionen og kan bruges til hurtigere at genkende fremtidige infektioner af samme type. Det er disse fragmenter, som bruges til at lave gRNA til Cas9, så proteinet kan genkende det invasive genetiske materiale. Det er disse fragmenter, der udgør immuniteten i systemet og de kan nedarves af bakteriens afkom, hvilket giver de nye bakterier den samme immunitet, som de forhenværende generationer har erhvervet. Der findes utroligt mange forskellige variationer af CRISPR/Cas-systemer, med forskellige proteiner og virkningsmekanismer, som varierer mellem prokaryoter. Bakterien Streptococcus pyogenes indeholder to typer af CRISPR/Cas-systemer, nemlig type I og type II. Der vides ikke meget om type I systemets funktionsmekanisme og om det overhovedet er aktivt. Type II systemet er derimod meget velstuderet og blev brugt til at udvikle det meget omtalte genteknologiske værktøj, CRISPR/Cas9. S. pyogenes er afbildet på figur 14. For at forstå, hvordan det genteknologiske værktøj blev opdaget, kan man kigge på, hvordan det originale immunsystem fungerer, da funktionsmekanismerne er meget ens. Dermed tages nu et nærmere blik på type II CRISPR/Cas-systemet i S. pyogenes.

    Figur 14 – Streptococcus pyogenes er bakterien hvor det mest anvendte CRISPR/Cas9 stammer fra. De røde prikker er enkelte bakterier, som tilsammen danner kæder. Kilde: Centers for Disease Control and Prevention, United States Department of Health and Human Services.

    Opbygningen af type II CRISPR/Cas-immunsystemet

    CRISPR-regionen

    CRISPR-regionen er immunsystemets informationscentral, hvor alle oplysningerne gemmes og hvor Cas-proteinerne udsendes fra eller rapporterer til. CRISPR er en forkortelse af Clustered Regularly Interspaced Short Palindromic Repeats. Navnet beskriver meget nøjagtigt den karakteristiske opbygning af CRISPR-regionen i det prokaryotiske genom; gentagelser af små DNA-sekvenser, kaldet repeats, der ligger sammen i samme afstand fra hinanden. Disse er 32 basepar lange. Repeats er palindrome, hvilket betyder at de læses identisk både fra venstre mod højre på den ene streng og i modsat retning på den komplementære streng. Imellem hvert repeat haves en DNA-sekvens af ekstragenomisk oprindelse, hvilket betyder at sekvenserne ikke stammer fra prokaryotens eget genom. Disse er kaldet spacers og er omtrent 35 basepar lange fragmenter af invasivt DNA fra tidligere infektioner. De stammer altså fra bakteriofager (virus), plasmider eller andet fremmed DNA. Disse tilegnede spacer-fragmenter bruges som et bibliotek over forhenværende infektioner, sådan at systemet nemt og hurtigt kan identificere DNA fra infektioner, som cellen har oplevet tidligere. Hver spacer svarer altså til en tidligere infektion af bakterien. Spacerne kan transskriberes til RNA og omdannes til gRNA, som er den form hvorpå de anvendes af Cas-proteiner. I CRISPR-regionen haves en leader, som er en større regulatorisk DNA-sekvens, der bestemmer transskriptionen af spacers til brugbar gRNA og kontrollerer integrationen af nye spacers. cas-generne er meget vigtige for systemet, da de koder for Cas-proteinerne. De ligger nær CRISPR-regionen i genomet. Se figur 15 for opbygningen af CRISPR-regionen og cas-generne for Type II CRISPR/Cas-systemet i S. pyogenes.

    Figur 15 – Opbygningen af den genetiske region for type II CRISPR/Cas-systemet i S. pyogenes. CRISPR-regionen indeholder alle de vigtige informationer om tidligere infektioner, i form af forskellige spacers, der sidder mellem repeats. Regionen indeholder en leader, der en DNA-sekvens, som regulerer integrationen og transskriptionen af spacers. De fire cas-gener koder for Cas-proteinerne, der udøver immunforsvarets funktioner. Det nærtliggende tracrRNA-gen bruges i dannelsen af gRNA til Cas9.

    Cas-proteinerne

    CRISPR associerede (Cas) proteiner er immunsystemets funktionelle enheder – det er dem, der udfører arbejdet. Deres funktion er at opretholde immunsystemets aktivitet og varetage strukturen i CRISPR-regionen, hvilket ordnes af forskellige proteiner med forskellige roller. Nogle Cas-proteiner indhenter informationer om nye infektioner, i form af spacerne, som de afleverer til CRISPR-regionen, mens andre Cas-proteiner udsendes fra CRISPR-regionen med denne information for at eliminere infektionstruslerne. Cas-proteiner kan være styret af gRNA, svarende til DNA-sekvensen, som systemet vil have dem til at arbejde på. Specifikt for Type II CRISPR/Cas-systemet i S. pyogenes, haves følgende Cas-proteiner:

      • Cas1 – indsamler nye spacers til CRISPR-regionen sammen med Cas2.

     

    • Cas2 – indsamler nye spacers til CRISPR-regionen sammen med Cas1.

     

     

    • Cas9 – detekterer og eliminerer invasivt DNA ved dannelse af dobbeltstrengsbrud i DNA’et. Proteinet er styret af guide RNA (gRNA), som stammer fra CRISPR-regionens spacers. Csn2 – involveret i erhvervelse af nye spacers til CRISPR-regionen. Yderligere haves ét vigtigt protein, der er nødvendig for systemets funktion: RNase III – behandler RNA transskriberet fra CRISPR-regionen og danner det færdige gRNA, som anvendes til styringen af Cas9.

     

     

    Funktionen af type II CRISPR/Cas-immunsystemet

    Følgende afsnit vil beskrive type II CRISPR/Cas-immunsystemets funktionsmekanisme, eksemplificeret ved bakteriofagangreb på bakterien Streptococcus pyogenes. Processen beskrives trinvist, som angivet på figur 16.

    Figur 16 – Oversigt over type II CRISPR/Cas-immunsystemets reaktion på en bakteriofaginfektion i S. pyogenes. De enkelte trin er nummereret svarende til den detaljerede beskrivelse nedenfor.

    Anskaffelse af ny immunitet: Adaptation

    CRISPR/Cas-immunsystemet er adaptivt, da systemet kan tilegne sig immunitet imod nyt invasivt genetisk materiale. Det betyder, at systemet kan tilpasse sig til nye trusler, som ikke har inficeret cellen før. De følgende trin beskriver hvorledes DNA’et fra en bakteriofag bliver omdannet til en immunitet imod bakteriofagen selv, af CRISPR/Cas-systemet i Streptococcus pyogenes.

    1. En bakteriofag binder sig til et overfladeprotein på prokaryotens overflade, hvorved infektionen starter. Bakteriofagen skyder sit invasive DNA ind i prokaryotens cytoplasma, hvormed der nu er opstået en akut trussel mod cellen, da bakteriofag DNA’et prøver at overtage cellens virkningsmekanismer. På det invasive DNA findes der Protospacer Adjacent Motifs (PAM), der definerer det område på det invasive DNA, som CRISPR/Cas-systemet kan omdanne til en spacer. Dette område kaldes for en protospacer. PAM-sekvenser er tilsyneladende tilfældigt placeret, og derved er protospaceren en tilfældig valgt del af det invasive DNA. PAM-sekvensen for S. pyogenes er 5’-NGG-3’. Dette betyder at alle steder, hvor der ses 5’-NGG-3’ i det invasive DNA, haves en potentiel protospacer. Den interessante del af det invasive DNA ses på figur 17.

    Figur 17 – Et udsnit at det invasive DNA og placeringen herpå af protospaceren og den essentielle PAM-sekvens, 5′-NGG-3′, der kan genkendes af Cas-proteiner. 

    2. CRISPR/Cas-systemet reagerer på infektionen og Cas-proteiner undersøger det invasive DNA. Cas-proteinerne Cas1 og Cas2 danner et kompleks, som muligvis også interagerer med Cas9 og Csn2. Dette Cas1-Cas2-kompleks undersøger det invasive DNA og er ansvarlig for valget af protospacer ud fra genkendelse af PAM-sekvenser, men dette foregår ved en endnu ufastlagt mekanisme for S. pyogenes. Protospaceren skæres fri fra det invasive DNA af Cas1-Cas2-komplekset og transporteres til CRISPR-regionen.

    3. Cas1-Cas2-komplekset fungerer også som en integrase, idet det indsætter den nyerhvervede omtrent 35 basepar spacer i CRISPR-regionen. Integration af en spacer skal ske meget nøjagtigt, for ikke at ødelægge CRISPR-regionen. Cas1-Cas2-komplekset integrerer spaceren afhængigt af leader-sekvensen og ved genkendelse af repeats. Spaceren bliver indsat mellem to repeats for enden af leader-sekvensen. Når spaceren er blevet inkorporeret i CRISPR-regionen, giver den potentiel immunitet overfor bakteriofagen, der angreb cellen. Immuniteten er defineret ved den specifikke sekvens af spaceren, da denne vil kunne bruges til hurtigt at identificere et nyt angreb af samme type bakteriofag. For at udøve immuniteten som spaceren giver, skal spaceren først omformuleres til brugbar gRNA til Cas9. Dermed skal en anden mekanisme af systemet aktiveres.

    Formulering af immunitet: CRISPR-ekspression og dannelse af gRNA

    Cas9 er det protein, der identificerer invasivt DNA og herefter destruerer det. For at Cas9 skal kunne genkende det truende invasive DNA, må den få formuleret den tilsvarende nyerhvervede spacer på en måde, hvorved den kan anvendes praktisk. Spaceren skal formuleres som en del af gRNA, som styrer Cas9 mod det invasive DNA. Husk at, gRNA er den udskiftelige del af Cas9, der giver mulighed for, at proteinet kan genkende forskellige specifikke sekvenser, binde sig til dem og destruere dem ved at klippe dem over. I bakterien består gRNA af to stykker RNA, nemlig crRNA (CRISPR-RNA) og tracrRNA (trans-activating CRISPR-RNA). De følgende trin beskriver dannelsen af gRNA, ud fra den nyerhvervede spacer fra CRISPR-regionen.

    4. Det første trin for dannelsen af gRNA, er transskription af CRISPR-regionen, der indeholder den givne spacer. Dette menes at blive promoveret af leader-sekvensen. Transskriptionen danner et længere stykke RNA, der består af en længere række af spacere og repeats. Dette RNA kaldes for pre-crRNA.

    5. Nær CRISPR-regionen transskriberes tracrRNA, for at kunne interagere med pre-crRNA. Dette tracrRNA binder sig til repeat-segmenterne af pre-crRNA, hvorved der dannes et pre-crRNA:tracrRNA-kompleks.

    6. Det dannede RNA-kompleks rekrutterer den RNA-specifikke nuklease RNase III, som kløver RNA-komplekset til flere crRNA:tracrRNA-komplekser, under tilstedeværelsen af Cas9. De resulterende RNA-komplekser består af ét stykke tracrRNA og ét specifikt stykke crRNA, som faktisk udgør færdigt gRNA.

    7. Det dannede gRNA med spaceren fra bakteriofagen optages nu af Cas9, således at proteinet bliver aktivt. Dermed kan Cas9 søge efter det invasive DNA og ødelægge det, før det er for sent. crRNA-delen indeholder en 20 nukleotider lang del af spaceren, der bruges af Cas9 til identifikationen af invasiv DNA. tracrRNA-delen spiller en strukturel rolle, som muliggør at Cas9 kan binde gRNA’et og derved anvende det.

    Udøvelse af immunitet: Cas9-aktivitet

    Det aktiverede Cas9 overvåger nu cellen for bakteriofagangreb af den samme type, ved gennemsøgning af cytoplasmaet for bakteriofagens DNA. PAM-sekvensens tilstedeværelse er en nødvendighed for at Cas9 vil kunne genkende bakteriofagens DNA, og dermed søger den primært efter disse. Hver gang Cas9 finder en PAM-sekvens, afprøver proteinet om gRNA’ets 20 nukleotider spacer-del passer med resten af DNA-sekvensen. Da PAM-sekvenser mangler i CRISPR-regionen, sikres det at Cas9 ikke kan genkende CRISPR-regionens spacer-sekvenser og dermed ikke kan klippe i dem. Kravet om PAM-sekvensen fungerer altså som en sikkerhed for bakteriens egen CRISPR-region, hvormed der undgås autoimmunitet i CRISPR/Cas-systemet.

    8. Når Cas9 møder bakteriofagens DNA, vil den binde sig til PAM-sekvensen og bakteriofagens DNA vil passe sammen med det nydannede gRNA, da de to sekvenser svarer til hinanden. Dette er fordi det bundne gRNA i Cas9 er baseret på netop denne sekvens, som udgjorde protospaceren i starten. Denne gRNA-DNA-binding medfører at Cas9 binder sig fast om DNA-strengen. Da Cas9 nu har identificeret bakteriofagens DNA, laver Cas9 et dobbeltstrengsbrud, hvilket medfører at det vil blive nedbrudt. Cas9 giver slip på det kløvede DNA og er derefter klar til at søge videre. På denne måde beskyttes S. pyogenes af CRISPR/Cas-systemet mod bakteriofagens angreb og den samme mekanisme ses ved plasmider eller andre genetiske elementer.

    Baggrundshistorien for udviklingen af CRISPR/Cas9

     

    Cas9’s forgængere – Zinc-fingers og TALENs

    Idéen om at modificere gener er ikke ny, og CRISPR/Cas9 har flere forgængere. De tidligere genteknologiske værktøjer, Zinc-fingers og TALENs (transcription activator-like effector nucleases), er opbygget af enkelte proteinenheder, der kan genkende nogle enkelte nukleotider. Disse proteinenheder kan sammensættes til større komplekser, således at de kan genkende længerere sekvenser. Disse proteinkomplekser kan knyttes til en nuklease, som så kan lave et dobbeltstrengsbrud i DNA. Zinc-fingers kan kun genkende 3 nukleotider og TALENs kun 1 nukleotid, hvormed det kræver et stort stykke arbejde at opbygge et proteinkompleks, der kan give samme effekt, som let opnås ved CRISPR/Cas9. En stor fordel ved Cas9 er altså, at det blot er ét enkelt protein, der ikke behøver nogle modifikationer hver gang en ny sekvens skal rammes, fordi det anvender RNA-baseret identifikation fremfor protein-baseret identifikation. Da man kun skal udskifte det styrende gRNA, for at variere hvilken sekvens man vil ramme, er det meget lettere end at opbygge nye proteinkomplekser. Derfor er CRISPR/Cas9 lettere og billigere end før.

    Udviklingen af CRISPR/Cas9

    Udviklingen af det genteknologiske værktøj CRISPR/Cas9, er et pragteksempel på bioteknologi. Ligesom ved Alexander Flemings opdagelse af penicillin i 1928, og så mange andre biologiske opdagelser, starter det hele ofte med en tilfældighed. Man har kendt til de mystiske repetitive CRISPR DNA-sekvenser siden Yoshizumi Ishino og hans forskergruppe tilfældigvis opdagede dem i 1987, i forbindelse med noget andet genetisk arbejde. Dog forblev deres funktion ukendt helt frem til efter årtusindskiftet, hvor forskellige forskergrupper begyndte at undersøge CRISPR-sekvenserne. Sekvenserne blev blot mere mystiske, da man i 2005 opdagede, at de ikke stammede fra organismerne selv, men havde oprindelse fra virus og plasmider. Det var dog denne opdagelse, der fik forskerne til at opstille hypotesen om, at CRISPR-sekvenserne spillede en rolle i et prokaryot immunsystem. Deres funktion blev eksperimentelt bekræftet i 2007 af et forskerhold fra fødevarevirksomheden Danisco, der prøvede at vaccinere deres bakteriestammer mod vira og dermed gøre dem til stærkere produktionsorganismer. Herefter begyndte man at afklare funktionsmekanismen af CRISPR/Cas-immunsystemet gennem forskellige studier, hvilket gav startskuddet til kapløbet om at bruge systemet til genteknologiske formål. I 2012 havde nogle forskergrupper samtidigt bevist, at systemer fra Streptococcus thermophilus og Streptococcus pyogenes kunne modificeres og udgøre genteknologiske værktøjer. Disse opdagelser blev startskuddene til den store patentkrig mellem University of California, Berkeley, og Broad Institute. Dette er en utroligt indviklet og heftig konflikt om hvem, der kan kalde sig retmæssig ejer af CRISPR/Cas9-teknologien. Man kan sige at forskernes nysgerrighed ledte til studierne af CRISPR-sekvensernes funktion, hvilket gav anledning til opdagelsen af Cas9. Undersøgelser af funktionen og strukturen af Cas9 i dets naturlige miljø afslørede dets store potentiale, da man opdagede at proteinet både kunne genkende og klippe DNA-sekvenser. Udforskningen af dannelsen og funktionen af gRNA er fuldkommen central, da man herved fandt ud af at det var dette element, der var nøglen til kontrollen over Cas9. Det er ud fra denne viden, at man har gjort Cas9 programmerbart med syntetisk fremstillet sgRNA. Udviklingen af CRISPR/Cas9 fortæller historien om at bioteknologi handler om at udforske de grundlæggende værktøjer naturen selv har skabt og derefter finde ud af hvordan vi kan udnytte dem til gavnlige formål. Hvem ved hvad der ellers findes ude i naturens enorme uudforskede landskab?

  • Case 2 - Genregulering med CRISPR-teknologi

    Genekspressionsregulering med CRISPR-teknologier: CRISPRi og dCas9

    Gener koder for mange forskellige egenskaber, afhængigt af funktionen af de proteiner, som generne koder for. For at egenskaberne skal komme til udtryk i en organisme, skal generne først transskriberes. Dermed kan man styre egenskabers udtrykning, ved at styre transskriptionen af generne. Der er blevet udviklet andre CRISPR/Cas9-baseret værktøjer end bare det naturlige Cas9. Disse udnytter også den præcise binding som Cas9 kan udføre i kombination med sgRNA, men giver andre muligheder end at lave dobbeltstrengsbrud til genmodificering. De alle er afarter af Cas9-proteinet, som er blevet modificeret. Det er muligt at anvende Cas9-proteinet til kontrol af genreguleringen. Ved at omdanne Cas9-proteinet til en inaktiv form, dannes et protein, der blot binder specifikt til DNA-sekvenser afhængigt af det givne sgRNA. Denne type Cas9 kaldes for dead Cas9 (dCas9), da den ikke kan lave dobbeltstrengsbrud i DNA. dCas9 dannes ved at inaktivere Cas9-endonukleaserne, RuvC og HNH, med punktmutationer i Cas9-genet, således at disse ikke kan klippe i DNA-strenge. dCas9 tillader at man kan styre geners aktivitet, ved at få den til at binde til specifikke sekvenser. Denne genkontrollerende metode kaldes for CRISPR interference (CRISPRi). Det er muligt at kontrollere om gener skal udtrykkes eller hæmmes, uden at man redigerer i selve DNA-sekvenserne. CRISPRi ændrer altså ikke den genetiske information, men kontrollerer transskriptionen af den. Dette har sine fordele, da genfunktionerne kan reguleres uden at lave permanente mutationelle ændringer i DNA-sekvensen, som kan have alvorlige konsekvenser for organismen. Vigtige fordele er altså, at manipuleringen er reversibel og ikke-mutationel. Mekanismen er lig den normale funktion af Cas9, da dCas9 identificerer DNA-sekvenser med det givne gRNA og ud fra en PAM-sekvens, som medfører en bindingsdannelse til DNA-sekvensen.

    Gene silencing med dCas9: repression

    Det er muligt at effektivt reducere ekspression af et helt specifikt gen, hvis man kan blokere for RNA-polymerasen, som transskriberer DNA til mRNA. Ved at anvende dCas9 og et stykke sgRNA, som er designet til at genkende det samme sted som RNA-polymerasen binder, kan man opnå en fysisk blokering af RNA-polymerasen. Dette kaldes for gene silencing, idet man undertrykker genets ekspression. Der er flere tilgange til gene silencing med dCas9, og deres effektivitet afhænger af hvor på genet man rammer.

    Figur 18 – CRISPRi gene silencing med dCas9. Øverst ses strukturen af genet, med promoteren og det RNA-kodende DNA. RNA-polymerasen ses igang med transskriptionen. Blokeringen af transskriptionsinitieringen viser hvorledes dCas9 sætter sig i promoteren og blokerer for binding af RNA-polymerasen, hvormed genets transskription forhindres. Blokeringen af transskriptionselongeringen viser hvordan dCas9 sætter sig midt i genet og blokerer for RNA-polymerasens bevægelse ned langs DNA-strengen, hvormed der også ses en hæmning af transskriptionen. Således kan genets ekspression hæmmes.

    Blokering af transskriptionsinitiering – forhindring af opstarten af transskriptionen. Den mest optimale effektivitet fås, når dCas9 sidder på transskriptionens startsted, promoteren. Dette vil blokere for selve bindingen af RNA-polymerasen og dermed forhindrer opstarten af transskriptionen. Blokeringen er uafhængig af hvilken DNA-streng dCas9 binder til, da binding til den kodende streng og skabelonstrengen begge forhindre binding af RNA-polymerasen og dermed giver lige stor repression af genet. Se figur 18 for illustration af blokering af transskriptionsinitiering.

    Blokering af transskriptionselongering – forhindring af udførsel af transskriptionen. dCas9 kan også binde midt på genets RNA-kodende sekvens, hvor den blokerer RNA-polymerasens bevægelse langs strengen, når den transskriberer genet. Effektiviteten af dette afhænger af hvilken streng dCas9 sidder på. For at opnå høj effektivitet af repressionen, skal sgRNA designes således at dCas9 binder sig til den kodende DNA-streng og ikke til skabelonstrengen. Se figur 18 for illustration af blokering af transskriptionselongering.

    Ligesom ved traditionel genmodificering med Cas9, kan man anvende multiplexing, hvor flere stykker sgRNA kan bruges sammen med dCas9 til at blokere flere gener på en gang. Det er også muligt at blokere ekspressionen af ét gen ekstremt effektivt, ved at have flere sgRNA der rammer det samme gen, men forskellige steder.

    CRISPRi gene silencing til modificering af Escherichia coli

    Bakterier kan have fantastisk mange forskellige strukturer, former og størrelser, hvilket man betegner som deres morfologi. Når man beskriver morfologien, handler det om organismens fænotype. Variationerne går fra bittesmå spiraler til store runde bakterier, der er synlige med det blotte øje (eks. Thiomargarita namibiensis). Ligesom alle deres andre egenskaber, afhænger deres morfologi af den genetiske information, som er lagret i deres DNA. Dette betyder, at man ved hjælp fra CRISPR-teknologi kan ændre bakteriernes morfologi, hvilket eksempelvis kan være gavnligt, når man bruger bakterierne til produktion.

    Der vil nu tages et nærmere blik på, hvordan et forskerhold afprøvede CRISPRi til at regulere ekspressionen af gener, der bestemmer morfologien af Escherichia coli og dermed kunne styre deres udseende. Forskerne ville gerne opnå større E. coli bakterier, da disse kan forøge produktionen af bioplast, grundet et større cellevolumen til ophobning af bioplasten. Den normale morfologi af E. coli er en lettere aflang stavform, som kan ses på figur 19. Billedet viser den negative kontrol fra CRISPRi-forsøget, hvilket betyder at bakterierne bevidst indeholder dysfunktionelt sgRNA, hvormed der ikke er udført nogle genetiske ændringer i disse bakterier. De har vildtype fænotypen.

    Figur 19 – Den naturlige morfologi af E.coli. Dette er den negative kontrol af CRISPRi-forsøget, hvor der ses en E. coli stamme kaldet JM109, med dysfunktionelt sgRNA, der ikke rammer nogle gener. Størrelsesforholdet kan ses nederst i højre hjørne. Kilde: “CRISPRi engineering E. coli for morphology diversification”, D. Elhadi, L. Lv, X.R. Jiang, H. Wu, G.Q. Chen, Metabolic Engineering, 38:358-369 (2016).  

    I forsøget var der to gener, som forskerne målrettet gik efter at manipulere genreguleringen af. Disse to gener er ftsZ-genet, der er relateret til bestemmelsen af længden af bakterien, og mreB-genet, der er relateret til bestemmelsen af bredden af bakterien. Ved at regulere disse gener med CRISPRi, kan man lave betydelige ændringer i morfologien. Her vil det ikke være muligt at bruge det naturlige Cas9 til at lave et gen knock-out, da bakteriecellerne ikke kan gro hvis ftsZ– eller mreB-genet er fuldkommen dysfunktionelt. CRISPRi gene silencing med dCas9 er derfor en oplagt mulighed, da gener ikke deaktiveres fuldkomment permanent. Generne bliver udsat for en delvis repression og dermed tillader at bakterierne kan vokse med deres nye morfologi. ftsZ-genet koder for et protein, der spiller en central rolle i celledelingen, hvor nye celler dannes. Proteinet hedder FtsZ og danner sammen med andre proteiner en Z-ring, som trækker sig sammen og deler en bakterie i to nye. Mængden af proteinet afgør hvor lange bakterierne kan blive, før de bliver delt. Ved at hæmme genets ekspression og dermed sænke mængden af FtsZ-protein, hæmmes celledelingen, hvormed cellerne vokser sig længere før de deler sig. ftsZ-genets funktion kan ses på figur 20. mreB-genet koder for MreB-proteinet, som har til funktion at regulere størrelsen på bakteriens cytoskelet, som bestemmer cellens rummelige struktur. Ved at hæmme ekspressionen af mreB-genet, sænkes produktionen af MreB-proteinet, hvormed størrelsen ikke kan reguleres på normalvis. Dette betyder at cellen kan vokse sig større, dog med et mere svækket cytoskelet. mreB-genets funktion kan ses på figur 20.

    Figur 20 – Her ses funktionen af de undersøgte gener, ftsZ og mreB. Ved at hæmme ftsZ-genet, kan Z-ringen ikke dannes i samme grad og cellerne vil blive længere. Ved at hæmme mreB-genet kan det tilhørende protein ikke regulere cellestørrelsen i samme grad og dermed kan cellerne blive mere fyldige.

    For at kunne udføre denne gene silencing med dCas9, skulle der designes sgRNA, der kunne identificere de to gener, således at dCas9 kunne binde sig til dem. Her valgte forskerne 20 nukleotider, der var komplementære til DNA-sekvenserne af generne, ligesom det blev gennemgået i afsnittet Design af sgRNA, under Grundteorien. Da bindingen af dCas9 generelt giver den bedste effektivitet på den kodende streng, blev sgRNA designet til at være komplementært til denne. Multiplexing blev anvendt til at få dCas9 til at ramme flere steder på generne. Årsagen var at undersøge, hvilke kombinationer af bindingssteder for dCas9, der gav den mest effektive reduktion af genekspressionen.  For hvert gen blev der designet 5 forskellige sgRNA, der kunne ramme forskellige områder af generne. En masse forskellige kombinationer af disse forskellige sgRNA blev afprøvet for hvert gen, for at finde den mest effektive kombination for hvert gen. Denne multiplexing foregår ved at indføre et eller flere stykker sgRNA sammen med genet for dCas9 i en vektor, tilsvarende som det blev gennemgået i afsnittet Leveringsmetoder, under Grundteorien.

    For ftsZ-genet blev sgRNA designet til at udføre blokering af transskriptionselongeringen, hvor dCas9 binder sig midt på genet og forhindrer RNA-polymerasens bevægelse langs DNA-strengen. Dette fremgår af de 5 dCas9-bindingssteder, der ses på figur 21.

    Figur 21 – Placeringen dCas9-bindingssteder på ftsZ-genet for de 5 forskellige sgRNA.

    For mreB-genet blev sgRNA også designet til blokering af transskriptionselongeringen, samt blokeringen af transskriptionsinitieringen, hvor dCas9 binder sig i promoteren og forhindrer RNA-polymerasens binding. Dette fremgår af figur 22, der viser de 5 dCas9-bindingssteder på mreB-genet.

    Figur 22 – Placeringen dCas9-bindingssteder på mreB-genet for de 5 forskellige sgRNA.

    Udvalgte CRISPRi-modificerede E.coli bakterier ses på figur 23, for ftsZ-genet, og figur 24, for mreB-genet, hvor det tydeligt kan ses at deres morfologi er ændret grundet repressionen af genekspression. Der bliver simpelthen ikke transskriberet nok mRNA til at opretholde vildtype fænotypen. For ftsZ-genet ses der multiplexet repression, hvor 4 sgRNA er blevet brugt til at medføre binding af dCas9 på position nr. 1, 2, 3 og 5, som angivet på figur 21. Det kan ses, at dette har medført betydeligt længere bakterier.

    For mreB-genet blev der brugt ét enkelt stykke sgRNA til at ramme position nr. 4, som angivet på figur 22, hvilket har forårsaget opsvulmede bakterier. I alle disse bakterier sidder dCas9 bundet fast på de valgte positioner i DNA’et for de to gener, som det kan ses på figur 18. Dette medfører altså variationer af morfologien, fordi generne har en reduceret ekspression grundet CRISPRi gene silencing.

    Figur 23 – CRISPRi gene silencing af ftsZ-gen på dCas9-bindingssteder nr. 1,2,3 og 5, som angivet på figur 21, giver ændret morfologi af E. coli. Længere bakterier er opnået ved multiplexet reduktion af ekspressionen af ftsZ-genet. Kilde: “CRISPRi engineering E. coli for morphology diversification”, D. Elhadi, L. Lv, X.R. Jiang, H. Wu, G.Q. Chen, Metabolic Engineering, 38:358-369 (2016).

    Figur 24 – CRISPRi gene silencing af mreB-gen på dCas9-bindingssted nr. 4, som angivet på figur 22, giver ændret morfologi af E. coli. Mere fyldige bakterier er opnået ved reduktion af ekspressionen af mreB-genet. Kilde: “CRISPRi engineering E. coli for morphology diversification”, D. Elhadi, L. Lv, X.R. Jiang, H. Wu, G.Q. Chen, Metabolic Engineering, 38:358-369 (2016).

    Forskerne afprøvede også at kombinere repressionen af begge gener, hvilket er et eksempel på multiplexing af flere forskellige gener. Her brugte de 5 sgRNA på samme tid, hvoraf 4 forårsagede dCas9-binding på ftsZ-genet og det sidste stykke sgRNA var målrettet mreB-genet. Resultatet af denne dobbelte gene silencing, kan ses på figur 25, hvor det er meget tydeligt, at E.coli bakterierne slet ikke har deres normale morfologi. Det her var et eksempel på hvordan man kan bruge CRISPRi til at udføre gene silencing og dermed reducere ekspressionen af gener. Som billederne bevidner, kan bindingen af dCas9 til specifikke sekvenser give drastiske ændringer i fænotypen af en organisme. Disse ændringer opnås helt uden at ødelægge DNA-sekvensen, men blot ved at regulere hvorledes generne udtrykkes.

    Figur 25 – CRISPRi gene silencing af ftsZ-genet på dCas9-bindingssteder nr. 1,2,3 og 5, samt mreB-genet på dCas9-bindingssted nr. 4. Her ses en stor ændring i morfologien af E. coli, da der sker en reduktion af ekspressionen for begge gener, ftsZ og mreB, hvormed bakterierne både bliver længere og mere fyldige. Kilde: “CRISPRi engineering E. coli for morphology diversification”, D. Elhadi, L. Lv, X.R. Jiang, H. Wu, G.Q. Chen, Metabolic Engineering, 38:358-369 (2016).

    dCas9 med effektor-domæner: repression (CRISPRi) og aktivering (CRISPRa)

    Indtil nu er brugen af dCas9 som en fysisk blokade til at reducere ekspressionen af gener blevet gennemgået. Faktisk kan dCas9 bruges til mere end blot at være en blokade, der sætter sig på DNA-strengene. Det er muligt at bruge dCas9 til at manipulere den naturlige regulering af genekspressionen. Ved hjælp af denne tilgang, er det faktisk også muligt at opregulere ekspressionen af gener, hvormed man forøger mængden af de proteiner som generne koder for. Denne type opregulering kaldes for CRISPR activation (CRISPRa). Eukaryote gener indeholder små regulatoriske sekvenser, der sidder nær promoteren. Disse regulatoriske sekvenser kan enten medføre opregulering af genekspressionen, hvormed genet udtrykkes mere, eller medføre nedregulering af genekspressionen, hvormed genet udtrykkes mindre. Der findes sekvenser som kaldes for enhancers, der kan opregulere genekspressionen, og silencers, der kan nedregulere genekspressionen. For at regulatoriske sekvenser har en effekt på genekspressionen, skal der binde sig bestemte proteiner til dem, kaldet transskriptionsfaktorer, der enten skruer op eller ned for transskriptionen. Hvis den binder til en enhancer og skruer op for genekspressionen, kaldes den en aktivator. Hvis den derimod binder til en silencer og skruer ned for genekspressionen, kaldes den en repressor. Hvis man forestiller sig genekspression som en kørende bil, kan man sige at aktivatorer fungerer som speederen og repressorer som bremsen. Det er disse aktivatorer og repressorer, der er interessante at udnytte sammen med dCas9. Man kan bruge dCas9 som en leverandør af transskriptionsfaktorer, ved at sætte deres aktive proteindomæner fast på overfladen af proteinet. Disse proteindomæner benævnes generelt som effektor-domæner. Dernæst giver man dCas9 et stykke sgRNA, der genkender et sted nær en regulatorisk sekvens, hvor dCas9 så kan binde sig. Herfra kan det aktive effektor-domæne spille sin rolle som regulator af genekspressionen, som kan have en effektiv virkning på kontrollen af genet. dCas9 bliver altså en sgRNA-styret leverandør af proteiner, der regulerer genekspression. CRISPRi udføres ved repressor effektor-domæne, mens CRISPRa udføres med et aktivator effektor-domæne. Opbygningen af dCas9 med effektor-domæner kan ses på figur 26.

    Figur 26 – dCas9 med fusioneret effektor-domæne til regulering af genekspressionen. Den regulatoriske sekvens påvirkes af det aktive domæne og regulerer transskriptionen. Hvis domænet er en aktivator vil transskriptionen opreguleres (CRISPRa), mens en repressor vil medføre nedregulering (CRISPRi).

    Herunder gives to eksempler på dCas9, hvorpå der er fusioneret effektor-domæner, der regulerer transskriptionen af gener.

    dCas9-KRAB: nedregulering af genekspression (CRISPRi):  En Krüppel associeret box (KRAB) er et proteindomæne, der findes på mange transskriptionsfaktorer, der kontrollerer menneskets gener. Dens formål er at reducere genekspression og dermed fungerer den som en repressor. Ved at sætte et KRAB-proteindomæne på dCas9 og styre denne mod geners regulatoriske sekvenser med sgRNA, kan man vælge hvilke gener, der skal have reduceret genekspression. På denne måde kan man styre repressionen af specifikke valgte gener, hvilket er blevet gjort i menneskeceller.  

    dCas9-VP64: opregulering af genekspression (CRISPRa): Et VP64-proteindomæne er en kunstigt fremstillet aktivator, der kan opregulere geners ekspression. Når denne fusioneres på dCas9, kan denne også styres mod specifikke geners regulatoriske sekvenser med sgRNA. Hermed kan man altså opregulere genekspression af valgte gener. Dette er også blevet gjort i menneskeceller.  

    Eksempler på praktiske anvendelser af CRISPRi og CRISPRa

     

    Genom-screening og undersøgelse af genfunktioner

    Da dCas9 nemt kan bruges og programmeres med sgRNA, er det et kraftfuldt værktøj til at søge efter gener i hele genomer. sgRNA er nemt at fremstille kunstigt, og dermed kan man lave sgRNA-biblioteker. Disse indeholder mange forskellige sgRNA, som kan eftersøge de gener man vil undersøge. Funktionen af de eftersøgte gener kan undersøges ved at udnytte CRISPRi, til at reducere transskriptionen, eller CRISPRa, til at opregulere transskriptionen og se hvordan det påvirker fænotypen. Ved disse metoder bevares DNA-sekvensen, i modsætning til genundersøgelser med Cas9 knock-outs eller knock-ins.

    Kontrol over transskriptionen af specifikke gener

    Man kan danne typer af dCas9 med effektor-domæner, som kan tændes og slukkes for, hvormed man kan bestemme hvornår genet skal represseres eller aktiveres. Der er eksempelvis lavet en type dCas9-VP64-system, som kan aktivere transskription, når cellerne bliver belyst med blåt lys. Hver gang cellerne bliver udsat for blåt lys vil dCas9-VP64 blive aktivt og opregulere transskriptionen af genet. Der haves altså en stærk kontrol over transskriptionen.

    Kunstig differentiering af celler

    Genekspression styrer differentieringen af celler til mere specialiserede celler, såsom når en stamcelle udvikler sig til en undertype af celle. CRISPRi og CRISPRa kan bruges til kontrollere genekspressionen, hvormed man kan påvirke cellens identitet og differentiering. Denne kontrollerede omprogrammering af celletypen er blevet brugt til at omdanne bindevævsceller fra musefostre til skeletmuskelceller. Et af hovedmålene for denne CRISPR-teknologi er at kunne danne stamceller, som kan bruges til sygdomsmodeller eller endda til terapi af sygdomme.

  • Case 3 - Genterapi med CRISPR/Cas9

    Genterapi: terapeutisk genredigering med CRISPR/Cas9

    I dette afsnit vil det gennemgås hvorledes man kan anvende CRISPR som genterapi mod genetiske sygdomme. Nogle konkrete eksempler på genetiske sygdomme og deres potentielle behandling vil gennemgås.

    Genetiske sygdomme

    Genetiske sygdomme opstår på grund af fejl i genomet. Disse fejl er mutationer i DNA’et, som kan være nedarvet eller være opstået i løbet af ens liv. Årsagerne til genetiske sygdomme kan findes på meget forskellige størrelsesniveauer. Det kan være ændringer i alt fra hele kromosomer til enkelte basepar, men være lige alvorlige. Man kan kategorisere genetiske sygdomme efter deres årsags omfang. Monogene sygdomme er forårsaget af mutationer i enkelte gener. Polygene sygdomme er grundet interaktioner mellem flere gener. Kromosomale sygdomme opstår af strukturelle fejl i kromosomerne eller af abnorme antal af kromosomerne. Genetiske sygdommes fænotyper skyldes mutationernes påvirkning af generne. Påvirkningen kan enten være en ændring af genproduktets struktur (RNA eller protein), hvormed dette fungerer forkert, eller være ændringer i mængden af produceret genprodukt, hvormed dosen afviger fra normalen. Man kunne eksempelvis forestille sig en monogen sygdom i et hypotetisk gen x, der producerer proteinet X, som normalt transporterer store nødvendige molekyler ind i vores celler. En mutation i gen x, der forårsager en ændring af strukturen af protein X, kunne betyde at protein X ikke kunne binde sig til de nødvendige molekyler, hvormed intet ville blive transporteret ind i cellerne. En anden mutation i gen x, der medførte en overproduktion af velfungerende protein X, kunne betyde at alt for mange af de nødvendige molekyler ville blive transporteret ind i cellerne og medføre en giftig effekt. I begge tilfælde kunne man forestille sig, at mutationerne ville udløse en sygdomsfænotype.

    Genterapi

    Genterapi er modificeringen af en patients sygdomsforårsagende DNA eller RNA, med det formål at forebygge, kurere eller behandle en genetisk sygdom. Idéen med genterapien er at rettelsen af muterede gener vil genoprette den originale funktion og fjerne den genetiske sygdom. Genmodifikation kan eksempelvis foregå ved en destruktion, insertion, excision eller erstatning af sygdomsgenet, afhængigt af den skyldige mutation, som det blev beskrevet i grundteoriafsnittet Molekylære strategier. Pointen er, at man vil korrigere i genotypen for at eliminere den pågældende sygdomsfænotype. Monogene sygdomme er oftest mere håndgribelige med henblik på genterapi, da de kun er forårsaget af mutationer i enkelte gener. Genterapien har derfor haft et stærkt fokus på de monogene sygdomme og genkorrektion af disse med CRISPR/Cas9 er derfor mest veludforsket. Selvom CRISPR-teknologi har potentialet til at revolutionere genterapi og at udviklingen af teknologien sker med en hastig fart, er der et stykke vej endnu. Der nogle udfordringer, som skal overkommes og der kræves mere forskning før CRISPR/Cas9 bliver praktisk anvendeligt til genterapi. Der findes to hovedtilgange til at udføre en genterapeutisk korrektion af sygdomsgener med Cas9. In vivo betyder ”indeni det levende”, og hentyder til at korrektionen foregår inde i selve den levende organisme. Ex vivo betyder ”udenfor det levende”, hvilket hentyder til at korrektionen foregår ude af organismen, altså i celler der er blevet fjernet fra selve organismen.

    In vivo genkorrektion

    Genterapien foregår i patienten ved direkte levering af genkorrektionssystemet: Cas9, sgRNA og eventuelt en DNA-skabelon. Overførslen af systemet til patienten kan foregå ved forskellige metoder. Dette kan ske ved lokal injektion, ensbetydende med at terapien foregår i et bestemt organ eller afgrænset væv. En systemisk injektion medfører at komponenterne går i blodbanen og vil blive spredt til hele kroppen. Så snart komponenterne er overført til cellerne, vil genredigeringen foregå. Denne overførsel af komponenterne ind i selve cellerne kan foregå på forskellige måder, eksempelvis med en viral vektor eller lipide nanopartikler. Se figur 27 for in vivo genkorrektion. En sikker, effektiv og kontrolleret levering af systemet er vigtig, for at sikre sig at genkorrektionen foregår korrekt og i det korrekte væv. Dette er meget vigtigt aspekt og en af de store udfordringer for genterapi med CRISPR/Cas9. De forskellige former for levering (DNA-, RNA- og protein-baseret) er beskrevet i grundteoriafsnittet Leveringsmetoder. 

    Figur 27 – In vivo genkorrektion. CRISPR/Cas9 leveres direkte i patientens væv, hvormed genkorrektionen foregår inde i patienten. Overførslen kan foregå på forskellige måder, eksempelvis igennem viral levering eller lipide nanopartikler, og med forskellige komponenter, såsom en DNA-skabelon eller flere stykker sgRNA.

    Genkorrektionen kan foretages på forskellige celleniveauer, hvilket giver forskellige resultater og konsekvenser. Korrektionen kan ske i zygoten (den befrugtede ægcelle) og i de tidlige fosterstadier, hvormed alle datterceller dannet af efterfølgende celledeling, vil nedarve korrektionen af genet. Dette kan i sidste ende betyde, at alle celler i organismen vil indeholde genkorrektionen, også kønscellerne, hvilket betyder at genkorrektionen er nedarvelig. Korrektionen af genet kan også foregå i den udviklede organismes somatiske celler, hvormed kun de ramte celler og deres datterceller vil have korrektionen. Disse genkorrektioner vil altså kun findes i det berørte væv og vil ikke være nedarvelige. Genmodifikation bidrager med meget potente metoder til at fjerne genetisk nedarvede sygdomme, men etiske problematikker gør det til et ømtåleligt forskningsområde.

    Ex vivo genkorrektion

    Genterapien foregår i celler, der er blevet ekstraheret fra patienten. De genmodificerede celler med den ønskede genkorrektion kan udvælges og opdyrkes udenfor kroppen, hvorefter de så transplanteres tilbage til patienten i det berørte område. Cellerne med genkorrektionen vil derefter varetage de normale funktioner, som celler med sygdomsgenet før ikke kunne. Der er to hovedmåder at foretage en ex vivo genkorrektion på, som afhænger af hvilke typer af patientens celler man anvender som udgangspunkt.

    Stamceller: Stamceller ekstraheres først fra patienten selv. Herefter foretages genkorrektionen med CRISPR/Cas9. De genmodificerede stamceller kan derefter transplanteres tilbage i det berørte område af patientens krop, hvor de danner nye differentierede celler. De nydannede specialiserede celler vil indeholde genkorrektionen, da de stammer fra de korrigerede stamceller og vil derfor kunne genoprette de normale funktioner og behandle den genetiske sygdom. Stamcellerne kan også selv differentieres til specialiserede celler, og derefter blive transplanteret tilbage som differentierede celler i det berørte område af patienten. Se figur 28.  

    Somatiske celler: De anvendte celler er fuldt udviklede somatiske celler, såsom hudceller eller blodceller. Cellerne kan ekstraheres og derefter genmodificeres med CRISPR/Cas9, hvorefter de bliver transplanteret tilbage til sygdomsområdet. Dog behøver disse celler ikke være fra området hvori man er interesseret i at foretage genkorrektionen, da de kan blive omprogrammeret til andre celletyper. Somatiske celler kan nemt anskaffes fra patienten ved en blodprøve eller biopsi af huden. Efterfølgende omprogrammeres cellerne til induceret pluripotente stamceller (iPSC), som er kunstigt frembragte stamceller. Disse iPSC genmodificeres udenfor kroppen med CRISPR/Cas9, således at sygdomsgenet bliver korrigeret. De korrigerede iPSC isoleres, og differentieres til den type celler, som der findes i det ramte område. Herefter transplanteres de modificerede celler tilbage i patienten. Se figur 28.

    Figur 28 – Ex vivo genkorrektion. Til venstre ses stamceller, der ekstraheres fra patientens væv. Disse modificeres med CRISPR/Cas9, hvorefter de ønskede celler udvælges og opdyrkes. Til sidst transplanteres cellerne tilbage i patientens væv. Til højre ses en biopsi af hud eller blodceller, der differentieres til induceret pluripotente stamceller (iPSC). Disse modificeres, hvorefter celler der er modificeret korrekt udvælges og opdyrkes. Derefter differentieres iPSC til den givne vævstypes celler og disse transplanteres tilbage.

    En stor fordel ved ex vivo genterapi er muligheden for at undersøge genkorrektionen i cellerne udenfor kroppen, før de bliver transplanteret tilbage. Ved at selektere, kan man udvælge celler med korrekte modificeringer til transplantationen og rendyrke disse, samt bortkaste de celler, der er fejlagtigt muteret. Dette kvalitetstjek sænker risikoen for bivirkninger grundet utilsigtede mutationer, såsom Cas9 off-target effekter, som ikke kan detekteres nemt ved in vivo genkorrektion. En ulempe ved ex vivo genkorrektion er kravet om at kunne gro de ekstraherede celler udenfor kroppen, hvilket kan gøre processen mere kompliceret.

    Retinitis Pigmentosa

    Retinitis pigmentosa er en monogen sygdom, der forårsager fremadskridende forvrængning og tab af synet. Symptomerne skyldes degenerering af øjets fotoreceptorer (tapceller og stavceller).  Et typisk sygdomsforløb starter med natteblindhed, som udvikler sig til tab af det midt-perifere syn i den tidlige voksenalder og ender med et meget begrænset tunnelsyn, der kan gøre den sygdomsramte juridisk blind. Andre symptomer kan eksempelvis også være fejlagtigt farvesyn og tab af synets skarphed. Symptomerne og deres alvorlighed kan variere meget blandt berørte. Mindst 45 gener kan indeholde mutationer, der forårsager sygdommen. Der kan være forskellige nedarvningsmønstre afhængigt af det muterede gen. Retinitis pigmentosa GTPase regulator (RPGR) genet koder for et protein, der er relateret til fotoreceptorernes fimrehår og er nødvendigt for normalt syn. Mutationer i RPGR kan forårsage en kraftig version af Retinitis pigmentosa, som har en X-bunden arvegang og derfor rammer mænd hårdest. En version af RPGR, der hovedsageligt udtrykkes i nethindens fotoreceptorer, indeholder et exon kaldet ORF15. Da exon ORF15 indeholder et mutationelt hotspot, er mutationer heri typiske. I et genetisk studie blev 58 familier undersøgt, som alle var ramt af retinitis pigmentosa. Man fandt ud af, at exon ORF15-hotspottet er ca. 500 bp langt og at mutationer heri både var deletioner (max. 36 bp) og insertioner (max. 75 bp). Mutationerne resulterer i et dysfunktionelt protein, som medfører degenerering af fotoreceptorerne.

    Potentiel ex vivo genterapi

    Man kan foretage en korrektion af disse mutationer med CRISPR-genterapi, ved at modificere den muterede sekvens tilbage til vildtype-sekvensen. Et forskerhold udtog hudbindevævsceller fra en retinitis pigmentosa patient og omdannede dem til induceret pluripotente stamceller (iPSC), som blev korrigeret med CRISPR-genterapi. Disse iPSC kunne teoretisk set blive til celler, som ville kunne blive transplanteret tilbage i patienten og afhjælpe sygdommen, hvormed dette indgreb er en potentiel ex vivo genterapi. I patientens ORF15-exon var der en punktmutation, TAG, der koder for et stop-codon og dermed forårsager et for tidligt uhensigtsmæssigt stop af translationen. Proteinet kunne derfor ikke blive færdigproduceret. Genkorrektionen bestod i at omdanne punktmutationen til vildtype-sekvensen, GAG, der koder for aminosyren glutamat. DNA-baseret levering blev udnyttet til at få genkorrektionssystemet ind i cellerne. Cas9 og sgRNA blev leveret i et plasmid, mens en DNA-skabelon blevet leveret i form af en enkelt DNA-streng. Ved udnyttelsen af homology directed repair, blev den muterede sekvens erstattet med DNA-skabelonen. Denne strategi fungerede i 13% af sekvenserne i de behandlede celler. Ved ex vivo genkorrektion kunne man forestille sig, at man derefter ville have isoleret en korrekt modificeret celle, sikkerhedstjekket den for potentielt farlige off-target effekter og opdyrket den til en større mængde differentierede celler, der til sidst ville kunne blive transplanteret ind i patientens øje.

    Duchennes muskeldystrofi

    Duchennes muskeldystrofi er en monogen sygdom forårsaget af mutationer i genet DMD, der normalt producerer proteinet dystrofin. Sygdommen har en X-bunden recessiv arvegang, hvilket betyder, at mænd bliver hårdt ramt af sygdommen og at kvinder generelt vil være bærere af sygdommen eller have mildere symptomer. Omtrent 1 ud af 5000 mænd får denne sygdom. Denne sygdom medfører en alvorlig fremadskridende svækkelse og nedbrydelse af kroppens muskler (skeletmuskulatur, hjertemuskulatur og glatmuskulatur). Sygdomsforløbet starter med mildt motorisk besvær, som udvikler sig til store bevægelsesproblemer og som oftest ender med, at enten hjertemuskulaturen eller de respiratoriske muskler holder op med at fungere. Den gennemsnitlige forventede levetid er 26 år. Dystrofin er et aflangt strukturelt protein i muskelvævet, der i samarbejde med andre proteiner har til funktion at forbinde muskelfibrene og beskytte dem mod skader, når de kontraheres og udtrækkes. Proteinet består af et langt stabiliserende domæne, der i begge ender har domæner, der kan forankre sig til andre proteiner. Forsimplet kan man sige, at dystrofin fungerer som et stødabsorberende strukturelement. Komplet mangel på funktionelt dystrofin forårsager Duchennes muskeldystrofi, mens mindre strukturfejl af dystrofin giver den relativt mildere version af sygdommen, kaldet Beckers muskeldystrofi. DMD-genet er det største kendte gen i mennesker (2,6 mio. basepar) og er opbygget af 79 exons. Exons er sekvenser, der indeholder kode til det færdige mRNA, mens introns ikke koder for noget. Efter transskription af genet, udskæres alle introns fra pre-mRNA, hvorefter alle exons sammensættes ved en proces kaldet RNA-splicing. De samlede exons udgør det kodende mRNA, som ved translation danner dystrofin. Den normale transskription, RNA-splicing og translation af DMD-genet (exon 47-52) til funktionelt dystrofin, kan ses på figur 29.

    Figur 29 – Den normale funktion af DMD-genet. Her ses et udsnit af genet, fra exon 47 til exon 52. Transskription danner pre-mRNA, og dannelsen af mRNA fra pre-mRNA sker ved RNA-splicing, hvor introns fjernes og exons samles. mRNA translateres til sidst det funktionelle protein dystrofin, som er essentielt for den normale funktion af muskler.

    Alvorlige mutationer i DMD-genet forårsager Duchennes muskeldystrofi. Mutationerne i DMD er i ca. 60% af tilfældene større deletioner, der medfører frame-shift. Dette giver fuldstændigt dysfunktionelt protein, som forårsager den voldsomme fænotype. I resten af tilfældene, er det andre mutationer, der også medfører frame-shift eller sidder i proteinets vigtige domæner og gør det fuldstændigt dysfunktionelt på den måde. Mere end 3000 forskellige sygdomsforårsagende mutationer er blevet identificeret for sygdommen og mange af disse sidder i hotspots, altså bestemte exons, der er specielt udsatte. Beckers muskeldystrofi er knyttet til in-frame deletioner i det lange dystrofin domæne. Her ødelægges læserammen ikke, da der fjernes basepar i et multiplum af 3 nukleotider. Dystrofin bliver derfor kun forkortet og bevarer en lettere reduceret funktionalitet, hvilket betyder, at sygdomsfænotypen bliver forholdsvist mild. Den genetiske baggrund for Duchennes muskeldystrofi er kompleks og der er ikke et enkelt genetisk indgreb, der kan kurere sygdommen. Derfor er forskellige CRISPR-baserede strategier blevet afprøvet på de forskellige typer af mutationer. Der vil nu tages et indblik i to strategier, der begge er baseret på at fjerne et segment af genet, der medfører sygdommen. Det vides fra Beckers muskeldystrofi, at in-frame deletioner giver mildere symptomer end frame-shift deletioner, der giver Duchennes muskeldystrofi. Idéen er, at fjerne de exons, der indeholder frame-shift mutationerne med Cas9, hvilket kunstigt vil skabe en in-frame deletion af det givne exon. Man omdanner altså den slemme Duchennes muskeldystrofi til den relativt mildere Beckers muskeldystrofi.

    Ex vivo genkorrektion: fjernelse af frame-shift mutationer

    De større deletioner, der medfører frame-shift mutationer, sidder ofte i bestemte hotspot-exons af DMD-genet. Det vigtige for korrektionen af et sådant exon, er at forhindre frame-shift mutationen i at ødelægge proteinet fuldstændigt og i stedet opnå produktion af et funktionelt alternativt dystrofin. En patient ramt af Duchennes muskeldystrofi har en deletion af hotspot exons 48 til 50, der medfører en frame-shift mutation i exon 51, hvormed der dannes et malplaceret stop-codon. Transskription, RNA-splicing og translation af det muterede DMD-gen (exon 47-52) til dysfunktionelt dystrofin, kan ses på figur 30. Bemærk, at dannelsen af et stop-codon, er forårsaget af en forskudt læseramme, grundet frame-shift mutationen, som er en konsekvens af deletionen. Dette betyder, at translationen af dystrofin ikke kan foregå korrekt.

    Figur 30 – Det muterede DMD-gen hos en patient med Duchennes muskeldystrofi. Her ses et udsnit af genet, fra exon 47 til exon 52. Frame-shift mutationen, som er opstået i exon 51, grundet en deletion af exon 48 til exon 50, forårsager et stop-codon. Transskription danner pre-mRNA, som indeholder et stop-codon, og dannelsen af mRNA fra pre-mRNA sker ved RNA-splicing, hvor introns fjernes og exons samles. Det færdige mRNA indeholder stadigvæk et stop-codon, og translationen stoppes derfor utidigt, hvilket medfører dysfunktionelt dystrofin, som forårsager Duchennes muskeldystrofi. 

    Ved at mutere RNA-splice-sitet mellem det muterede exon og førliggende intron, kan man overspringe brugen af det muterede exon i det færdige mRNA, da RNA-splicing ikke kan foregå normalt. Dermed vil mutationens konsekvens, altså stop-codonet, ikke blive medtaget i det færdige mRNA. Det producerede mRNA vil da kode for en kortere, men fungerende, version af dystrofin, hvormed sygdomsfænotypen bliver mildere. Denne strategi kaldes for exon-skipping, da vi aktivt fravælger brugen af specifikke exons. Dette gøres ved en destruktion af sekvensen, ved udnyttelsen af Cas9 og NHEJ. sgRNA blev designet til at ramme grænsen mellem exon 51 og det førliggende intron, hvormed Cas9 introducerede en indel-mutation i RNA-splice-sitet. Dette medførte, at den muterede exon 51 blev ignoreret ved RNA-splicing og at det nye mRNA havde en in-frame deletion af exons 48-51. Herved kunne funktionelt dystrofin produceres, dog ved en reduceret version, der mangler de dele, som kodet af exon 48-51. Genkorrektion, samt transskription, RNA-splicing og translation af det korrigerede DMD-gen (exon 47-52) til funktionelt dystrofin, kan ses på figur 31.

    Figur 31 – DMD-genet hos en patient med Duchennes muskeldystrofi, og genkorrektion (exon-skipping) med CRISPR/Cas9. Her ses et udsnit af genet, fra exon 47 til exon 52. Frame-shift mutationen, som er opstået i exon 51, grundet en deletion af exon 48 til exon 50, forårsager et stop-codon. Cas9 anvendes til at destruere dét RNA-splice-site, som håndterer exon 51. Transskription danner pre-mRNA, som indeholder et stop-codon. Dannelsen af mRNA fra pre-mRNA sker ved RNA-splicing, men den muterede exon 51 medtages ikke i samlingen af exons, da den Cas9-inducerede mutation betyder, at RNA-splicing ignorerer den. Det færdige mRNA indeholder ikke et stop-codon, da exon 51 er fjernet ved exon-skipping, og translationen fungerer derfor normalt, hvilket medfører produktionen af en afkortet, men funktionel, version af dystrofin.

    Med denne strategi, er det lykkedes at gendanne produktionen af dystrofin i iPSCs fra menneskelige hjertemuskelceller, hvormed kontraheringsfunktionen af hjertemuskulaturen blev genoprettet. Denne genmodifikation har stort potentiale til tilfælde af Duchennes muskeldystrofi, som er grundet frame-shift deletioner, ved at rette muskelcellerne til at give mildere symptomer. Dette kunne ligge baggrund for en potentiel ex vivo genterapi.

    In vivo genterapi i musemodeller: excision

    Sygdomme kan genskabes som modeller i andre organismer, såsom mus. mdx-mussemodellen af Duchennes muskeldystrofi indeholder en mutation i exon 23 af dystrofin genet, som frembringer et uhensigtsmæssigt stop-codon. Dystrofin-proteinet kan derfor ikke translateres færdigt. Fjernelse af det muterede exon 23 betyder, at proteinet kan translateres til en forkortet og funktionel version af dystrofin, ligesom det sås i forrige eksempel. Cas9 er blevet anvendt til at udføre en sådan excision af hele exon 23, ved multiplexing med to sgRNA, hvorefter NHEJ kan sammensætte genet. De to stykker sgRNA var designet til at ramme i intron-sekvenserne på hver side af exon 23. Genkorrektionssystemet blev leveret ved DNA-baseret levering igennem virale vektorer, som blev indført ved både lokal og systemisk injektion i mussemodellerne. Genkorrektionen er derfor in vivo. Den anvendte virus var adeno-associeret virus, der kun kan indeholde en begrænset mængde DNA, hvormed systemet måtte blive delt op. En mængde virus blev pakket med Cas9, mens en anden mængde virus blev pakket med de to stykker sgRNA. Ved brug af denne strategi, kunne dystrofin-produktionen genoprettes i mussemodellerne, hvormed strukturen og funktionen af musklerne blev forbedret. Der blev fundet få uventede bivirkninger, men ved videre optimering af systemets effektivitet og sikkerhed, har Cas9 et stort potentiale som genterapi i denne type genetiske sygdomme.

    CRISPR-teknologi i kræftforskning

    Kræftsygdomme er kritiske og kan medføre mange ubehagelige symptomer, samt have alvorlige konsekvenser, hvis ikke de bliver bekæmpet. Kræftsygdomme kaldes for multifaktorielle, da de kan skyldes sammenspil mellem mange forskellige faktorer, både genetiske og miljømæssige. Disse årsager kan variere meget mellem de enkelte tilfælde og derfor er kræft en meget kompleks sygdom at bekæmpe. Anvendelsen af CRISPR-teknologi er interessant indenfor kræftforskning, grundet kræftsygdommenes mange forskellige genetiske forhold, som kan undersøges og forhåbentligt behandles med denne nye lovende teknologi i fremtiden. Nogle hovedaspekter i kræftgenetik er onkogener og tumorsuppressorgener, som er enkelte gener, der har en direkte effekt på en kræftsygdoms udvikling. Onkogener fremskynder udviklingen af en kræftsygdom. Genet kan være blevet et onkogen, fordi det bliver overekspressioneret, og dermed laver for meget protein, eller, fordi der er opstået en gain-of-function mutation, der giver det resulterende protein en ny kræftfremkaldende egenskab. I begge tilfælde udvikles kræft. Tumorsuppressorgener undertrykker normalt kræft, hvormed manglen på generne forårsager kræft.  Tumorsuppressorgener kan miste deres effektivitet, fordi de underekspressioneres, og dermed laver for lidt protein, eller, fordi der er opstået en loss-of-function mutation, der fjerner den kræftundertrykkende egenskab fra proteinet. Metaforisk, kan man sige, at onkogener er speedere for kræft, som der trykkes hårdere på og tumorsuppressorgener er bremser for kræft, som slippes.

    Æggestokkræft

    Æggestokkræft kan opstå i kvinders æggestokke, hvor både ægceller og kvindelige kønshormoner produceres. I Danmark rammer æggestokkræft 553 nye kvinder hvert år. Æggestokkræft kan opstå på baggrund af mange forskellige faktorer, men der vil her tages et blik på DNMT1-genet. DNA methyltransferase 1 (DNMT1) er et vigtigt enzym for den epigenetiske vedligeholdelse af DNA. Enzymets normale funktion er at sætte methyl-grupper på DNA (methylering). Det har vist sig at overekspression af DNMT1, medfører hæmning af tumorsuppressorgener, hvormed disse ikke kan kontrollere cellevæksten. Ukontrolleret vækst af celler er et kendetegn for kræft. En destruktion af DNMT1-genet i kræftcellerne kan stoppe hæmningen af tumorsuppressorgenerne, så disse aktivt kan tilbageholde kræften. In vivo genterapi af denne type æggestokkræft er afprøvet i mussemodeller, der er specielt designet til sygdomsmodellering af kræft. Forsøgsmusene har en type mutation, der medfører, at de ikke kan udvikle brisselen, som er et vigtigt organ for immunsystemet. Dette muliggør, at musene let kan transplanteres med fremmet væv, såsom menneskelige kræftceller, hvormed de er meget betydningsfulde forsøgsdyr for kræftforskningen. Forsøgsmusene blev her transplanteret med menneskelige æggestokkræftceller. DNMT1-genet er vigtigt for den normale funktion af celler, og derfor ønskes det ikke, at genet bliver destrueret i raske celler. In vivo genterapien skal derfor være målrettet kræftcellerne.  Dette opnås ved sikre sig, at genkorrektionssystemet kun leveres til netop kræftcellerne. DNA-baseret levering blev anvendt, hvor et plasmid kodende for Cas9 og sgRNA blev pakket i nanopartikler, kaldet liposomer. Disse liposomer blev designet til at eftersøge kræftcellerne specifikt. Cas9 blev brugt til at destruere DNMT1-genet i kræftcellerne, ved at designe et stykke sgRNA, der specifikt genkendte DNMT1-genet. Indel-mutationer, dannet ved destruktionen, sørgede for at inaktivere genet. Denne strategi kunne succesfuldt hæmme kræftens spredning og dræbe nogle af kræftcellerne. Tilgangen har potentiale som en in vivo genterapi, der kan hæmme udviklingen af æggestokkræft, men der kræves et fortsat stort arbejde i at effektivisere korrektionen, så farlige bivirkninger undgås.

    Komplikationer og udfordringer ved genterapi med CRISPR-teknologier

    Komplikationer der findes ved selve CRISPR/Cas9-teknologien er åbenlyse problemer, eksempelvis ineffektivitet af homology directed repair grundet NHEJ. En af de største problemer er off-target effekter, da uventede mutationer kan opstå og give slemme bivirkninger, på grund af den manglende specificitet. Der haves yderligere komplikationer ved brug af CRISPR-teknologi til genterapi, som kort vil belyses her.

    In vivo versus ex vivo

    Ex vivo tilgangen er mere kompliceret og krævende end In vivo, grundet vedligeholdelse, dyrkning og tilbagetransplantation af de ekstraherede celler, men In vivo er knyttet til flere etiske problemer, grundet muligheder for nedarvning af genkorrektionerne. Yderligere, er effektiviteten af in vivo genmodificering betydeligt lavere end ved ex vivo genmodificering, hvilket også afhænger af effektiviteten af leveringen. Ex vivo genterapi giver mere mulighed for verifikation af genmodificeringen og der er flere muligheder for kombination med andre teknologier, da In vivo tilgangen er begrænset ved at foregå inde i kroppen. Der kræves mere forskning indenfor geneterapi, før disse tilgange bliver praktisk anvendelige.

    Individuel behandling kræver individuelt genterapidesign

    De samme genetiske sygdomme kan være grundet mange forskellige mutationer, hvormed de altså også skal behandles med forskellige genmodifikationer. Dette betyder, at den enkelte patient skal have specifikt designet sin egen genterapi. Dette kan være en stor udfordring for produktionen af de genterapeutiske komponenter, da mange overvejelser skal medtages. Eksempelvis skal hvert eneste sgRNA designes efter hver mutation, der skal rettes og med forbehold for minimale off-target effekter, samt maximal specificitet og effektivitet.

    Præcision og effektivitet af levering

    Pakningen af alle komponenterne af et genkorrektionssystem, der skal bruges til genterapi, er et problem for både DNA-, RNA- og protein-baseret levering. I DNA-baseret levering under brug af virale vektorer, kan man blive nød til splitte systemet op i flere viruspartikler. En udfordring ved protein-baseret levering er pakningen af det store Cas9-protein sammen med både sgRNA og en eventuel DNA-skabelon. Ved in vivo genterapi kræves der større kontrol over hvor genkorrektionssystemet havner, både ved systemisk og lokal injektion. Et andet aspekt er størrelsen af den dosis af Cas9 og sgRNA, der er nødvendig for at sygdommen kan kureres.

    Immunologisk respons på CRISPR/Cas9

    En vigtig pointe for brugen af CRISPR-teknologi i mennesker er, at Cas9 stammer fra en bakterie, hvormed man må forvente at immunsystemet reagerer. Fremmede proteiner skal overvåges af immunsystemet, da de kan være potentielt farlige. Cas9-proteinet kan blive elimineret af immunsystemet, men ydermere kan selve menneskeceller, der udtrykker Cas9-proteinet, blive dræbt. Ved brugen af DNA- og RNA-baseret levering forventes et større immunologisk respons end ved protein-baseret levering. Dette er grundet den aktive ekspression af det fremmedartede Cas9 i cellerne, fra det indførte DNA eller RNA, som kan være længerevarende. Tilstedeværelse af Cas9 er mere kortvarig ved brug af protein-baseret levering, da der ikke produceres mere Cas9 end der er blevet indført. Den kortvarige tilstedeværelse giver mindre mulighed for et immunologisk respons. Ydermere, kan indført Cas9-kodende DNA integrere sig permanent i cellernes DNA. Ved brugen af virale vektorer kan der især forventes et immunologisk respons, grundet viruspartiklernes patogene natur.

  • Case 4 - Gene drives til genmodifikation af populationer

    Gene drives og automatisk genmodificering af hele populationer

    CRISPR-teknologi tillader dannelsen af et utroligt magtfuldt genetisk værktøj, der kan genmodificere hele populationer ved en kædereaktion af mutationer. Dette genetiske værktøj kaldes for et gene drive og udnytter CRISPR/Cas9-genmodificering, til at manipulere genetikken bag nedarvning af gener.

    Genetik

    I den eukaryote genetik ses oftest diploide organismer, hvilket betyder, at de har to kopier af hver kromosomtype. Disse sammenhørende kopier kaldes homologe kromosomer. Hver kopi stammer fra hver af forældrene, hvormed de sandsynligvis er forskellige. Idet der haves to kopier af hvert kromosom, haves der også to kopier af hvert gen. Disse to kopier kaldes allelerne, og kan være forskellige, hvormed de koder for forskellige egenskaber af det samme gen. Haves to ens alleler er organismen homozygot, men hvis der haves to forskellige alleler, er organismen heterozygot. Allelernes ekspression kan beskrives som recessiv eller dominant. Er organismen heterozygot vil dominante alleler komme til udtryk i fænotypen, mens recessive ikke vil. Hvis organismen er homozygot, er allelerne ens og den delte egenskab kommer til udtryk. Placeringen af genet på kromosomet, og dermed allelerne, kaldes for locus. Et eksempel på denne type genetik kunne være blodtyper. Der haves ét gen, der koder for blodtypen. På hvert homologe kromosom sidder en allel af dette gen. Der findes 3 forskellige alleler: A (dominant), B (dominant) og 0 (recessiv). Man kan have én allel på hver af de 2 homologe kromosomer. De forskellige alleler er placeret i kromosomernes ABO-locus. Lad os anskue 3 eksempler på kombinationer:

    Den ene allel koder for A-blodtype (dominant), mens den anden koder for 0-blodtype (recessiv), hvormed personen udtrykker blodtype A. Disse koder for hver sin blodtype, hvormed der er tale om en heterozygot, men blodtype A er dominant og kommer til udtryk.

    Begge alleler koder for 0-blodtypen (recessiv), hvormed personen udtrykker blodtype 0. Dette kan kun lade sig gøre, fordi der er tale om en homozygot med recessive alleler. Der er ingen dominant allel tilstede, der kan dominere over det recessive udtryk.

    Haves en allel for A-blodtype (dominant) og en allel for B-blodtype (dominant), haves en speciel situation, der kaldes codominans. Her udtrykker personen blodtype AB, altså både A og B.

    Nedarvning

    Gener er dynamiske og udveksles mellem organismer på flere måder. Normalt ses, at gener nedarves efter de Mendelske arvelove, som beskriver videredistribution af gener mellem generationer. Fordelingslovene siger, at generne nedarves tilfældigt med lige stor sandsynlighed til hvert afkom og uafhængigt af hinanden. Mendels 1. lov – udspaltningsloven: Ved dannelsen af afkom adskilles allelerne fra hinanden, og afkommet arver én allel fra faderen og én allel fra moderen. Hver af de to nedarvede alleler kan være hver af forældrenes to alleler, med lige stor sandsynlighed. Dermed fordeles hver af to sammenhørende alleler med 50% sandsynlighed til afkom. Mendels 2. lov – uafhængig udvælgelse: Alleler af forskellige gener på forskellige kromosomer fordeler sig uafhængigt. Som med de fleste andre regler, findes der selvfølgelig undtagelser, herunder gene drives.

    Gene drives

    Gene drives er et opgør mod den Mendelske nedarvning af gener, da disse har til formål at fremme nedarvningen af specifikke alleler. Man kan sige, at der er tale om tvunget nedarvning af specifikke alleler til alt afkom, hvilket kaldes super-Mendelsk nedarvning. Gene drives er selviske alleler, der eftersøger bestemte sekvenser, som de kan kopiere sig selv ind i, hvormed de ødelægger den oprindelige sekvens. De spreder sig selv ved udnyttelse af organismens funktioner. Yderligere, kan gene drives bære på selvvalgte alleler, der koder for en given ny egenskab eller en anden genetisk ændring. Disse alleler behøver nødvendigvis ikke at være til gavn for organismen. Gene drives kan på denne måde implementere genetiske ændringer i hele populationer, ved tvunget spredning igennem den naturlige nedarvning af gener igennem generationer. Ansku den normale Mendelske nedarvning af gener som et møntkast, hvor der er 50% sandsynlighed for enten plat eller krone. På samme måde som et møntkast, nedarves én af hver af forældrenes to alleler tilfældigt. Gene drives svarer til en mønt, der altid giver dig den side af mønten du ønsker. Gene drives fjerner tilfældigheden for, om det bliver den ene eller anden allel og bestemmer, at det altid bliver den designede gene drive allel, der tvinges igennem. Dermed er der teoretisk set 100% sandsynlighed for nedarvning, fremfor 50%. Dette foregår ved, at gene drive alleler i et heterozygot individ kopierer sig selv over på den anden allel, og dermed skaber et homozygot individ for gene drive allelen. Dette sker for alle individer, der nedarver allelen. På figur 32 ses hvordan et gene drive overrumpler den naturlige Mendelske nedarvning, ved at overskrive de naturlige alleler og skabe homozygoter, som altid videregiver gene drive allen, og hvordan dette manipulerer nedarvningsmønsteret til at sikre gene drive allelens nedarvning.

    Figur 32 – Normal Mendelsk arvning sammenlignet med super-Mendelsk arvning, som ses ved anvendelsen af gene drives. 

    Gene drives kan bruges til at lave gen knock-outs og knock-ins af selvvalgte gener på hele populationer. Denne mutageniske proces er før blevet kaldt Mutagenic Chain Reaction (MCR), grundet sin automatiske og selvopretholdende dannelse af mutationer, som spreder sig som en kædereaktion igennem populationen. Baseret på konsekvenserne af genmodificeringerne på populationen, kan man inddele gene drives i to typer: Modification drives: designes med formålet om at modificere en population, eksempelvis ved at sprede specifikke gener blandt populationen. Disse gener kan give organismerne nye egenskaber, både fordelagtige og ugunstige. Suppression drives: designes med det simple formål at reducere eller fuldkommen eliminere en population, eksempelvis ved ødelæggelse af essentielle gener eller frembringelse af infertilitet.

    Anvendelser

    Gene drives er især brugbare inden for sundhed, miljø og landbrug. Mange forskellige arter kan have negative indvirkninger på miljøet og mennesker, såsom ved at forårsage sygdomme, ødelægge afgrøder eller true andre oprindelige arter. Derfor er det en attraktiv idé, at kunne kontrollere hele populationers skæbne ved selvopretholdende genetisk manipulering. Gene drives designes til den specifikke situation med forskellige genetiske komponenter, således at de fungerer optimalt i forhold til det givne formål. Genteknologien er utroligt effektiv og magtfuld, hvormed et stort ansvar hører med. En vigtig overvejelse er, at når først et gene drive er blevet sluppet løs i en population, så kan man ikke vende tilbage til den fuldkommen naturlige genotype igen, hvis gene drivet er effektivt og bliver implementeret i hele populationen. Man kan dog sprede nye gene drives, der har til formål at genoprette den forhenværende fænotype.

    Forhindre vektorbårne sygdomme

    Disse sygdomme spredes ved overførsel fra en organisme til en anden. Man kan stoppe disse sygdomme ved eksempelvis at eliminere organismen, der medfører smitten til mennesker, med suppression drives, eller forhindre, at organismen kan indeholde sygdommen med modification gene drives. Eksempler på vektorer for nogle kendte menneskelige sygdomme er: