Genome mining i regnskoven

Introduktion: I projektet undersøger vi hvordan man ved brug af bioinformatik kan kortlægge regnskovens planters DNA og identificere nye stoffer der kan bruges som lægemidler. 

 

Naturstoffer er bioaktive stoffer med unikke egenskaber, som har vist sig at være interessante og værdifulde for os mennesker. Nogle velkendte eksempler er koffeinen i vores kaffe og nikotinen i cigaretter, der produceres af henholdsvis kaffeplanten og tobaksplanten. En stor del af de farve-, duft- og smagsstoffer vi bruger til daglig, er baseret på forbindelser produceret af planter. Det samme gælder den medicin vi bruger. Aspirin er et af verdens mest almindelige smertestillende produkter. Det stammer fra piletræers bark og blade. Et af de bedste lægemidler vi i dag har mod sygdommen Malaria, er baseret på stof der hedder Artemisinin som produceres af planten Artemisia annua L. Begrebet naturstoffer omfatter også stoffer produceret af mikroorganismer som bakterier og svampe. Kigger man på nyere lægemidler, så er hele 40 % af dem baseret på naturstoffer, og ser man specifikt på lægemidler mod kræft og infektionssygdomme så bliver tallet helt op til 70%. Derfor er der meget stor interesse for naturstoffer. Man leder efter nye spændende stoffer, og man forsøger at forstå, hvordan stofferne dannes. Udfordringen ved naturstoffer er, at de typisk produceres i meget små mængder. For at kunne producere stofferne i større mængder, må vi først identficere generne, der står bag deres syntese, og så derefter indføre disse gener i en passende organisme, såsom alger. De resulterende alger vil derefter kunne producere interessestoffet i store mængder. 

Genome mining dækker over de dele af denne proces, der omhandler sekventering af genomer, samt identifikationen af biosyntesevejene der er til stede i genomerne. Identifikationen foregår ved brug af bioinformatik, og bruges til at forudsige hvilke naturstoffer, den pågældende organisme er i stand til at producere. 

Den første del af dette undervisningsprojekt handler om hvordan man kan bruge bioinformatik til at finde de genetiske opskrifter planterne bruger til at danne avancerede naturstoffer, og så bruge denne viden til at starte en produktion af naturstofferne i andre organismer.

Potente plantestoffer

Teori:

Dette projekt indeholder 6 separate undersider med teori der er en god ide at læse inden man går i gang med casene. Afsnittene er placeret i kronologisk orden, og kan tilgås ved at trykke på de farvede knapper.

Caseopgaver

Til dette projekt er der lavet tre programmerings- og bioinformatiks øvelser. De er lavet i Jupyter Notebooks, som er en bestemt type fil skrevet i Python. Øvelserne er tilgængelige ved hjælp af Colab, som er en online platform udviklet af Google. Det betyder, at det ikke er nødvendigt at installere nogle programmer for at lave projektet. Det skal gøres klart, at det ikke er en forudsætning at elever eller lærer har kendskab til programmering for at lave øvelserne. I vil blive introduceret til Python (et programmeringssprog ofte brugt indenfor bioinformatik) og lære at bruge andres koder, men det er meget begrænset hvad I selv skal skrive. Platformen tillader desuden at alle kan programmere på samme tid, og deler det på en nem måde – lidt ligesom at dele et google docs med andre. Desuden giver Colab adgang til brug af frie CPU’er (computerkraft) og er gratis at benytte!  De eneste forudsætninger for at bruge det, er at man har en google konto og at man er på internettet. Arbejde med opgaverne kræver at man bruger enten Google Chrome, Firefox eller Safari som internet browser. 

Hvis du ikke har en google konto kan du oprette en her: https://accounts.google.com/signup/v2?flowName=GlifWebSignIn&flowEntry=SignUp

Læs teksten grundigt og husk at I skal lave en kopi af dokumentet før I selv kan skrive ændringer eller køre koden.

 

Introduktion til programmering

Formålet med denne øvelse er give en introduktion til programmering med Python. De vigtigste koncepter og elementer vil blive gennemgået, og du vil få en fortåelse for, hvordan man kører kode i Colab. Øvelsen er en forudsætning for at kunne lave resten af øvelserne. 

 

Link til øvelsen:

https://colab.research.google.com/drive/174XonqIHY-aufYVe88GzG8ON4_3yfYkj

Case 1: Planter 

Tropiske regnskove er de steder på Jorden med størst biodiversitet. Selvom de kun dækker 6% af verdens landsareal, er de estimeret til at være hjem for 50% af alle landlevende dyr og planter. De rummer en guldmine af uopdagede naturstoffer og genetisk variation. Et eksempel på en særlig spændende plante fundet i regnskoven er Artemisia annua L. Det blev opdaget at planten producerer naturstoffet kaldet artemisinin som kan bruges til behandling af malaria. Malaria skyldes en parasit, der overføres til mennesker gennem bid af inficerede myg og World Health Organization (WHO) vurderede i 2015 at hvert år opdages omkring 212 millioner nye tilfælde af malaria, hvor 429.000 tilfælde fører til dødsfald. Der er derfor en enorm efterspørgsel på naturstoffet. Det har medført at planten er blevet plukket i en ekstrem grad, således at den er gået hen og blevet en truet art. For at imødekomme efterspørgslen og stadig bevare biodiversiteten, har forskere sekventeret planten og identificeret de gener der producerer det bioaktive stof. Dette muliggjorde en syntetisk produktion af stoffet i stor skala og samtidig sikrede plantens overlevelse.

I denne case arbejdes der med planten Artemisia annua L., og der vil blive gennemgået de forskellige elementer der er vigtige for at kunne identificere de gener, der er involveret i dannelsen af artemisinin.

 

Link til øvelsen: 

https://colab.research.google.com/drive/19hR-aIx-B0KEWvXN7kzPGvQGX1rtm5M5 

Case 2 – KEGG og vanilje

I denne case skal du forestille dig, at du lige er blevet ansat som bioinformatiker for en stor bioteknologisk virksomhed. Virksomheden arbejder på at opskalere produktionen af forskellige fødevarer. I øjeblikket er vanilje i kæmpe efterspørgsel, men fordi ægte vanilje kun kan dyrkes ét sted i verden, er det både utroligt dyrt og kun tilgængeligt i meget små mængder. Din chef kommer forbi, og du får til opgave at finde de gener, der koder for de enzymer, der er involveret i pathwayen i dannelsen af vanilje fra orkideplanten. Andre firmaer har gjort noget lignende, men fordi produktet giver så stort udbytte, er deres viden ikke offentligt tilgængeligt. Den eneste information du kan finde, er forskningsresultater der ligger på KEGG.

Din første opgave er at finde pathwayen for vanilje, derefter hvilke enzymer der står for omdannelsen af stofferne og til sidst identificere de gener der koder for enzymerne, således at de kan indsættes i en anden organisme – f.eks. E. Coli, som nemt kan dyrkes og derved udtrykke produktet i massiv skala.

 

Link til øvelsen:

https://colab.research.google.com/drive/1Dr5OCmIr31dRTLKUbw0LI9MYkPfFjGSz 

Lærervejledning

En vejledning til brug af dette projekt kan findes her: Lærervejledning Regnskov

Løsninger til opgaverne kan findes på følgende side: https://www.biotechacademy.dk/undervisning/laerervejledninger/

Adgang til disse tilsendes lærere efter henvendelse over mail til: biotech@bio.dtu.dk

Kildehenvisning:
Dette projekt blev udgivet i februar 2020. Det er udarbejdet af Biotech Academy og er blevet opdateret løbende.

null

Projektet er udarbejdet af Charlotte Kaae

Charlotte Kaae

null

Bent Petersen har været sparringspartner på dette projekt. (Lektor, Section for Evolutionary Genomics, Københavns Universitet)

Bent Petersen

null

THOMAS SICHERITZ-PONTÉN har været sparringspartner på dette projekt. (Professor, Section for Evolutionary Genomics, Københavns Universitet)

Thomas sicheritz-Pontén

null

Iben Julie Scmidt har været sparringspartner på dette projekt. Hun er desuden ansvarlig for alle film og podcast produceret til projektet. (Kommunikationsspecialist, Scientifica)

Iben Julie Schmidt

null

Birger Lindberg Møller har været sparringspartner på dette projekt.

Birger Lindberg Møller

null

Projektet er udarbejdet på DTU Bioengineering

DTU Bioengineering

null

Børne- og undervisningsministeriet har været sponsor for dette projekt.

Børne- og undervisningsministeriet