Genome mining opsummering
Planter producerer et bredt spektrum af sekundære metabolitter som hver især har særlige egenskaber. Eksempelvis koffeinen i kaffe, krydderiet vanilje eller medicin som artemisinin. Grundet sekundære metabolitters store potentiale, er der stor akademisk og industriel interesse i at fremstille dem kunstigt. For at kunne dette, er det nødvendigt at kortlægge plantens genom, således at man har al den genetiske information og derved kan identificere de gener der koder for de enzymer der er involveret i biosyntesevejen, til fremstillingen af den særlige sekundære metabolit.
Figur 9 opsummerer denne proces. Først tages en prøve fra planten, hvorfra man kan udvinde plantens DNA i laboratoriet og derefter sekventeres det ved brug af en eller flere af de forskellige typer af sekventering. Resultatet fra sekventeringen er uoverskueligt mange DNA-sekvenser (reads). Disse reads er meget korte og skal samles til længere sekvenser, i den proces der hedder assembly. Målet er at kunne genskabe plantens samlede genom.
De assemblede sekvenser indeholder nu store områder med gener, hvis funktion er ukendt. For at angive (annotere) hvilken funktion de forskellige sekvenser har, søges de mod en database som indeholder information omkring eksisterende sekvenser og deres funktion (f.eks. vha. værktøjet BLAST). Resultatet er en annotering af gener, som giver information om hvilke proteiner generne producerer eller er involveret i. Yderligere skal biosyntesevejen for den sekundære metabolit undersøges, for at kunne identificere de forskellige enzymer som er nødvendige i dannelsen af stoffet. Når de pågældende enzymer er identificeret, kan man udlede hvilke gener der koder for dem. Når man kender generne og har identificeret dem på de annoterede sekvenser, kan man indsætte generne i alger eler bakterier. Produktionen af den sekundære metabolit kan herefter opskaleres ved brug af fermenteringsteknologi, og efter en oprensningsproces står man tilbage med sit færdige produkt.