Gå til UniProt her.
Gå tilbage til program/database oversigt her.
UniProt er en online database, der indeholder informationer omkring proteiner.
Beskrivelse
UniProt er en af de mest omfangsrige databaser, når det gælder informationer om proteiner. Informationerne, der fås gennem UniProt, inkluderer blandt andet:
- Proteinsekvensen og -strukturen.
- Funktionen af proteinet.
- Aminosyremodifikationer.
- Lokaliteten hvor det aktive protein udfører sin funktion.
- Vigtige områder i proteinet, f.eks. active sites.
- Hvilke organismer der fremstiller det.
- Sygdomme der kan være relateret til protein.
- Henvisning til andre databaser.
Brug
UniProt kan anvendes til at indhente viden om et protein, da databasen blandt andet giver et godt overblik over proteinfunktioner. UniProt læres bedst at kende ved at lave søgninger på forskellige proteiner.
Generel guide
I UniProt kan man søge efter proteiner ved at anvende enten accessionnummeret (se infoboks 1) eller ved at søge via fritekst.
Hvis man vælger at søge på accessionnummeret, søger man på et specifikt protein og får dermed kun ét resultat. Dette anbefales, hvis man kender accessionnummeret og gerne vil finde informationer om netop det protein. Kender man derimod ikke accessionnummeret, kan man foretage en fritekstsøgning. Hvis man vil søge efter eksempelvis insulin, indtaster man det i søgefeltet (se figur 1) og får dermed en resultatliste med alle de sider fra UniProt, der indeholder tekst hvori insulin indgår.
Da UniProt er koblet sammen med mange af de mest omfangsrige databaser, vil en uspecifik søgning (som en fritekstsøgning ofte er) i UniProt for det meste give en meget stor mængde af resultater.

Figur 1. Startsiden i UniProt. Klik for at se figuren i stor format.
For at mindske antallet af resultater kan man gøre søgningen mere specifik.
Søgningen kan foretages ved at angive forskellige parametre, blandt andet proteinnavn, hvilken organisme detstammer fra, den subcellulære lokation (se infoboks 2) etc.. Valget af søgningsparametre afhænger af det protein, man vil finde, og hvor nøjagtigt man ønsker, at resultatet skal være.
De nævnte parametre kan bestemmes ved at lave en avanceret søgning gennem Advanced Search (se figur 1) Hvis man eksempelvis vil søge efter Immunoglobulin G fra en mus, kan man i første søgefelt skrive IgG (se figur 2), trykke Advanced Search dernæst vælge AND og så specificere i det fremkomne felt at resultat OGSÅ skal indeholde det næste søgekriterium. I feltet Field kan man vælge organisme og tilslut skrive mus musculus (der er det latinske navn for en almindelig husmus) i det andet søgefelt, se figur 2.
NB! Husk at søge på engelske navne og latinske navne.
Figur 2. Brugen af en avanceret søgning, Advanced Search. Klik for at se figuren i stor format.
Søgning med UniProt giver som nævnt ofte mange resultater, så det anbefales at specificere sin søgning med Advanced Search. Eksempelvis vil søgning på insulin også give resultater med bl.a. insulinreceptor. For at undgå resultater der er beslægtede med det protein, man vil finde, men ikke er selve proteinet, kan man benytte NOT-kriterier. NOT bruges på samme måde som AND, men vil specificere at søgningen IKKE må give resultater, der indeholder det efterfølgende søgekriterium. På denne måde indsnævrer man antallet af resultater og letter det efterfølgende arbejde, der er i fortolkningen af søgeresultaterne.
Et eksempel på et søgeresultat kan ses i figur 3. Felter, der er vigtige i forhold til at kunne forstå selve resultatlisten, er markeret med en ring. Informationerne i felterne under punktet fortæller om det givne resultat og giver dermed en indikation af, om man er på rette spor i sin søgning. Felterne inkluderer blandt andet proteinnavnet og navnet på den organisme, proteinet stammer fra. Under feltet Accession findes proteinets accessionnummer, som man kan klikke på for at komme til proteinets UniProt side.

Figur 3. En resultatside efter søgning i UniProt. Klik for at se figuren i stor format.
For at læse om et protein og få informationer omkring det, skal man gå til proteinets UniProt side. Dette gøres ved at klikke på accessionnummeret, der står med blåt (se figur 3).
UniProt siden indeholder en beskrivelse af proteinet. Detaljeringsgraden varierer alt afhængig af den viden, der er opnået omkring proteinet. UniProt siden er inddelt i forskellige områder, hvoraf de vigtigste er følgende:
-
Names and origin, der indeholder en generel, kort beskrivelse af proteinet.
-
General annotation (Comments), der giver en uddybende forklaring af proteinets funktion. Dette er en god sektion at læse for at danne sig et overblik over proteinet, og hvilken rolle det har i organismen.
-
Sequence annotation (Features), der beskriver de forskellige domæner i proteinet. Dette kan eksempelvis være signalsekvenser, der giver information om proteinets sidste destination i cellen, aminosyremodifikationer eksempelvis acetylering og glycosylering, eller hvis der er blevet fjernet aminosyrer i det færdige protein.
-
Sequence, der giver hele aminosyresekvensen af proteinet.
Et eksempel på en UniProt side kan ses her, hvor overskrifterne er de områder, der er nævnt ovenfor. Det anbefales selv at lave en simpel søgning i UniProt, hvorefter proteinets side kan undersøges.
I Øvelse 1. Aktin, fra mRNA til tredimensionelt protein (1.B), Øvelse 2. Myostatins proteininteraktioner og organismers slægtsskab (2.A) og Øvelse 4. Identifikation og visualisering af ukendt protein (4.B) arbejder man med UniProt.