Små gener, der koder for små proteiner, har på grund af deres ringe størrelse været umulige at opdage før nu, men dansk forsker vurderer, at vores arvemateriale har flere tusinde.
I et internationalt samarbejde med dansk deltagelse har forskere været det menneskelige genom igennem med en tættekam og fundet hundredvis af gener, der er så små, at det ikke før nu har været muligt at opdage dem.
Den genetiske tættekam består af avancerede teknikker og bioinformatiske supercomputere, der kan jonglere med den ufatteligt omfangsrige information i menneskets arvemasse.
Forskningsarbejdet har givet forskere det til dato mest komplette overblik over de genetiske processer, der får os alle sammen til at være velfungerende mennesker.
Derudover har forskerne i forsøg med menneskelige celler også slået de mulige gener i stykker for at finde ud af, om generne er gener i det hele taget, og om de sekundært har betydning for vores cellers overlevelsesmuligheder.
”Det har indtil nu ikke været nemt at identificere gener, der koder for proteiner, som er mindre end 100 aminosyrer lange, og derfor har vi ikke vidst, om det menneskelige genom har mange eller få gener, som er kortere end det. Det er dog forskningsmæssigt interessant at finde ud af, hvor mange gener vi taler om, og om deres funktion eventuelt kan være relevant i en sundhedsmæssig sammenhæng,” fortæller professor og forskningsleder Matthias Mann fra Novo Nordisk Foundation Center for Protein Research ved Københavns Universitet og Max Planck Institute of Biochemistry i München, Tyskland.
Forskningen er publiceret i Science.
Det menneskelige genom havde langt færre gener end antaget
Da det menneskelige genom blev kortlagt i 2004 (de indledende data kom frem i 2001), havde tusindvis af forskere arbejdet på projektet i mere end 10 år, og det havde kostet milliarder af kroner.
Forløsningen, som alle ventede spændt på, var et endelig tal på antallet af gener i menneskets arvemasse.
Var det 80.000, 100.000 eller måske endda 120.000 gener?
Da artiklen landede i Nature, kom svaret som en overraskelse for alle: sølle 20.000 gener i alt. Det var ikke mere end rundorme og bananfluer.
”Det var klart allerede på det tidspunkt, at de analysemetoder, som blev brugt, havde nogle begrænsninger. Det efterlod spørgsmålet, om der er flere mindre gener og hvor mange. Problemet var, at analyserne ikke kunne vise, om de kortere genetiske sekvenser var reelle gener eller bare støj fra de teknikker, som blev benyttet til at fragmentere og analysere DNA’et,” siger Matthias Mann.
Gener er DNA-sekvenser med særlige egenskaber
For at belyse netop det spørgsmål greb forskerne bag det nye forskningsprojekt fat i en lang række værktøjer til at finde gener, som koder for proteiner på mindre end 100 aminosyrer, hvilket indtil videre har været den nedre grænse.
Først og fremmest benyttede forskerne bioinformatiske teknikker til at sammenligne mange forskellige genomer.
Her kan de se, at hvis korte sekvenser af arvemateriale er velbevarede på tværs af mange forskellige genomer, er sekvenserne formentlig gener, der koder for proteiner.
Derudover skeler forskerne også til nogle mere eller mindre specifikke krav hvis en genetiske sekvens skal blive klassificeret som et gen.
”Normalt skal gener starte med et startkodon, og så er der også nogle andre krav til sekvenserne, hvis vi skal identificere dem som værende rigtige gener, men det er ikke altid tilfældet,” siger Matthias Mann.
Små proteiner drukner i baggrundsstøjen
Den bedste måde at verificere et gen på er ved at finde det protein, som genet koder for.
Når det gælder meget små proteiner, kan det dog i sig selv være svært, fordi udtrykket af proteinerne kan forsvinde i mængden.
I det menneskelige proteom vil proteinerne komme til udtryk som lange sekvenser af aminosyrer på en baggrundsstøj af en masse proteinstumper.
De meget små proteiner kan på den måde forsvinde i baggrundsstøjen, og det er derfor svært at verificere, at de overhovedet findes.
Derudover kan de små proteiner være svære at finde, hvis de ikke er særligt hyppige.
”Men også her er teknikkerne blevet bedre, så vi i dag er i stand til at finde kortere proteiner, som er udtrykt i mindre mængder,” forklarer Matthias Mann.
Matthias Mann bidrog til det nye forskningsarbejde med netop proteinanalyser ved hjælp af massespektrometri.
Mange flere menneskelige gener end hidtil antaget
Samlet set brugte forskerne bag det nye forskningsprojekt flere genom- og proteinteknikker til at identificere flere tusinde nye potentielle gener.
Sideløbende udnyttede forskerne CRISPR-teknologien (en genetisk saks) til at slå de identificerede gener i stykker i menneskelige celler for at finde ud af, om det påvirker cellernes overlevelse.
Hvis cellernes vækst blev ændret, eller de døde, konkluderede forskerne, at generne kodede for vigtige proteiner.
Forskerne fandt hundredvis af den slags nye gener.
”Der er i hvert fald flere tusinde gener, som vi ikke har identificeret endnu, og derfor er det sandsynligt, at antallet af gener i menneskets arvemateriale skal øges fra 20.000 med flere tusinde gener,” siger Matthias Mann.
Gener påvirker immunforsvaret og cellecyklus
Forskerne undersøgte også, hvad mange af de forskellige gener gør i menneskelige celler.
De undersøgte, hvordan de kodede proteiner interagerer med andre proteiner i allerede kendte proteinkomplekser, og hvilke signalveje disse proteiner spiller ind i.
Eksempelvis satte forskerne fluorescerende molekyler på proteinerne for at se, hvor de lokaliseres i cellen.
Nogle viste sig at være på celleoverfladen og andre i mitokondrierne, der er cellernes kraftværker.
Undersøgelserne afslørede i det store perspektiv, at mange af de nyopdagede mikrogener er vigtige for cellecyklus, da de er ophav til proteiner i specifikke processer.
En stor gruppe proteiner er desuden involveret i immunforsvarets respons på fremmedlegemer.
”Det har taget 20 år at komme hertil, men med de fantastiske genetiske og proteomiske værktøjer, som vi nu har til rådighed, vil vi endelig kunne se på det menneskelige genom i meget højere opløsning, og vi vil kunne opdage mange fascinerende mekanismer, der forklarer, hvordan vores organisme fungerer inden for sundhed og sygdomme,” siger Matthias Mann.
”Pervasive functional translation of noncanonical human open reading frames” er udgivet i tidsskriftet Science. Matthias Mann er forskningsdirektør ved Novo Nordisk Foundation Center for Protein Research, Københavns Universitet samt Max Planck Institute of Biochemistry i München, Tyskland.