AI kan gøre genredigering mere sikker til behandling

Fremtidens teknologi 8. jan 2026 10 min Professor Yonglun Luo, Professor and bioinformatician Jan Gorodkin Skrevet af Sybille Hildebrandt

Forskere har udviklet en AI-model, der kan forudsige, hvor sikkert og præcist genfejl kan rettes med en mere skånsom form for CRISPR-genredigering – før man overhovedet går i laboratoriet. Modellen hjælper forskere med at fravælge risikable design og vælge de ændringer, der har størst chance for at kunne bruges i behandling af patienter.

Interesseret i Fremtidens teknologi? Vi kan holde dig opdateret helt gratis

Emil bliver forpustet efter få trin på en trappe, og allerede på første repos brænder det i benene, som var han løbet en lang tur. På overfladen ligner han en helt almindelig 25-årig, men han lever med en arvelig blodsygdom, hvor kroppen nedbryder for mange af de røde blodlegemer, længe før de har gjort nytte. Lægerne kan pege helt præcist på årsagen: dybt inde i genkoden sidder der et enkelt forkert bogstav i hans DNA, en lille skrivefejl der får resten af systemet til at vakle.

På papiret findes der ellers et oplagt modtræk. Med genteknologien CRISPR kan man i princippet rette den slags fejl og bytte det forkerte bogstav ud, så blodcellerne igen bliver robuste. Alligevel holder lægerne sig tilbage, for hver gang de overvejer en rettelse, må de regne med, at indgrebet ikke alene retter fejlen, men kan efterlade uønskede ændringer lige ved siden af det sted, de prøver at reparere, og som potentielt ophæver det der var intentionen.

Det er netop den udfordring, et nyt studie i tidsskriftet Nature Communications vil gøre op med. Et forskerhold fra Københavns Universitet og Aarhus Universitet har bygget en AI-model, der kan prøvekøre en CRISPR-plan på computeren, så man kan spore sig ind på, hvor i DNAet, man kan opnå den bedste og sikreste redigering i patienterne. Modellen vurderer både, hvor effektiv en rettelse er, og hvor stor risikoen er for ekstra ændringer i DNA’et omkring målet.

Holdet ledes af professor Jan Gorodkin, bioinformatiker ved Center for non-coding RNA in Technology and Health, Institut for Veterinær- og Husdyrvidenskab på Københavns Universitet, og professor Yonglun Luo, forsker i genomredigering ved Institut for Biomedicin og Steno Diabetes Center Aarhus, Aarhus Universitetshospital.

Celleforsøg og beregninger løfter hinanden

Forskerne fortæller, at den nye metode for første gang giver det mest præcise overblik over, hvilke steder i DNA en planlagt rettelse både er effektiv og har lav risiko for de ekstra uønskede ændringer. Modellen viser med andre ord, hvor man med størst sandsynlighed rammer genfejlen rent, og hvor advarselslamperne bør blinke.

“Vi kan se, at vores model rammer betydeligt bedre end de værktøjer, der fandtes i forvejen, når vi tester på uafhængige datasæt. Den forudsiger både effektiviteten og mønsteret af DNA-ændringer mere præcist end de andre metoder,” siger Jan Gorodkin.

Yonglun Luo understreger, at det krævede to meget forskellige kompetencer at nå dertil. Han beskriver sin egen gruppe som dem, der år efter år bygger de store, kontrollerede datasæt i celler, mens Jan Gorodkins gruppe udvikler de algoritmer, der kan trække mønstrene ud af dem.

“Vi har gennem mange år arbejdet på at få data af høj kvalitet fra virkelige celleforsøg, og Jans gruppe har udviklet AI’en til at læse dem. Vores studie viser, hvor langt man kan komme, når man lader laboratoriet og beregningerne arbejde tæt sammen. Ingen af delene kunne have løst opgaven alene,” siger Yonglun Luo.

Gen-saksen, der finder den rette fejl

CRISPR kan i sin grundform forstås som to små værktøjer, der arbejder sammen. For at forstå, hvorfor det er svært at rette én lille fejl uden at skabe nye, er det nødvendigt først at se på, hvordan CRISPR-værktøjet arbejder inde i cellen.

Det ene er selve gen-saksen, et protein som for eksempel Cas9, der kan skære i DNA eller lave mere forsigtige ændringer. Det andet er en kort RNA-streng, som fungerer som styresnor, en såkaldt guide. Den er skrevet med en bestemt rækkefølge af bogstaver, der spejler rækkefølgen i det DNA-stykke, man gerne vil ramme.

Inde i cellen flyder saks og guide rundt som et makkerpar, hvor guiden hele tiden scanner DNA’et. I det øjeblik den møder et sted, hvor bogstaverne står i samme rækkefølge som i guiden, hægter den sig fast, og saksen får lov til at arbejde netop dér. I fagsprog kalder forskerne denne styresnor for en guide-RNA – cellens pendant til en søgeadresse.

Det er netop denne kombination, en mere skånsom form for genredigering bygger videre på. I stedet for de grove snit, hvor den klassiske CRISPR-klipper knækker begge DNA-strenge og efterlader usikre reparationer, bruges værktøjet her til at rette enkelte DNA-bogstaver så skånsomt som muligt.

Forskerne har ikke opfundet den metode, som kaldes base editing. Deres bidrag er, at de har udnyttet det eksisterende molekylære maskineri til at opbygge store, ensartede datasæt fra celleforsøg – og brugt dem til at træne en AI-model, der kan forudsige både, hvor effektiv en planlagt rettelse er, og hvor stor den relative risiko er for uønskede ændringer i DNA’et omkring selve redigeringsstedet.

Den klassiske CRISPR-klipper er nyttig, når man vil slå et gen ud, men den gør præcise bogstavskift usikre, fordi cellens reparation ikke altid følger den plan, man havde tænkt.

Base editing er udviklet som et mere nænsomt alternativ. Hvor den klassiske CRISPR-klipper laver brud i begge DNA-strenge, arbejder base editing ved kun at påvirke den ene streng. Det mindsker risikoen for de utilsigtede bivirkninger, der kan opstå, når cellen selv skal reparere et dobbeltstrengsbrud, og gør det muligt at rette én genetisk “tastefejl” mere kontrolleret.

Een genetisk tastefejl ad gangen

I stedet for at klippe hele DNA-strengen over kan forskerne her ændre ét enkelt bogstav i arvemassen – langt mere skånsomt end tidligere metoder. Her bruger forskerne et CRISPR-værktøj, hvor der sidder et særligt enzym på saksen.

Først går enzymet målrettet efter ét bestemt bogstav på den ene DNA-streng og laver det kemisk om til et andet, mens den modsatte streng stadig er hel. Bagefter laver værktøjet et lille snit i den modsatte streng. Når cellen reparerer snittet, bruger den den redigerede streng som facitliste og kopierer den komplementære partner af det nye bogstav over på den anden side. Til sidst har begge DNA-strenge den ønskede rettede stavelse.

Man kan sammenligne det med en korrekturpind, der først retter et enkelt tegn på den ene side af et foldet papir og derefter får kopien til at følge med. Denne nænsomme metode kalder forskerne base editing, og selve værktøjerne er specialiserede genredigeringsværktøjer. Nogle af dem kan for eksempel ændre A til G, andre C til T.

Selv meget præcise ændringer i DNA kan få utilsigtede følger, hvis værktøjet også påvirker bogstaver tæt på det sted, man forsøger at rette.

Netop derfor er modellen bygget til systematisk at forudsige alle de mulige ændringer i området omkring den ønskede rettelse og give en score for hver af dem, så forskere kan vurdere, om en planlagt redigering er meningsfuld, før den testes i laboratoriet.

“Det er netop de små ekstra ændringer rundt om målet, vi er bekymrede for, når vi taler om behandling af patienter. Derfor har vi brug for værktøjer, der både kan rette genfejlen og hjælpe os med at styre uden om de mest risikable design,” siger Yonglun Luo.

Uden den sortering er præcis genredigering stadig for usikker til at kunne bruges bredt.
Det gælder især, når teknologien skal bruges i behandling af patienter. Netop den udvælgelse er AI-modellens opgave: at sortere de sikre rettelser fra de risikable, før de testes i celler – og længe før de når patienter.

Uens data gør sikre forudsigelser svære

At udvikle den nænsomme gen-saks og en AI-model til at styre den er kun den ene halvdel af arbejdet. Den anden halvdel handler om det grundlag, modellen står på: de data, den lærer af.

Netop her så Jan Gorodkin og Yonglun Luo et hul i værktøjskassen. De ville både opbygge et stort, ensartet datasæt for den skånsomme genredigering, hvor tusindvis af kombinationer bliver målt på samme måde, og samtidig udvikle en AI-model, der kan lære af de mange eksisterende datasæt verden over – uden blot at blande dem til et gennemsnit, der udvisker forskellene.

“Hvis man vil have en model, der også virker uden for ens egen lille forsøgsverden, er man nødt til at give den et langt bredere og mere solidt fundament. Det kræver data, der er målt systematisk og kan tale sammen med de datasæt, andre har lavet,” siger Jan Gorodkin.

Baggrunden er, at de mange base-editing-forsøg, der de senere år er gennemført verden over, er udført med forskellige celletyper, værktøjsvarianter og forsøgsdesign. Det gør det let for en model at lære mønstre, der passer til én bestemt forsøgsopstilling, men som ikke nødvendigvis holder i en anden.

Samtidig betyder det, at modellens forudsigelser er stærkest inden for de typer genredigeringsværktøjer og cellemodeller, den er trænet på. Derfor måtte den fodres med et datasæt, der var samlet og målt systematisk fra bunden – og det blev startskuddet til den serie forsøg, Yonglun Luos gruppe gik i gang med.

Et fælles bibliotek af tusindvis af genforsøg

Det arbejde begyndte med, at Yonglun Luos forskergruppe byggede et helt bibliotek af små DNA-stykker. Hvert stykke svarer til et bestemt sted i menneskets arvemasse og har en guide knyttet til sig.

Biblioteket blev pakket ind i uskadelige virusskaller og ført ind i en velkendt menneskecellelinje. Cellerne fik samtidig én ud af to base editors: ABE7.10, som kan lave bogstavet A om til G, eller BE4, som kan lave C om til T.

Efter en periode høstede forskerne DNA’et fra cellerne og læste det bogstav for bogstav. For hver guide kunne de se to ting: hvor stor en andel af DNA-kopierne der var blevet ændret, og hvilke bogstaver i vinduet omkring guiden der var byttet.

“Det særlige ved den måde at gøre det på er, at vi måler tusindvis af forskellige kombinationer i den samme cellemodel og med de samme betingelser. Det giver et datasæt, hvor vi kan sammenligne resultaterne direkte og virkelig se mønstrene i, hvordan base editors opfører sig,” siger Yonglun Luo.

Metoden kalder de SURRO-seq i den videnskabelige artikel – et systematisk katalog over, hvordan tusindvis af genrettelser faktisk opfører sig i celler.

I praksis fungerer den som et stort opslagsværk. Ud for hver kombination af guide og base editor står der, hvor kraftigt værktøjet virker, og hvor rent snittet bliver. I dette projekt endte gruppen med sikre målinger for over 11.000 guides i alt for de to base editors.

AI’en lærer af hver eneste lille ændring

Det var de data, Jan Gorodkins gruppe tog udgangspunkt i.

De nye målinger blev slået sammen med flere andre publicerede datasæt om base editing fra internationale grupper. Til sidst var modellerne baseret på mere end 40.000 forskellige guides hvis udfald de var trænet på.

Ud fra oplysninger om DNA-sekvensen omkring målet, guide-design og forsøgsbetingelser skulle AI’en lære at forudsige to ting: hvor stor en del af DNA-kopierne der bliver rettet, og hvordan de forskellige mulige kombinationer af bogstavsskift fordeler sig i vinduet omkring guiden.

Modellerne har navnene CRISPRon-ABE og CRISPRon-CBE, efter de to typer base editors, der redigerer hhv A til G eller C til T. Modellernes input er en sekvens og en editeringsplan, og deres output er et bud på både styrke og renhed af rettelsen.

“Vi giver modellen både selve DNA-sekvensen, et mål for aktiviteten af base ændringerne og et fingeraftryk af, hvilket datasæt forsøget stammer fra. På den måde kan den bedre skelne mellem, hvad der er generelle biologiske mønstre, og hvad der skyldes tekniske forskelle mellem forsøgene,” siger Jan Gorodkin.

Mærket for datasættet viste sig at være vigtigt. Det hjælper modellen med at skelne mellem forskelle, der handler om biologi – for eksempel særlige DNA-mønstre – og forskelle, der skyldes selve forsøgsopstillingen. Uden de mærker falder træfsikkerheden tydeligt.

Nye modeller rammer sikrere end de gamle

For at se, hvor godt modellerne står, testede forskerne dem på datasæt, AI’en ikke havde set under træningen, og lod dem konkurrere med eksisterende, specialiserede værktøjer som DeepABE, DeepCBE, BE-HIVE og BE-DICT.

CRISPRon-ABE og CRISPRon-CBE klarede sig bedre end eksisterende værktøjer på begge de parametre, der betyder noget i praksis: De forudsagde både, hvor kraftig en rettelse bliver, og hvordan de mulige DNA-udfald fordeler sig i vinduet omkring guiden. Også når de to mål blev samlet i én fælles vurdering, lå deres AI højere end de øvrige modeller.

En efterfølgende analyse viste, at tallet for Cas9-aktivitet fylder meget i modellens beregninger. Det peger på en tæt kobling mellem, hvor godt den klassiske CRISPR-saks rammer et sted i genomet, og hvor godt base editors virker samme sted.

Alt det er tekniske detaljer, men for forskerne er pointen, at de nu kan omsætte de mønstre til noget, der kan bruges direkte, når man planlægger nye forsøg.

Færre blindskud i laboratoriet

Resultaterne kan allerede nu komme patienter til gavn. Modellerne ligger frit tilgængelige for forskere på en webside og som software, der kan downloades.

En forsker kan tage en konkret genfejl, skrive DNA-sekvensen ind, vælge den type base editor der er i spil, og få en liste over mulige guider. Samtidig følger et bud på, hvilke guider der efter modellens beregninger rammer rent, og hvilke der har høj risiko for mange bystander-ændringer.

“Vi har fra begyndelsen ønsket, at det her skulle være et praktisk værktøj, som andre kan tage ned og bruge direkte i deres egne projekter. Tanken er, at de hurtigere kan finde frem til de sikreste og mest lovende løsninger, i stedet for at bruge kræfterne på dårlige bud,” siger Yonglun Luo.

I laboratoriet kan værktøjet betyde færre blindskud. I stedet for at teste ti forskellige guider kan forskere begynde med de få, modellen vurderer som mest lovende, hvilket sparer både tid, penge og forsøgsarbejde.

På længere sigt kan værktøjet også få betydning for planlægningen af kliniske forsøg. Flere forskningsgrupper og firmaer arbejder allerede med base editing mod blandt andet blodsygdomme, og et bedre overblik over de mest risikable og de mest lovende guider kan spare både patienter og forskere for mange omveje.

Stærkt fundament, men ikke det sidste ord

Studiet dækker bestemte, veletablerede typer base editors og bygger i høj grad på systematiske forsøg i én menneskecellelinje.

Næste trin bliver at opbygge lignende datasæt for flere varianter af værktøjerne og for celletyper der ligger tættere på dem, læger bruger i behandling – for eksempel blodstamceller. Samtidig kan den måde at kombinere datasæt på overføres til andre former for genredigering, som prime editing, hvor målet er at redigere multiple base på en gang.

For Emil ændrer studiet ikke hverdagen i morgen. Han bliver stadig forpustet på trappen. Men det ændrer det grundlæggende vilkår for fremtidens genbehandlinger: at man i stigende grad kan regne på sikkerheden, før man griber ind i menneskers arvemasse. Når farlige og upræcise rettelser sorteres fra på skærmen i stedet for i en celle eller et forsøgsdyr, øges chancen for, at de rettelser, der en dag bruges i behandling, både rammer genfejlen og lader resten af DNA’et være i fred.

Yonglun Luo is a professor of biomedical research at Aarhus University, specialising in regenerative medicine, gene therapy, and RNA-based treatments....

Jan Gorodkin is Professor of Bioinformatics at the University of Copenhagen, where he conducts research in computational biology with a particular foc...

Udforsk emner

Spændende emner

Dansk
© All rights reserved, Sciencenews 2020