Computer med kunstig intelligens har lært sig selv, hvordan den bedst kan finde mening i de enorme mængder DNA-data, som mikrobiologer trækker ud af tarmenes milliarder af bakterier.
Inden for de seneste 10 år er forskere blevet chokerede over, hvor stor betydning tarmbakterier har for vores sundhed.
De små mikrober i tarmene har på en lang række områder betydning for både vores fysiske og mentale helbred, og en usund sammensætning af tarmbakterier er forbundet med udvikling af sygdomme som type 2-diabetes, kronisk tarminflammation, fedme, depression, Parkinsons og Alzheimers.
Inden for de samme 10 år er forskere også blevet bedre til at ekstrahere DNA fra tarmbakterierne, så de møjsommeligt kan stykke de genetiske koder sammen én for én og lære dem bedre at kende. Her er de dog blevet pinefuldt opmærksomme på, at der i den grad har manglet matematiske modeller, som ud fra informationen i milliarder og atter milliarder af små stykker DNA kan fortælle, hvilke bakterier der findes i tarmene hos den enkelte person.
Det problem er dog til en vis grad nu løst af danske forskere, som har gjort det muligt at få en meget bedre indsigt i arvemassen hos de bakterier, som enten kan holde dig rask eller gøre dig syg.
”Problemet har været, at man har haft nogle matematiske modeller, som har virket og givet indsigt i de tusindvis af bakterier, som bor i vores tarme, men de har kun givet os indsigt i toppen af isbjerget så at sige. Vi har kunnet se en fraktion af bakterierne og kunnet få indsigt i kun en del af deres arvemasse. Med vores nye matematiske model kan vi få indsigt i langt flere bakterier og i deres DNA,” fortæller en af forskerne bag den nye model, lektor Simon Rasmussen fra Novo Nordisk Foundation Center for Protein Research ved Københavns Universitet.
Modellen og forskningen bag modellen er offentliggjort i Nature Biotechnology.
Som at samle 1.000 puslespil, der er blandet sammen
I store træk drejer det nye forskningsarbejde sig om at forstå, hvilke bakterier der lever i vores tarme, og hvad de har af betydning for vores helbred.
I vores tarme lever der i omegnen af 1.000 forskellige bakteriearter, og i ét gram afføring er der 100 mia. bakterier.
Alle disse bakterier spiller en rolle for vores helbred, og for at kunne finde ud af, hvilken rolle de spiller, er det nødvendigt at sekventere deres arvemasse og studere deres DNA. Ved at studere DNA’et kan forskere identificere, hvilke proteiner bakterierne kan lave og derfor også få en bedre forståelse af deres rolle i tarmen.
I den sammenhæng er problemet, at bakterierne ikke lader sig dyrke enkeltvis i laboratoriet. I stedet er forskere nødsaget til at sekventere hele bakteriesamfundets samlede mængde DNA og efterfølgende forsøge at stykke sammen, hvilke bidder DNA der hører til hvilke bakterier.
Analogt svarer det til at blande 1.000 puslespil på tusindvis af brikker hver og derefter forsøge at samle de enkelte puslespil uden at vide, hvordan de skal se ud. Det vil givetvis være muligt at samle nogle brikker til bidder af de forskellige puslespil, men der vil uundgåeligt være mange brikker, som det er umuligt at få placeret.
”Økosystemet i tarmen er ekstremt varieret og komplekst. Det svarer til at gå en tur i en skov og se 1.000 dyr. For at få bedre indsigt i dette komplekse økosystem er vi nødsaget til bioinformatisk at analysere på data fra økosystemets samlede arvemasse, men det er lettere sagt end gjort,” forklarer Simon Rasmussen.
Computer lærer sig selv at stykke DNA-puslespil sammen
Til at løfte opgaven har Simon Rasmussen med sine kollegaer grebet fat i kunstig intelligens.
Kunstig intelligens kan lære at finde mønstre i gigantiske datasæt på to forskellige måder:
- Supervised learning, hvor en programmør giver eksempler på løsninger, som den kunstige intelligens skal lære ud fra.
- Unsupervised learning, hvor computerprogrammet selv lærer at hitte rede i data og designe sine egne regler.
Den nye model, som Simon Rasmussen med sine kollegaer har udviklet, benytter unsupervised learning til på egen hånd at lære kortet over tarmbakteriernes arvemasse at kende.
”Vi giver bare programmet data og lader den så selv finde ud af, hvordan den kan trække mest mening ud af det. Det gør, at programmøren ikke kommer til at sætte begrænsninger for modellen, og så kan den opdage sammenhænge, som mennesker ikke kan. Det gør det også lettere for den at ”samle puslespillene”. Med den nye model er vi gået fra at kunne få indsigt i omkring 100 ud af 1.000 bakteriearter i tarmene til at kunne få indsigt i mange flere, måske 400. Vi kan også få analyseret 90 pct. af deres DNA mod blot 50 til 60 pct. tidligere,” siger Simon Rasmussen.
Kræftbehandling virker kun, hvis specifikke tarmbakterier er til stede
Simon Rasmussens forskningsgruppe arbejder ikke kun med computernørderier, men forsøger at udnytte viden fra de avancerede computerprogrammer til at få en bedre forståelse for blandt andet sammenhængen mellem tarmbakterierne og udvikling af sygdomme som type 2-diabetes og kronisk tarmbetændelse.
Personer med de to nævnte sygdomme mangler ofte flere forskellige bakterier i deres tarme, og i fremtiden bliver det måske muligt at identificere, hvilke bakterier det drejer sig om og erstatte dem for på den måde at kurere eller lindre sygdommene.
Perspektivet gælder også inden for andre sygdomme. Blandt andet fortæller Simon Rasmussen om et videnskabeligt studie, der kom ud i august 2020. Det studie viste, at immunterapi til behandling af kræft er afhængig af nogle specifikke tarmbakterier, som lærer immunterapien at genkende kræftceller.
”Også her vil det være interessant at se på, om man i forbindelse med immunterapi skal sikre, at patienter med kræft har de nødvendige bakterier i tarmene. Der er også perspektiver inden for psykiske lidelser. Siden vi udviklede vores nye model har hundredvis af forskere benyttet sig af den til at blive klogere på netop de bakterier, som de arbejder med,” fortæller Simon Rasmussen.