Sådan kan vi få meget mere ud af biobanker og store genetiske databaser

Fremtidens teknologi 3. mar 2024 4 min Clinical Professor Thomas Werge Skrevet af Kristian Sjøgren

Forskere viser i et nyt metodestudie, at der kan trækkes meget mere klinisk relevant information ud af relativt rå eller tilsyneladende mindre betydningsfulde data fra store biobanker og genetiske databaser. Metoden kan også anvendes til at øge mængden af forskningsmæssig brugbar genetisk information om mennesker, som vi genetisk kun har målt relativt begrænset på, siger forsker.

Interesseret i Fremtidens teknologi? Vi kan holde dig opdateret helt gratis

Thomas Werge

Institute of Biological Psychiatry, Mental Health Centre Sct Hans, Copenhagen University Hospital Mental Health Services and Department of Clinical Medicine, University of Copenhagen.

Følg Thomas

Forestil dig, at du som forsker gerne vil undersøge genetikken bag depression.

Det kræver store mængder data, hvor du måske skal lave genetiske profileringer af 100.000 personer og sammenholde data med deres sygdomshistorik og andre fænotypiske træk.

Den slags studier koster en formue at lave, og hvis du i stedet ønsker at gøre brug af nogle af de store biobanker, der findes rundt om i verden, indeholder de måske ikke de data, som du skal bruge. Det gælder både de genetiske og de fænotypiske typer af data.

Nu viser et nyt studie, at det metodisk faktisk er muligt at tillægge personer sandsynligheden for nogle genetiske og klinisk relevante karaktertræk, uden at man overhovedet har målt de pågældende genetiske eller kliniske træk.

Disse data for sandsynlige genetiske og fænotypiske træk kan man så lave sine undersøgelser på og derved blive klogere på genetikken bag depression og hvordan den er forskellig mellem mennesker.

"Metoden er aktuel, fordi det gør, at vi kan få betydeligt mere indsigt i genetikken bag en sygdom, uden at vi har lavet en tilsvarende omfattende genetisk kortlægning af de personer, der er med i en given undersøgelse. Samtidig kan vi spare en masse ressourcer på disse typisk meget dyre studier, som på sigt kan gøre os i stand til at forudsige, om en given person har øget risiko for udvikling af for eksempel depression, eller om personen formentlig vil reagere positivt eller negativt på en given behandling," fortæller en af forskerne bag studiet, klinisk professor Thomas Werge fra Institut for Biologisk Psykiatri, Københavns Universitetshospital, og Klinisk Medicin ved Københavns Universitet.

Forskningen er offentliggjort i Nature Genetics.

Ikke nødvendigt at kende til de træk, man gerne vil studere

I studiet har forskerne valideret en metode til at blive klogere på personers genetik eller fænotypiske træk ud fra andre fænotypiske træk eller andre former for data.

Et eksempel kan være, at man gerne vil studere demens, men at man til sin undersøgelse kun har personer i alderen 30 til 50 år.

I denne gruppe har formentlig ingen udviklet demens, så det giver ikke meget mening at sammenholde denne gruppes genetik med risikoen for udvikling af demens.

I stedet for at vente 40 år på, at personerne i undersøgelsesgruppen begynder at udvikle demens, kan man i eksemplet benytte information om forældrenes sygehistorik med demens.

"Det vil sige, at vi i stedet for at måle på demens hos den person, som vi har genetiske data på, estimerer vi en sandsynlighed for demens ud fra viden om, hvorvidt forældrene havde demens. Vi udfylder på den måde en manglende viden om personernes fremtidige sygdom i vores undersøgelseskohorte med sandsynligheder," forklarer Thomas Werge.

Har én forælder haft demens, kan man tillægge personen en vis sandsynlighed for at udvikle demens, mens sandsynligheden for eksempel kan være 50 pct. højere, hvis begge forældre har haft demens.

"Vi behøver ikke kende til alt om en person for at kunne lave vores analyser. Hvis vi kender til nogle træk, kan vi udregne en sandsynlighed for andre træk, som vi er interesseret i, og det er nok til, at vi har styrke i data til at kunne trække resultater ud af vores undersøgelser," siger Thomas Werge.

Låner sammenhænge fra andre datasæt

I studiet viser forskerne, at man kan identificere slægtskaber mellem genetiske forskelle og mellem karaktertræk og bruge denne indsigt til ganske nøjagtigt at beregne andre personers sandsynlighed for klinisk vigtige karaktertræk og genetiske varianter, så disse personer også kan indgå og styrke sygdomsstudier.

Et eksempel kan være, at man om en person kun kender til personens fødselsvægt, uddannelse, køn og alder, men at man skal bruge personens højde i sin analyse.

Igen kan man ud fra data fra databaser med millioner af andre mennesker identificere sammenhænge mellem fødselsvægt, uddannelse, alder, køn og højde, og det gør, at man for personerne i sin egen undersøgelseskohorte kan lave en sandsynlighed for en højde på hver person, hvis højde er ukendt.

Denne sandsynlige højde kan så indgå i og væsentligt styrke studiet, så der kan komme brugbare konklusioner ud af det.

"Så selvom vi ikke kender til personens højde, men kun en sandsynlig højde, kan denne 'sandsynlige højde' alligevel indgå og bidrage i genetiske studier. Det interessante, som bliver vist i dette studie, er, at man kan bruge forældredata eller andre informationer om de personer, man er interesseret i at lave sine analyser på. Fordi man kender til sammenhænge mellem fænotypiske træk og genetik fra andre store datasæt, kan man regne sandsynligheden ud i sit eget datasæt," forklarer Thomas Werge.

Selv uden data kan forskere blive klogere på depression

I det omtalte studie viser forskerne, at den ovennævnte metode virker i en genetisk undersøgelse for depression.

Depression kan være en svær størrelse at studere, fordi selve diagnosen ikke er ja/nej på samme måde som for eksempel en diagnose med type 1-diabetes, eller når man måler højde eller vægt.

"Her er det tanken, at vi kan forstå genetik og årsager til depression meget bedre, hvis vi har flere data på store grupper af personer med depression. Men som sagt er den type studier meget omkostningstunge," siger Thomas Werge.

I stedet for at lave studierne fra bunden viser forskerne i deres studie, at man kan tage data fra store biobanker som for eksempel UK Biobank eller Biobanken i Region Hovedstaden, Danmark.

Biobanker indeholder ofte genetiske data på deltagere samt generelle oplysninger om tidligere sygdomme, uddannelse og lignende, men der mangler typisk detaljerede oplysninger om de mange specielle og klinisk afgørende karaktertræk, som varierer mellem personer med depression.

Det er disse data, som forskerne ikke behøver at kende til, fordi de kan udregne sandsynligheder for dem og derved lave deres analyser på de meget store datasæt, som er til rådighed.

"Grundlæggende data og ressourcer er der, og det koster ikke spidsen af en rumraket og en hel karriere at estimere de data, som mangler, men som man skal bruge. Man kan beregne sig til noget brugbart og derved identificere for eksempel genetik med betydning for et klinisk vigtigt aspekt af depression. Det kan få betydning for den kliniske verden og behandlingen af personer med depression," siger Thomas Werge.

Følg Fremtidens teknologi

"Phenotype integration improves power and preserves specificity in biobank-based genetic studies of major depressive disorder" er udgivet i Nature Genetics. Studiet er støttet af NIH, Lundbeckfonden, NIMH, Københavns og Aarhus universiteter. Danmarks Nationale Biobank er støttet af Novo Nordisk Fonden.

Clinical Professor

Thomas Werge

Institute of Biological Psychiatry, Mental Health Centre Sct Hans, Copenhagen University Hospital Mental Health Services and Department of Clinical Medicine, University of Copenhagen.

Følg Thomas

My research has focused on explaining the biological reasons that contributes to the development of severe mental disorders such as schizophrenia and...

Relaterede artikler

Fremtidens teknologi

19. dec 2021 5 min

Sådan kan vi få meget mere ud af biobanker og store genetiske databaser

Interesseret i Fremtidens teknologi? Vi kan holde dig opdateret helt gratis

Thomas Werge

Ikke nødvendigt at kende til de træk, man gerne vil studere

Låner sammenhænge fra andre datasæt

Selv uden data kan forskere blive klogere på depression

Thomas Werge

Relaterede artikler

Klimaforandringers betydning for miljøet er styret af nedbør

Forældre der mister et barn rammes oftere af hjertesvigt

Infektioner er forbundet med en markant øget risiko for epilepsi

Ny opdagelse: Sådan opfatter øret, hvad der bliver sagt

Psykiske lidelser giver flere fysiske sygdomme

Ny opdagelse kan gøre forskere klogere på Parkinsons sygdom på det helt fundamentale niveau

Klar, parat … Sådan sætter hjernens startneuroner os i gang – eller løb

Spændende emner

Se alle 1019

Genbrug 4

Virus 89

Lyd 9

Biologi 25

HPV 13

Celler 49

Nanoteknologi 28

Screening 32

Knogler 41

DNA 49

Kemoterapi 13

Parasitter 13

Protein 125

Fedt 64

Hjerte 71

Podcasts 14

Kræft 140

Migræne 9

Klima 32

Fertilitet 19

Psykologi 35

Bakterier 117

Immunforsvar 71

Kost 48

Plast 10

Mental sundhed 50

Graviditet 56

Skizofreni 14

Antibiotika 46

Øjne 9

Depression 28

Influenza 15

Tænder 7

Hormon 58

Overvægt 97

Parkinsons 21

Vitaminer 16

Hjerne 116

Antistoffer 24

Rygning 21

Søvn 22

Mikrobiom 30

Antioxidanter 4

Metabolisme 68

Sprog 7

Demens 13

Nerver 26

Svampe 26

Blod 62

Sygdom 44

Fugle 6

Aldring 28

Computer 37

Mikroorganismer 37

COVID-19 94

Stamceller 34

Gener 176

Big data 82

Vaccine 46

Kemi 79

Kromosomer 20

Motion 39

Kolesterol 19