Data science har for alvor gjort sit indtog, både i forskningsverdenen og resten af samfundet. Dette bredt anvendelige forskningsområde kan tilmed hjælpe med at gøre verden til et bedre sted. Blandt andet når det kommer til at bremse udbredelsen af malaria i Dar es-Salaam og andre afrikanske storbyer.
En bestemt art af malariamyg har fundet vej til mange afrikanske storbyer, bl.a. Tanzanias største by, Dar es-Salaam. Det drejer sig om en invasiv myggeart, Anopheles stephensi, som kommer fra Asien. Myggen er særligt glad for de fugtige miljøer i byerne. Hvis denne myggeart for alvor spreder sig, er der risiko for store udbrud af malaria i byerne, særligt i de uformelle bebyggelser, hvor folk bor tæt.
For at undgå disse udbrud vil et internationalt forskerhold bestående af epidemiologer, biologer, geografer, dataloger og arkitekter bruge data science til at undersøge, hvordan myggens udbredelse hænger sammen med arkitektur og byplanlægning i Dar es-Salaam. Forskerholdet vil udvikle en specialudviklet deep learning-algoritme, der skal hjælpe bl.a. lokale myndigheder med at bekæmpe malaria og andre myggebårne sygdomme.
”Vi har samlet en række forskellige fagligheder for at vi sammen kan prøve at finde ud af, hvordan vi kan bruge data science og billeder til at forstå mere om i dette tilfælde malariamyg, og hvordan malariamyg kan påvirke områder i byer,” fortæller Jakob Brandtberg Knudsen, som er dekan for arkitektur på Det Kongelige Akademi, og står i spidsen for projektet for projektet i Dar es-Salaam.
Indsamling af data – og myg
I projektet skal forskerne anvende højtopløselige satellitbilleder og dronebilleder til at kortlægge husene i særligt de uformelle dele af byen – det, der også nogle gange kaldes slumområder. De skal også foretage dataindsamling på landjorden, hvor de går fra hus til hus og interviewer beboerne og indsamler myggeprøver.
”På den ene side bruger vi meget højtopløselige satellitbilleder. Det er billeder, der minder om det, man ser fra Google Earth. Samtidig har vi folk på jorden. De registrerer boligerne, interviewer de folk, der bor der, finder ud af, hvad husene er bygget af, og finder ud af, hvordan omgivelserne er. Og så samler vi myg. Vi samler en masse myg inde i husene, og vi samler myg fra omgivelserne. Det gør vi for at finde ud af, hvor myggene er, og hvilken sammenhæng der er mellem husenes beskaffenhed, omgivelserne, og hvor mange myg der er – og dermed også risikoen for at få malaria,” uddyber Jakob Brandtberg Knudsen.
Jakob Brandtberg Knudsen har tidligere været med til at lave forskning, der har kortlagt boligforhold i subsaharisk Afrika, og undersøgt hvordan forbedrede boligforhold har indflydelse på risikoen for at få malaria. Undersøgelserne viste nogle ret direkte sammenhænge mellem, hvor godt huse er konstrueret og udbredelsen af sygdomme: Beboerne i huse, der er bedre konstrueret, oplever en reduktion af såvel malaria som andre typer af sygdomme, eksempelvis respiratoriske sygdomme og diarré.
Denne forskning blev i 2019 udgivet i to artikler i Nature: ”Mapping changes in housing in sub-Saharan Africa from 2000 to 2015” og ”Reduced mosquito survival in metal-roof houses may contribute to a decline in malaria transmission in sub-Saharan Africa”. Resultaterne danner i høj grad grundlag for det nye forskningsprojekt i Dar es-Salaam, ikke mindst fordi forskerne opdagede, at tagkonstruktioner spiller en stor rolle i udbredelsen af malariamyg: Jo flere huse med ståltage frem for stråtækte tage, desto færre myg, fordi myggene overlever dårligere i huse med ståltage.
Det gav inspiration til at koble forskellige typer af data og til det nye projekt i Dar es-Salaam, hvor målet er at udvikle en deep learning-algoritme, der kan trænes i at genkende forskellige former for bebyggelser og omgivelser på satellitbillederne – eksempelvis tage og vandhuller – så billederne kommer til at indeholde en masse information, der kan kvantificeres og omsættes til risici for malariaudbrud.
Flere data skaber bedre beslutningsgrundlag
Når algoritmen er udviklet, kan den bruges som redskab for eksempelvis lokale myndigheder, NGO’er, WHO og andre, som arbejder med at forebygge malaria. Jo flere informationer om de lokale forhold, der er til rådighed, desto nemmere bliver det at træffe de rette valg om præventive indsatser, der kan lede til færre tilfælde af malaria og andre sygdomme.
Projektet er derfor et godt eksempel på det, der er hele kernen i data science: At indsamle så mange data om en given sag som muligt for at skabe det bedst mulige beslutningsgrundlag.
”Hvis man skal sige det meget kort, handler data science om, at vi i højere og højere grad kan måle verden – det, vi kalder digitalisering. På den databaggrund kan vi bygge modeller, og de giver mulighed for, at vi kan lave evidensbaserede beslutninger, hvor vi beslutter på baggrund af facts, og ikke hvad vi synes. Det gør vi i alle dele af samfundet, og i stigende grad. Det betyder, at data science-feltet er i super hurtig udvikling og af stigende betydning. På mange måder er det den motor, der skal drive, at vi får vækst ud af digitaliseringen,” forklarer Lars Kai Hansen, professor og sektionsleder på DTU Compute og formand for Danish Data Science Academy.
I podcasten Forskningsfortællinger kan du høre Jakob Brandtberg Knudsen fortælle mere om forskningsprojekt i Dar es-Salaam, og du kan høre Lars Kai Hansen fortælle mere om den rolle, data science spiller i samfundet – og vil komme til at spille i fremtiden.