Data is king!

Vi er midt i en revolution. Adgang til enorme datamængder betyder, at dem, som kan trække mening ud af galskaben, kan skabe værdifuld viden og bidrage til at skabe digital vækst. Big Data er ved at blive big business, og fremtiden byder på muligheder, hvis man kan knække koden.

25.10.2013 | Rasmus Rørbæk

Der skyller en flodbølge af data ind over verden. De seneste år er mængden af tilgængelige informationer kun blevet større og større, og udviklingen vil blot fortsætte. Big Data handler om at finde metoder til at udvinde nyttig viden. På Aarhus Universitet er professor Lars Arge i stand til at omdanne uhyre datamængder omkring nedbør til et nyttigt kort, der kan vise de præcise konsekvenser af f.eks. skybrud. (Fotomontage: Coulourbox/Rasmus Rørbæk)

Sådan ser det ud, når big data giver konkret mening. Ved at kombinere terrænmålingerne og geografiske data med beregninger for, hvor vandet vil løbe hen på basis af højdeprofilerne, kan man se præcis, hvor vandet løber hen og lægger sig. Her på billedet er det for Aarhus Universitets campus i Aarhus. De blå farveområder er der, hvor vandet vil være ved et meget kraftigt skybrud med nedbør på 10 cm – 100 millimeter. (Screenshot: Lars Arge)

Uanset, hvor man kigger hen i verden, stiger omfanget af tilgængelig information. Blot det at følge med i strømmen af data og finde metoder til at lagre de bidder, der kan vise sig værdifulde, er udfordrende nok. At analysere på syndfloden af data, sortere i den, finde mønstre og skabe værdifuld viden er endnu sværere.

”I en tid, hvor det bliver lettere og lettere at indsamle gigantiske datamængder om alt fra klimaudvikling til genomer, bliver det en udfordring at overføre det til ny viden, der kan komme samfundet til gode. Det er denne udfordring, som vi arbejder på at løse ved at udvikle komplicerede algoritmer, der kan skabe håndgribelig værdi,” siger professor Lars Arge, der leder grundforskningscenteret Center for Algoritmer for Massive Datamængder, MADALGO, på Aarhus Universitet.

Han og forskningsgruppen har knækket koden til at skabe en unik ekspertise og en service, der har resulteret i spin-out virksomheden SCALGO, Scalable Algorithmics, der placerer Aarhus i en international førerposition på området.

”Mens det er svært at gøre noget ved vejret som sådan, så er der meget store gevinster i det, hvis man på forhånd kan sige, hvilke geografiske områder, der er sårbare for f.eks. oversvømmelse efter et skybrud. Den indsigt gør det muligt at træffe forholdsregler, der vil spare den enkelte borger og samfundet for både enorme gener og omkostninger,” forklarer Lars Arge.

Det er gigantiske mængder af information, der skal bearbejdes, når man f.eks. vil simulere konsekvenserne af et skybrud, men SCALGO videreudvikler på forskning lavet på grundforskningscenteret og har udarbejdet nogle særdeles effektive algoritmer, der kan håndtere de store datamængder og gøre dem brugbare.

26.000.000.000

Selskabet har i dag solgt softwarepakker og services til en række danske kommuner og statslige institutionersamt til udenlandske firmaer. SCALGO har også samarbejdet med rådgivningsvirksomheden COWI om at skabe et såkaldt skybrudskort, der er baseret på højdeobservationer for hver 1,6 gange 1,6 meter hen over Danmark opsamlet ved hjælp af fly.­­ I alt giver det 26 milliarder observationer og en ufattelig høj detaljeringsgrad.

Ved at kombinere terrænmålingerne og geografiske data med beregninger for, hvor vandet vil løbe hen på basis af højdeprofilerne, kan kortet forudsige konsekvenserne af nedbør i specifikke områder og af eventuelle havstigninger som følge af klimaforandringer.

Det er meget nyttig viden bl.a. for potentielle boligkøbere, der nemt kan få overblik over, om et hus ligger så uheldigt placeret, at vandet risikerer at kunne havne i kælderen, hvis der skulle komme kraftig regn. Men værktøjet er også relevant for myndigheder, der skal planlægge nye byområder, kloakeringer, ejendomsvurderinger og meget mere.

Information contra viden

Skybrudskortet er et eksempel på, hvordan informationerne i store datamængder kan transformeres til unik viden. Med værktøjet kan diffus big data omformes til noget, der kan gøre en konkret forskel.

”Det er der en meget stor personlig tilfredsstillelse i at se. Det her er datalogisk grundforskning, der direkte kan berøre den enkelte borger. Vores forskning bruges i praksis og skaber værdi for brugerne og et forretningsgrundlag for vores lille opstartsvirksomhed, der igen kan bidrage til dansk vækst indenfor et område, der har international bevågenhed.

Vores fordel er samtidig, at vi har muligheden for at basere vores ydelser og forretning på original og banebrydende grundforskning. Vi er ikke ”bare” gode til det, vi laver. Vi er de første i verden, der kan gøre det her og er kommet først med noget helt nyt,” siger Lars Arge.

Lars Arge er ikke i tvivl om, at vi herhjemme har gode muligheder for at blive foregangsland og international testbed for fremtidige big data eventyr. ”Big data” er alt andet end en halvsmart betegnelse fra it-verdenen, og allerede nu kan man se, hvordan f.eks. sundhedssektoren, miljøteknologien og transportområdet gør brug af store datamængder og omdanner det til en ressource – ganske som MADALGO og SCALGO har gjort det.

”Vores forskning tager udgangspunkt i at håndtere store datamængder. Vi er ikke eksperter indenfor klimamodeller, men er gode til at håndtere enorme datamængder. I teorien er det ikke så svært at lave et kort, der viser konsekvenser af nedbør. Vand vil altid løbe nedad, og hvis man kender højdeprofilen af et område, kan man beregne, hvor vandet vil løbe hen og samle sig. Det har været selve datamængden, der har forhindret, at et værktøj som vores har set dagens lys før,” siger Lars Arge.

Større. Bedre. Billigere.

De seneste år er mængden af tilgængelig information nærmest eksploderet – og alle indikatorer siger, at der kun vil komme mere til i datastrømmen.

”Data is king. Verden over er der ved at ske et paradigmeskift i tilgangen til både forskning og forretning. Big data betyder, at man fremover skal udvikle metoder, der kan destillere data fremfor at skabe data.

Hvor det før kunne koste spidsen af en jetager og tage et ondt år at kortlægge et genom, kan man nu gøre det på en uge for et par hundrede dollars, og indenfor f.eks. myndighedssektoren giver big data muligheder for at effektivisere og forebygge, fordi man baserer sine beslutninger på basis af meget store informationsmængder.

Her kan Danmark noget specielt, da vi har unikke databaser i offentligt regi, som er ved at blive gjort tilgængelige. Det kommer til at betyde, at det bliver muligt at udvikle nye løsninger, der tager udgangspunkt i big data.  Samtidig betyder det, at når nye innovative virksomheder for alvor begynder at kunne kombinere informationer fra forskellige datakilder, vil vi virkelig komme til at se et skred,” forklarer Lars Arge.

Links:
MADALGO
SCALGO

Natur og teknologi, Offentligheden / Pressen, Hele AU