Verhaal | 24 maart 2020

Coronavirus te lijf met big data

Egon Willighagen maakt onderzoek toegankelijk voor collega-wetenschappers

Wetenschappers over de hele wereld werken koortsachtig aan de ontwikkeling van een vaccin tegen het nieuwe corona-virus. Chemicus en universitair docent Egon Willighagen draagt in Maastricht zijn steentje bij door (samen met zijn collega's van de afdeling Bio-informatica) data toegankelijk te maken voor collega-wetenschappers. Maar hoe gaat dat in zijn werk?

iStockBig data is het nieuwe toverwoord in de wetenschappelijke wereld. Wereldwijd gegevens verzamelen, bijvoorbeeld over de behandeling van kanker, en daaruit de beste behandeling filteren voor die ene, unieke patiënt. In het geval van het nieuwe corona-virus is er vooral behoefte aan het toegankelijk maken van data. Want sinds de uitbraak van het virus in Wuhan in China is er een explosie aan artikelen over het Covid19-virus. Het aantal wetenschappelijke publicaties over corona-virussen bedraagt inmiddels rond de 29.000. Dat zijn overigens niet alleen artikelen over het nieuwe Covid19-virus, maar ook over coronavirussen waar de wereld eerder mee te maken heeft gehad, lees SARS en MERS. Hoe dan ook: het is natuurlijk praktisch gezien onmogelijk om zo'n berg aan publicaties te lezen. Dus moet die berg op de een of andere manier ontsloten worden, zodat wetenschappers de voor hen relevante informatie eruit kunnen halen en daar hun voordeel mee kunnen doen.

Filter
Willighagen doet dat door relevant wetenschappelijk onderzoek te bundelen, informatie aan elkaar te koppelen en een filter te maken waarmee de berg aan data toegankelijk wordt voor onderzoekers. Hij koppelt relevante zoektermen en auteursnamen aan publicaties, zogenoemde annotaties. Ook probeert hij literatuur te ontsluiten door middel van zogenoemde identifiers, identificatienummers, vergelijkbaar met het documentnummer van een paspoort. Die methode van ontsluiting is vergelijkbaar met een woordenboek of een telefoonboek.

Verschillende tools
Wikidata is de database die Willighagen gebruikt om informatie aan elkaar te koppelen en Scholia is de tool om die koppelingen weer te geven. Voor het nieuwe coronavirus bijvoorbeeld is de gekoppelde informatie te vinden via de volgende link https://tools.wmflabs.org/scholia/topic/Q82069695. Willighagen gebruikt Wikidata en Scholia dus om collega's een overzicht te geven over specifieke onderwerpen. Onderzoekers kunnen hiervan ook meeprofiteren via de open access-bron die door Willighagen gevoed wordt: https://egonw.github.io/SARS-CoV-2-Queries/. En ook social media worden niet geschuwd: Twitter zet hij in voor bewustwording en mobilisatie. Willighagen: "Dat doe ik meer uit een persoonlijk oogpunt. Ik tweet artikelen die trendbreuken laten zien. Of die de ernst van de zaak onderstrepen." En dan is er tot slot nog WikiPathways, de database die door collega's van Willighagen is opgezet om nog specifiekere informatie over het Covid19-virus te verzamelen en te delen: https://www.wikipathways.org/index.php/Pathway:WP4846