Skip to content
Use the search to find information about InterSystems products and solutions, career opportunities, and more.

Natural Language Processing in actie: kunnen we de woorden vinden in de strijd tegen COVID‑19?

Natural Language Processing in actie: kunnen we de woorden vinden in de strijd tegen COVID‑19?

Hopelijk lees je dit in goede gezondheid, in de breedste zin van het woord. De COVID-19-pandemie vormt een ongekende uitdaging voor onze maatschappij en economie. Misschien zit je thuis met kinderen die de grenzen van jouw geluiddempende koptelefoon opzoeken. Misschien ben je juist helemaal alleen en afhankelijk van technologie als Skype, WhatsApp en de oude vertrouwde telefoon, om zo in contact te blijven met de mensen om je heen, zelfs als het om jouw beste vrienden gaat.

Deze lastige tijden kunnen ons aansporen om nieuwe oplossingen te zoeken – nieuwe manieren om de kinderen bezig te houden, nieuwe plekjes in de buurt om te gaan wandelen, nieuwe hobby's om te leren met behulp van online artikelen en webinars. Veel mensen proberen uit te vinden wat nou waardevol is, zonder van tevoren te weten waar ze eigenlijk naar op zoek zijn.

Voor professionele onderzoekers en andere kenniswerkers is dit bijna dagelijkse routine. Zij navigeren door de beschikbare kennis om relevante informatie te vinden die meer aandacht nodig heeft. Op deze manier doen zij nieuwe inspiratie op voor nieuwe experimenten die uiteindelijk ook iets opleveren.

Ongeveer een maand geleden hoorde ik dat het Allen Institute for Artificial Intelligence een grote dataset van wetenschappelijke artikelen over COVID-19 en coronavirussen gratis beschikbaar heeft gemaakt. Hun doel is simpel: de pandemie bestrijden door innovatie aan te moedigen en te versnellen. Dit trachten zij onder andere door betaalmuren als abonnementen en licentiekosten weg te nemen die normaal gesproken de toegang tot deze beschikbare kennis beperken.

Hun corpus bevat maar liefst 44.000 wetenschappelijke artikelen. Daarmee kunnen kinderen zich zeker vermaken totdat ze weer naar school mogen (stel je eens voor hoeveel plezier een tweejarige zou hebben met deze stapel artikelen en een schaar). En om zo’n ondoordringbare berg aan onderzoeksresultaten te vermijden, zijn er ongetwijfeld diverse mensen die zich aangemoedigd voelen om snel een wandeling te maken. Maar zo'n groot corpus is ook een uitdaging voor de technologie –  en dat is precies de reden dat het Allen Institute het heeft gepubliceerd. Door deze gigantische dataset online te zetten, moedigt het instituut intelligent technologiegebruik aan. En wij voelden ons aangesproken.

Inmiddels werk ik al 10 jaar met de InterSystems Natural Language Processing (NLP)-technologie, die er vooral op is gericht om vrij geschreven tekst vanaf de basis te analyseren. Wat de technologie uniek maakt, is dat het proces zich richt op de patronen in natuurlijk taalgebruik. Het hoeft dus geen “expert” te zijn op een bepaald vakgebied of in een bepaald jargon. Dat betekent ook dat NLP zonder vooroordelen werkt, en dat komt bijzonder goed van pas als je gegevens wilt bekijken van een gebied waar je niet in thuis bent – bijvoorbeeld 44.000 wetenschappelijke artikelen over coronavirussen.

Ik heb onze NLP-tool losgelaten op het corpus van het Allen Institute en op Open Exchange gepubliceerd als “content navigator”, zodat iedereen deze gratis kan gebruiken. Onze tool zelf is tevens beschikbaar via open source.

Deze kleine test bleek behoorlijk goed te werken en we besloten om ons experiment als resource aan te bieden voor de deelnemers aan de COVID-19 Challenge hackathon van MIT. Diverse teams hebben gebruik gemaakt van onze content navigator. Nu bieden we de code en een gehoste versie van deze content navigator aan voor iedereen die in deze grote kennisverzameling wil duiken. We zijn ook actief op zoek naar gebruikers die dit naar een nog hoger niveau willen tillen door de code in te bouwen in een oplossing, vooral als deze oplossing kan worden gebruikt om de pandemie sneller de kop in te drukken en ons allemaal weer naar buiten krijgt.

Als je wil helpen, horen we het graag. Stuur een e-mail naar IRIS@InterSystems.com of post een bericht met jouw vragen, ideeën en andere feedback op de GitHub-repository. Het is tijd voor innovatie en om een weg uit deze crisis te vinden.

 
Lees meer

De route naar een moderne zorgorganisatie E-book voor bestuurders in de zorg

 

GERELATEERDE THEMA'S

Andere Berichten Die Je Misschien Leuk Vindt.

28 jan 2025
The OMOP CDM is designed to help researchers do many types of observational research. It is used by a lot of researchers, data analysts, and healthcare organizations.
21 jan 2025
Our Workshop focused on bridging the gap between two prominent healthcare data frameworks: the OMOP Common Data Model (CDM) and the HL7 FHIR standard.
14 jan 2025
The healthcare industry is undergoing a digital transformation that is both complex and critical. One of the most significant challenges is the standardization of data models.
07 jan 2025
Welcome to the Managing Scattered Health Data with OMOP blog series, in which we will explore the role of OMOP, its data model, implementation challenges, and the solutions offered by InterSystems.
19 nov 2024
De medische geschiedenis van een persoon bepaalt in grote mate welke behandelingen voor hem of haar de meest ideale zijn wanneer een nieuwe kwaal of ziekte zich aandient.
12 nov 2024
Vanaf het begin van onze beweging #1Patient1Record4Belgium duikt regelmatig de vraag over privacy op.
05 nov 2024
Security en consent. Twee begrippen die niet zonder elkaar kunnen. Zeker niet als het gaat om hetgeen wij met #1Patient1Record4Belgium hard voor aan het strijden zijn: ervoor zorgen dat de data van de patiënt daadwerkelijk bij de patiënt terechtkomt.
31 okt 2024
Voor iemand die zo vaak in ziekenhuizen moet zijn, is het ontzettend frustrerend om steeds weer dezelfde vragen te krijgen.
29 okt 2024
Door je eigen ervaring als patiënt of door het zo goed mogelijk mee te maken via een naaste: iedereen wordt geconfronteerd met het probleem van het beheer van zijn medisch dossier dat we willen oplossen.
24 okt 2024
We al heel veel data hebben, maar het simpelweg niet hergebruiken of inzetten bij klinische behandelingen. En dat terwijl juist dit zo belangrijk is.