Data uit de AHON-database heeft bijgedragen tot een publicatie over het gebruik van AI voor vroege opsporing van longkanker.
AHON database

Dit is zeer recent ook landelijk nieuws geweest.

In samenwerking met dit onderzoeksteam hebben de datamanagers van AHON ervoor gezorgd dat alles voldeed aan de richtlijnen en kaders die huisartsen gebruiken om gegevens beschikbaar te stellen voor onderzoek. Een belangrijk uitgangspunt daarbij was dat de medische gegevens - met name de zogeheten “huisartsnotities” - veilig en volledig anoniem gebruikt konden worden. Dit onderzoek laat zien hoeveel waarde en potentie er zit in grootschalige gezondheidsdatasets. Hieronder lichten we kort het onderzoek en de uitkomsten toe.

Onderzoeksachtergrond

Meer dan 80% van de mensen met longkanker melden zich met symptomen bij de huisarts. Helaas wordt bij ongeveer 75% van hen de diagnose pas gesteld in een vergevorderd stadium (stadium 3 of 4). Hierdoor overlijdt op dit moment meer dan 80% van deze patiënten binnen een jaar. In de huisartsendossiers zit vaak jarenlange informatie, die mogelijk aanwijzingen bevat voor een eerdere opsporing van longkanker.

Doel van het onderzoek

Het ontwikkelen van nieuwe voorspelmodellen die het inschatten van het risico op longkanker verbeteren.

Opzet van het onderzoek

We onderzochten elektronische patiëntgegevens van vier huisartsnetwerken in Nederland. Daarbij maakten we gebruik van technieken als natuurlijke taalverwerking (ook bekend als ‘natural language processing’ (NLP)) en machine learning.

Methode

We analyseerden de gegevens van ruim 525.000 patiënten, van wie er 2386 uiteindelijk de diagnose longkanker kregen. De diagnoses werden gevalideerd met behulp van de Nederlandse Kankerregistratie (NKR). We gebruikten zowel gestructureerde gegevens als vrije tekst uit de patiëntendossiers, om te onderzoeken of we longkanker konden voorspellen tot vijf maanden vóór de diagnose (vier maanden vóór verwijzing).

Resultaten

De algoritmes bleken in staat om longkanker eerder op te sporen op basis van de beschikbare huisartsgegevens. De modelprestaties (discriminatie, calibratie, sensitiviteit en specificiteit) werden vastgesteld bij verschillende afkapwaarden. Het beste model haalde een AUC (area under the curve) van 0,88 bij interne validatie, en 0,79 bij externe validatie. Hoeveel mensen je moet verwijzen om één patiënt met longkanker te vinden, hangt af van de gewenste gevoeligheid van het model.

Conclusie

Kunstmatige intelligentie kan huisartsen ondersteunen bij het eerder opsporen van longkanker door gebruik te maken van aantekeningen in patiëntendossiers. Wel is er nog aanvullend klinisch onderzoek nodig voordat dit in de praktijk kan worden toegepast.

Publicatie

Artificial intelligence for early detection of lung cancer in GPs’ clinical notes: a retrospective observational cohort study