Dossiers ontsluiten via slimme tekstanalyse

advertisement
THEMA: STORAGE & RETRIEVAL
Dossiers ontsluiten
via slimme
tekstanalyse
In de wetenschap en in het bedrijfsleven werken we bij voorkeur met gestructureerde
data. Die laat zich in die vorm efficiënt omzetten naar informatie waarmee we beslissingen
nemen en processen aansturen. Maar wat als gestructureerde data niet direct voorhanden
is, bijvoorbeeld omdat informatie alleen in tekstvorm is vastgelegd? Analyseren, filteren en
verbanden leggen gaat dan niet meer in seconden. Slim indexeren biedt een oplossing. De
medische wereld kent interessante voorbeelden.
TEST MET
KENNISBANK
Al eerder was er met de iKnow tekstanalyse
software geëxperimenteerd bij de Arbo Unie.
Daar werd gezocht naar een systeem om
bedrijfsartsen sneller informatie uit een medische kennisbank te leveren. De testresultaten
waren spectaculair. Een zoekactie die voorheen enkele uren in beslag nam, was nu afgewikkeld in een halve minuut. InterSystems
was destijds bij Arbo Unie binnengehaald
voor de levering van het integratiesysteem
Ensemble. Daarmee ging de Utrechtse
arbodienstverlener de bestaande operationele systemen integreren via een zogeheten
Enterprise Service Bus.
36
Kenniswerkers hebben veel baat bij goed
gestructureerde gegevensbestanden. Die
stellen hen in staat om in luttele seconden informatiebrokjes op te diepen en met
elkaar in verband te brengen. Medici geven
voornamelijk in tekstuele vorm expressie
aan hun kennis en bevindingen. Medische
dossiers bevatten lange lappen tekst. Een
behandelaar moet die eerst allemaal lezen
om zich een oordeel te vormen en een
actieplan te initiären. Een tijdrovende bezigheid, waarmee het genezingsproces van de
patiänt niet is gediend. Daarnaast is het de
vraag of de kennis van een medisch specialist zich niet op een efficiäntere manier
laat benutten. De medische zorg kampt
bijna overal met lange wachtlijsten door een
tekort aan materiedeskundigen.
Tekstanalyse
Een vinding, voortgekomen uit een opmerkelijke samenwerking tussen een psychiater
en een computer linguïst levert de oplossing.
De kennis, gevat in de ongestructureerde
(tekst) data van medische dossiers, is voortaan net zo snel te ontsluiten als die verpakt
in gestructureerde data. De computer doet
het werk. Dirk Van Hyfte en Michael Brands
hebben de Belgische nationaliteit en zijn
daarnaast zwagers. Dat schept een band.
Maar beiden bleken ook gefascineerd door
de fundamentele wetenschap achter tekstanalyse. Van een computerlinguïst is dat
begrijpelijk, bij een psychiater ligt dat minder
voor de hand. Dirk Van Hyfte deed ooit een
promotieonderzoek in Nijmegen aangaande
de ontwikkeling van een kennissysteem om
medicatie voor psychische aandoeningen
voor te schrijven. Toen maakte hij kennis
met het probleem van het doorgronden van
patiäntendossiers van grote omvang. Dat
moest sneller kunnen.
Topdown versus bottom-up
En dat kan, zo bewijzen de Belgische
wetenschappers via hun i.Know-technologie. Die omvat een kwalitatieve methodiek
om alle relevante informatie te verzamelen
en te structureren in concepten en onderlinge relaties. In veel gebruikelijke tekstanalysemethodieken zoals in zoekmachines
wordt ’fuzzy logic’ toegepast , waarbij alleen
kwantiteit de relevantiewaarde kenmerkt.
Vanuit een topdown benadering worden
termen herkend die vooraf zijn gedefinieerd
volgens tekstindelingen, gangbaar in the-
THEMA: STORAGE & RETRIEVAL
Van ongestructureerde data naar
specialistische kennis
sauri. Om fatale fouten te vermijden moet
dat proces van definiären vooraf geschieden en wel voor de gehele set aan complexe termen. Bovendien laten van die complexe termen alleen delen zich detecteren.
Je moet het proces dus meerdere malen
uitvoeren voordat het gehele tekstbestand
is geïndexeerd. Dat kost tijd. Bij een steeds
meer uitdijende databerg is via een topdown benadering het werk niet meer door
kenniswerkers bij te benen. Bij de bottom
up benadering van i.Know vindt indexering
plaats op basis van de herkenning van alle
complexe termen in een tekstbestand. De
lengte van de woordgroepen speelt geen
rol. De kwalitatieve aspecten van het zoek-
en indexeringsproces staan voorop.
De waarde van de i.Know werd al snel
herkend door InterSystems, de maker van
Cachá, een database management systeem
dat wereldwijd het hart vormt van veel elektronische patiänten dossiers. De frequente
samenwerking bij locale projecten leidde
tot een overname. De i.Know technologie is
inmiddels volledig geïntegreerd in het productengamma van InterSystems. Hoewel
de technologie zijn succes ook heeft bewezen voor zoekacties op ongestructureerde
data buiten de medische sector (bijvoorbeeld de farmaceutische industrie), lijkt
de zorgsector wel de meest voor de hand
BETER ZICHT OP VOORTGANG
REVALIDATIE-TRAJECT
In Nederland is het Arnhemse VIR e-Care Solutions, kortweg VIR, een van de eerste gebruikers
van de i.Know technologie. VIR is ontstaan uit een vereniging voor informatieverwerking van de
Nederlandse revalidatiecentra. Alle revalidatiecentra in Nederland maken gebruik van VIR-software,
die verder ook afzet vindt in de sport medische begeleiding en de fysiotherapie.
Met de module Klinilyzer levert V IR een webapplicatie voor artsen en andere behandelaars die
gegevens moeten vastleggen van uiteenlopende aard, waaronder röntgenfoto's, diagnoseverslagen en
meetresultaten van medisch onderzoek. Deze informatie laat zich vanuit één scherm invoeren,
onderhouden en ontsluiten. Door de koppeling met de iKnow-technologie zijn artsen en behandelaars in staat sneller verbanden te leggen in de diverse onderdelen van een revalidatie dossier. Een
script zorgt voor het overbrengen van de relevante gegevens uit de Oracle-database van de VIRapplicatie naar de Caché database van i.Know.
nummer 3 I mei 2012
HEALTHSHARE
Automatische codering
Ensemble vormde ook het hart in het landelijk
schakelpunt (LSP) waarmee de zorgwerleners
in Nederland informatie op landelijk niveau
zouden uitwisselen. Het project ten behoeve
van een nationaal elektronisch patiëntendossier werd evenwel door de politiek afgeblazen. Jammer voor de betrokkenen en de
belastingbetaler. InterSystems kon in ieder
geval nog een deel van de opgedane kennis
en ervaring verwerken in HealthShare, een
platform voor medische informatie-uitwisseling via webservices. Elders in Europa en in
de Verenigde Staten gaan daarmee nu zowel
landelijke als regionale projecten van start.
liggende doelgroep. Daar zijn aantoonbaar
levens te redden wanneer bepaalde informatie snel boven water komt. Maar er zijn
tevens kosten te besparen doordat behandelaars minder tijd kwijt zijn aan het handmatig doorspitten van dossiers. Daarnaast
leent het i.Know indexeringsproces van de
verslagen van intake gesprekken of diagnoses van artsen zich uitstekend voor automatische codering ten behoeve van de financiäle doorbelasting. Dat proces geschiedt
nu veelal handmatig en leidt gemakkelijk tot
fouten in de administraties van zorgverleners en verzekeraars.
37
Download