THEMA: STORAGE & RETRIEVAL Dossiers ontsluiten via slimme tekstanalyse In de wetenschap en in het bedrijfsleven werken we bij voorkeur met gestructureerde data. Die laat zich in die vorm efficiënt omzetten naar informatie waarmee we beslissingen nemen en processen aansturen. Maar wat als gestructureerde data niet direct voorhanden is, bijvoorbeeld omdat informatie alleen in tekstvorm is vastgelegd? Analyseren, filteren en verbanden leggen gaat dan niet meer in seconden. Slim indexeren biedt een oplossing. De medische wereld kent interessante voorbeelden. TEST MET KENNISBANK Al eerder was er met de iKnow tekstanalyse software geëxperimenteerd bij de Arbo Unie. Daar werd gezocht naar een systeem om bedrijfsartsen sneller informatie uit een medische kennisbank te leveren. De testresultaten waren spectaculair. Een zoekactie die voorheen enkele uren in beslag nam, was nu afgewikkeld in een halve minuut. InterSystems was destijds bij Arbo Unie binnengehaald voor de levering van het integratiesysteem Ensemble. Daarmee ging de Utrechtse arbodienstverlener de bestaande operationele systemen integreren via een zogeheten Enterprise Service Bus. 36 Kenniswerkers hebben veel baat bij goed gestructureerde gegevensbestanden. Die stellen hen in staat om in luttele seconden informatiebrokjes op te diepen en met elkaar in verband te brengen. Medici geven voornamelijk in tekstuele vorm expressie aan hun kennis en bevindingen. Medische dossiers bevatten lange lappen tekst. Een behandelaar moet die eerst allemaal lezen om zich een oordeel te vormen en een actieplan te initiären. Een tijdrovende bezigheid, waarmee het genezingsproces van de patiänt niet is gediend. Daarnaast is het de vraag of de kennis van een medisch specialist zich niet op een efficiäntere manier laat benutten. De medische zorg kampt bijna overal met lange wachtlijsten door een tekort aan materiedeskundigen. Tekstanalyse Een vinding, voortgekomen uit een opmerkelijke samenwerking tussen een psychiater en een computer linguïst levert de oplossing. De kennis, gevat in de ongestructureerde (tekst) data van medische dossiers, is voortaan net zo snel te ontsluiten als die verpakt in gestructureerde data. De computer doet het werk. Dirk Van Hyfte en Michael Brands hebben de Belgische nationaliteit en zijn daarnaast zwagers. Dat schept een band. Maar beiden bleken ook gefascineerd door de fundamentele wetenschap achter tekstanalyse. Van een computerlinguïst is dat begrijpelijk, bij een psychiater ligt dat minder voor de hand. Dirk Van Hyfte deed ooit een promotieonderzoek in Nijmegen aangaande de ontwikkeling van een kennissysteem om medicatie voor psychische aandoeningen voor te schrijven. Toen maakte hij kennis met het probleem van het doorgronden van patiäntendossiers van grote omvang. Dat moest sneller kunnen. Topdown versus bottom-up En dat kan, zo bewijzen de Belgische wetenschappers via hun i.Know-technologie. Die omvat een kwalitatieve methodiek om alle relevante informatie te verzamelen en te structureren in concepten en onderlinge relaties. In veel gebruikelijke tekstanalysemethodieken zoals in zoekmachines wordt ’fuzzy logic’ toegepast , waarbij alleen kwantiteit de relevantiewaarde kenmerkt. Vanuit een topdown benadering worden termen herkend die vooraf zijn gedefinieerd volgens tekstindelingen, gangbaar in the- THEMA: STORAGE & RETRIEVAL Van ongestructureerde data naar specialistische kennis sauri. Om fatale fouten te vermijden moet dat proces van definiären vooraf geschieden en wel voor de gehele set aan complexe termen. Bovendien laten van die complexe termen alleen delen zich detecteren. Je moet het proces dus meerdere malen uitvoeren voordat het gehele tekstbestand is geïndexeerd. Dat kost tijd. Bij een steeds meer uitdijende databerg is via een topdown benadering het werk niet meer door kenniswerkers bij te benen. Bij de bottom up benadering van i.Know vindt indexering plaats op basis van de herkenning van alle complexe termen in een tekstbestand. De lengte van de woordgroepen speelt geen rol. De kwalitatieve aspecten van het zoek- en indexeringsproces staan voorop. De waarde van de i.Know werd al snel herkend door InterSystems, de maker van Cachá, een database management systeem dat wereldwijd het hart vormt van veel elektronische patiänten dossiers. De frequente samenwerking bij locale projecten leidde tot een overname. De i.Know technologie is inmiddels volledig geïntegreerd in het productengamma van InterSystems. Hoewel de technologie zijn succes ook heeft bewezen voor zoekacties op ongestructureerde data buiten de medische sector (bijvoorbeeld de farmaceutische industrie), lijkt de zorgsector wel de meest voor de hand BETER ZICHT OP VOORTGANG REVALIDATIE-TRAJECT In Nederland is het Arnhemse VIR e-Care Solutions, kortweg VIR, een van de eerste gebruikers van de i.Know technologie. VIR is ontstaan uit een vereniging voor informatieverwerking van de Nederlandse revalidatiecentra. Alle revalidatiecentra in Nederland maken gebruik van VIR-software, die verder ook afzet vindt in de sport medische begeleiding en de fysiotherapie. Met de module Klinilyzer levert V IR een webapplicatie voor artsen en andere behandelaars die gegevens moeten vastleggen van uiteenlopende aard, waaronder röntgenfoto's, diagnoseverslagen en meetresultaten van medisch onderzoek. Deze informatie laat zich vanuit één scherm invoeren, onderhouden en ontsluiten. Door de koppeling met de iKnow-technologie zijn artsen en behandelaars in staat sneller verbanden te leggen in de diverse onderdelen van een revalidatie dossier. Een script zorgt voor het overbrengen van de relevante gegevens uit de Oracle-database van de VIRapplicatie naar de Caché database van i.Know. nummer 3 I mei 2012 HEALTHSHARE Automatische codering Ensemble vormde ook het hart in het landelijk schakelpunt (LSP) waarmee de zorgwerleners in Nederland informatie op landelijk niveau zouden uitwisselen. Het project ten behoeve van een nationaal elektronisch patiëntendossier werd evenwel door de politiek afgeblazen. Jammer voor de betrokkenen en de belastingbetaler. InterSystems kon in ieder geval nog een deel van de opgedane kennis en ervaring verwerken in HealthShare, een platform voor medische informatie-uitwisseling via webservices. Elders in Europa en in de Verenigde Staten gaan daarmee nu zowel landelijke als regionale projecten van start. liggende doelgroep. Daar zijn aantoonbaar levens te redden wanneer bepaalde informatie snel boven water komt. Maar er zijn tevens kosten te besparen doordat behandelaars minder tijd kwijt zijn aan het handmatig doorspitten van dossiers. Daarnaast leent het i.Know indexeringsproces van de verslagen van intake gesprekken of diagnoses van artsen zich uitstekend voor automatische codering ten behoeve van de financiäle doorbelasting. Dat proces geschiedt nu veelal handmatig en leidt gemakkelijk tot fouten in de administraties van zorgverleners en verzekeraars. 37