Tegenstrijdigheden
Dat er voor zo’n toekomstig systeem met miljarden gegevens gerekend moet worden, zien de meeste onderzoekers als het geringste probleem. Computers verdubbelen nu eenmaal elke 18 maanden hun rekencapaciteit. Maar hoe zit het met de andere uitdagingen van het semantische web?
De tweede horde voor systemen als E-Culture is: wat te doen met tegenstrijdige informatie? Zelfs als niemand kwade wil in de zin heeft, ontstaan er in de ‘thesaurus’ (geordende begrippenstructuur) die de ontwikkelaars van een semantisch web vastleggen, logische tegenspraken.
Zo zou men in een thesaurus de volgende vier regels kunnen aantreffen: ‘koeien zijn dieren’, ‘schapen zijn dieren’, ‘koeien en schapen zijn vegetariërs’ en ‘vegetariërs eten nooit andere dieren of delen van andere dieren’. Vervolgens verschijnt er op een dag een bericht op het web dat sommige koeien hersenen van schapen gegeten hebben en vervolgens ziek werden. Deze koeien worden ‘gekke koeien’ genoemd. De bestaande thesaurus kan nu alleen consistent blijven als tenminste een van de regels eruit wordt geschrapt. Welke van de regels moet er nu aan geloven?
Frank van Harmelen , hoogleraar kennisrepresentatie en redenering aan de afdeling kunstmatige intelligentie aan de Vrije Universiteit van Amsterdam, is desondanks optimistisch over het vinden van oplossingen voor dit soort problemen: ‘We moeten hier voorbij de klassieke logica waarbij iets of waar of onwaar is. Het is helemaal niet nodig om dit soort tegenspraken honderd procent goed op te lossen. Ook als je systeem het maar een beetje goed doet, heb je toch al een enorme winst gemaakt.’
Grote open vraag
Voor een wereldomspannend semantisch web is het noodzakelijk dat er gestandaardiseerde manieren ontwikkeld worden om kennis vast te leggen en tussen computers uit te wisselen. Voor het laatste is niet de techniek, maar de mens doorslaggevend omdat er goede internationale afspraken gemaakt moeten worden. In allerlei toepassingsgebieden schieten er op dit moment thesauri en begrippenlijsten uit de grond voor de biotechnologie, de informatica, de financiële sector, enzovoort. ‘Voor mij is de grote open vraag: zullen we er in slagen al die begrippenlijsten op een zinvolle manier met elkaar te verbinden?’, zegt Van Harmelen.
Of het dus ooit zover komt dat in een semantisch web, zoals Berners-Lee droomde, ‘computers in staat zullen zijn om alle data op het internet te analyseren de inhoud, onderlinge samenhang en de interactie tussen mensen en machines’, is nog steeds de grote vraag. Maar het semantisch web heeft voor beperkte kennisgebieden duidelijke doorbraken bereikt. Schreiber: ‘Mijn droom is dat we over vijf jaar op deze manier alle musea in Nederland met elkaar kunnen verbinden. Dan ontstaat een soort cultureel kenniseiland. Dat eiland zou je daarna kunnen uitbreiden op Europese schaal, en misschien valt uiteindelijk te denken aan het digitale erfgoed van de hele wereld.’
Datum | woensdag 28 maart 2007
Sybe Rispens
Illustratie Andre Thijssen