Informatie Professional
4 (2000) nr. 5 (mei) blz. 15

Zoekers rommelen maar wat aan

terug

COLUMN
vorige | volgende | nieuwste


Eric Sieverts

"Zoekmachines op Internet rommelen maar wat aan". Onder die titel bracht de Automatisering Gids van 7 april een journalistieke weergave van het ook in IP gerapporteerde onderzoek van Wouter Mettrop en de zijnen naar het onbetrouwbare zoekgedrag van zoekmachines op het web. Enkele beheerders van zoekmachines - Ilse, AltaVista - was om commentaar gevraagd. Zij gaven toe dat zoekacties inderdaad niet altijd helemaal worden afgemaakt of niet op de hele - gedistribueerd opgeslagen - index worden losgelaten, om de responstijd voor alle duizenden gelijktijdige zoekers acceptabel te houden. Dat wordt belangrijker geacht dan volledigheid, betrouwbaarheid en reproducibiliteit. Je vindt immers altijd nog wel iets!

Voor een grote meerderheid van Internetgebruikers kan dat inderdaad gelden. Maar voor professionele zoekers is dat nauwelijks acceptabel. Die weten hoe ze zoeken moeten. Toch?

Enige tijd geleden had ik een week proeftoegang tot de Nederlandse Persdatabank, via het web. Een aardig product. En een goede gelegenheid om dat ene artikel op te zoeken, dat ik destijds zo keurig uit de NRC geknipt had. Een artikel - toepasselijk - van Karel Knip, dat - even toepasselijk - gewijd was aan het vorig jaar in Nature gepubliceerde onderzoek naar de grootte van zoekmachines op het web. Het onderzoek dat opleverde dat zelfs de grootste zoekmachines maar een klein gedeelte (16%) van het geschatte totaal van 800 miljoen webpagina's doorzochten. Helaas was Karel's knipsel al weken zoek. Ergens in één van de random-access stapeltjes op mijn bureau lag het, maar in welk?

Dat kan de computer beter:
"www AND zoekmachines AND grootte"

Hoe kan dat? Het zit er niet bij. En waarom wel een artikel over het broeikaseffect, toevallig ook van KK?
Even de volledige tekst bekijken. Ach ja, KK is zelf een verwoed web-zoeker en rapporteert vaak hoe hij iets over zijn onderwerp op Internet heeft kunnen vinden.

Zoekvraag dus niet goed? Misschien niet GROOTTE van zoekmachines, maar GEDEELTE van het web dat ze doorzoeken:
"www AND zoekmachines AND gedeelte"

Eén artikel, interessant, maar niet wat ik zoek.
Nieuwe poging:
"www AND zoekmachines AND fractie"

Helemaal niets.
"www AND zoekmachines AND aantal"

Zeven treffers, maar niet de goede.
Zelfde combinaties met "internet" in plaats van "www".
Allerlei resultaten, soms weer Karel Knip, maar niet die ene.

Ja, stil maar. Ik weet dat ik na de eerste misser meteen op auteursnaam had kunnen zoeken. Maar het was mijn eer te na die makkelijke weg te bewandelen. Op woorden uit de inhoud moet je het toch ook kunnen vinden. En inderdaad: het artikel zat er in. En al die gebruikte zoektermen die zo ontzettend vanzelfsprekend waren, waarvan je je absoluut niet kon voorstellen dat ze NIET in het artikel zouden voorkomen, die bleken er .... inderdaad NIET in voor te komen.
Met "www AND zoekmachines AND deel" was het wel te vinden.

Die ervaring maakte mij heel bescheiden. Ik kon me ineens heel goed verplaatsen in de gevoelens van al die deelnemers aan de VOGIN-cursus, die een zoekopdracht - met wedstrijdelement - in een bibliografische database krijgen. Die elke cursus opnieuw niet meer dan 2 tot 20 treffers krijgen, waarna de docenten tonen hoe ze door slim gebruik van gecontroleerde ontsluiting minstens 200 relevante artikelen hadden kunnen vinden.

Inderdaad, al die zoekers - ik niet uitgezonderd - rommelen maar wat aan.



© Informatie Professional (Otto Cramwinckel Uitgever, Amsterdam) en Eric Sieverts

Voor een abonnement op Informatie Professional:
bel: 020 - 627 6609

Zie ook IP Online