DAT ZOEKEN WE OP

<< vorige                 volgende >>

Eric Sieverts

Informatie Professional
21 (2017) nr. 2 (maart) blz. 37
terug
In het vorige nummer van IP stond een vraaggesprek met de maker van het parlementaire informatieportaal "Haagse Feiten". Het zoeksysteem daarvan bleek interessant genoeg om onze zoekrubriek hiervoor nog even nieuw leven in te blazen.

Haagse Feiten

Haagse Feiten kent een gratis en een betaalde versie. Ook voor die gratis versie moet je de eerste keer registreren (wat niet erg soepel verloopt). Voor deze test is alleen de gratis versie bekeken, omdat die al alle basiszoekfunctionaliteit biedt. Alleen diverse gespecialiseerde diensten die toch al buiten het kader van deze rubriek vallen, ontbreken daarin. Voor uitgebreider informatie over de bronnen waar Haagse Feiten zijn informatie uithaalt, verwijs ik graag naar het vorige nummer van IP.

 

Volledig Booleaans

De zoekfunctie bestaat uit een enkele zoekregel om je zoekwoorden in te tikken. De HELP-functie leert dat daarbij ook OR en NOT wordt ondersteund. Booleaanse mogelijkheden zijn echter een stuk vollediger dan de HELP suggereert. Tussen ingetikte zoekwoorden wordt standaard een AND relatie gelegd, maar die operator mag je er desgewenst wel zelf tussenzetten. OR relaties werken goed en ook geneste combinaties van AND en OR met haakjes werken foutloos, ook wanneer je daar NOT-operatoren in verwerkt. Hoewel de HELP zegt dat je daarvoor het minteken moet gebruiken, blijkt het woordje NOT ook geaccepteerd te worden. Met aanhalingstekens zoek je zoals gebruikelijk op vaste zinnetjes.

Standaard wordt op woordstammen gezocht (enkel/meervoud en nog wat meer varianten). De aanhalingstekens werken helaas niet om woordstamzoeken te voorkomen. Met een * kun je ook nog echte truncatie afdwingen.

Filters

Haagse Feiten biedt volledig parametrische filtering. Al voor je gezocht hebt, zie je hoeveel items uit de onderscheiden categorieën in het systeem zitten. Na een zoekopdracht geven die cijfers uiteraard aan hoeveel er van het zoekresultaat overblijft. De hoofdcategorieën voor de parameters waarop je kunt filteren, zijn:
organisaties daarbij wordt het begrip "organisatie" heel ruim opgevat: behalve de ministeries en beide kamers ook diverse media, zij het dat die laatste wat willekeurig zIjn: wel NOS, RTL en nu.nl, maar van kranten alleen de Volkskrant.
informatietypen daarbij wat ongelijksoortige categorieën als twitter, kamerstuk, nieuws, wetsvoorstel, stemmingsuitslag, bijlage, toezegging, etcetera;
subtypen met een nog veel verder uitgewerkte uitsplitsing van het voorgaande;
bronnen de sites (op URL) waarvan het materiaal afkomstig is (met dus nogmaals twitter);
personen alle voorkomende (oud-) ministers, kamerleden e.d., ook als ze maar een enkele keer voorkomen;
dossiers een grote verscheidenheid aan onderwerpsdossiers waarin het opgenomen materiaal is ondergebracht.

Opmerkelijk (maar wel handig) is de overlap tussen hoofdcategorieën. Zo zijn Wikipedia, NOS, Volkskrant e.d. zowel een organisatie als een bron en Twitter zowel een bron als een informatietype. Plezierig is verder dat je binnen een hoofdcategorie ook op meer keuzes kunt filteren.

Waarin je zoekt

Het systeem zoekt in volledige teksten. Daarbij hoort zelfs de hele inhoud van achterliggende PDF's (die je overigens eerst moet downloaden om die inhoud te zien te krijgen). Dat betekent dat je vaak resultaten vindt waarin een zoekterm alleen terloops ergens in een lange opsomming of bijlage voorkomt. Het helpt dan om de sorteervolgorde van datum (wat voor politieke vragen vaak nuttig is) te wijzigen in relevantie ("score" genoemd).

In HELP-schermen wordt niet over zoekvelden gerept. Uitproberen of er toch ongedocumenteerde mogelijkheden waren, leerde dat in elk geval op titelwoorden ingeperkt kan worden. Met   titel:vredespaleis   vind je alleen de documenten waar dat zoekwoord in het titelveld voorkomt. Dat biedt dus nog een andere mogelijkheid om de relevantie van je zoekresultaat (sterk) te verhogen. Ook in Booleaanse combinaties en bij exacte phrases kan dit gebruikt worden.

De van allerlei verschillende sites gehaalde inhoud van Haagse Feiten zit in een database die zelf niet nog een keer in Google terecht komt. Maar met de zoekmogelijkheden van Haagse Feiten voel je ook nauwelijks behoefte om Google-functionaliteit te willen toepassen.
URL https://medium.com/
Booleaans combineren AND, OR, NOT (-), genest met haakjes
truncatie ja (plus ook automatische woordstammen)
speciale zoekvelden titel
advanced zoekscherm nee
parametrische filters ja (grote verscheidenheid)
ook in Google nee
semantische markup n.v.t.


© Eric Sieverts en Informatie Professional (Uitgeverij IP, Voorburg)

Voor een abonnement op Informatie Professional
bel: 06-44 09 19 85
of mail: redactie@informatieprofessional.nl

Zie ook IP Online