Op speurtocht in de CBS-cijfers (workshopverslag)
Wie weleens op zoek is naar specifieke data in de CBS-database Statline, heeft waarschijnlijk het volgende al eens meegemaakt: de zoekfunctie levert niets op, de tabellen laten je net niet precies zien wat je nodig hebt, en voor je het weet sta je een collega te vertellen hoeveel geiten per vierkante meter jouw gemeente heeft terwijl je eigenlijk op zoek was naar gegevens over meertaligheid. Tijd om eens bij het CBS in Den Haag op bezoek te gaan om te leren hoe het wél moet.
Tekst: Romina de Lima
Ruim twintig VWN’ers haalden voor deze activiteit op vertoon van een identiteitsbewijs een bezoekerspas op voor die dag (11 febuari). Onze docent voor die middag, Karolien van Wijk, leidde ons door de toegangspoortjes naar de leszaal. Het CBS beschikt over persoonlijke data, dus veiligheid is cruciaal.
Het zou het CBS niet zijn, als we de workshop niet begonnen met wat cijfers. Er staan zo’n 14 miljard cijfers in Statline en dat aantal blijft groeien door de 600 statistische onderzoeken die het CBS elk jaar uitvoert. En dan zijn er ook nog andere databronnen van het CBS, zoals jeugdmonitor en cijfers op de kaart, waar weer net iets andere cijfers in staan. Niet gek dus dat we af en toe verdwaald raken in de CBS-data.
Karolien gaf ons op een nuchtere en eerlijke manier inzicht in hoe complex de CBS-data is. Toen het tijd was voor de Statline-demo hoopten wij natuurlijk haarfijn uitgelegd te krijgen hoe we in die complexiteit precies konden vinden wat we zochten. In plaats daarvan leerden we vooral nog meer over hoe lastig het is om je weg te vinden in Statline. De zoekfunctie is dramatisch, omdat de CBS-onderzoekers heel netjes hele specifieke definities hanteren en alleen die definities resultaten opleveren in de zoekfunctie. Daarom is het zo lastig om gegevens te vinden over ‘auto’s’, terwijl het CBS toch echt heel veel informatie bezit over de ‘automobiel’.
Onze groep had daar zo zijn bedenkingen bij. Dat moet toch wel beter kunnen? Maar zo simpel is dat niet als je geen zoekfunctie van Google op je website gebruikt vanwege de veiligheid. En de toegankelijkheid van de data lijkt ook niet de grootste prioriteit te zijn van het CBS, want ‘het staat op de website, dus [het CBS] voldoet aan de informatieplicht.’
Gelukkig leerden we nog wat handige zoektips, zoals zoeken binnen thema’s en nieuwsberichten op de CBS-website. Hiermee hebben we in elk geval een strategie voor de volgende keer dat we Statline nodig hebben. En als het toch niet lukt om de benodigde data te vinden, is er altijd nog een behulpzame infoservice.
Ik had de stiekeme hoop om na deze workshop als een soort Statline-tovenaar met een simpele druk op de knop precies de juiste cijfers op mijn scherm te toveren. Daarvoor is Statline toch echt te complex en de zoekfunctie te slecht, maar daar komen we met wat handigheidjes en hulp wel uit. Het was misschien wel net zo interessant om een kijkje achter de schermen te krijgen van dit complexe systeem en de mensen erachter. Mensen die het hebben over ‘lievelingstabellen’ en lijstjes met de leukste vragen bij de infoservice. Al met al, kon minder!