Snelle data analyses met tool Rowboat

Het doorzoeken van het Nederlands kentekenregister is voor vele mensen een leuke bezigheid. Met een beetje codeerervaring kan je helemaal los gaan met de verschillende koppelingen die RDW via haar opendata platform aanbiedt. Kenteken.tv biedt voor mensen die minder ervaring hebben met coderen diverse tools en handleidingen. En daar komt nu een extra tool bij waarmee nog makkelijker diepgaandere data analyses gemaakt kunnen worden.

RDW Opendata platform doorzoeken

Sinds de start van publicatie van opendata door RDW maakt Kenteken.tv er fanatiek gebruik van. De allereerste versie was een proof of concept die op basis van Microsoft Azure de dataset van gekentekende voertuigen makkelijk doorzoekbaar maakte met een speciale Excel addin. Dat was vooral handig om snel in Excel met filters en draaitabellen aan de slag te gaan.

Socrata technologie

Na de succesvolle proef met de eerste versie heeft RDW gekozen voor een andere opzet van hergebruik van haar gegevens. Al draaiend op het platform van Socrata worden diverse datasets ter beschikking gesteld via het portaal https://opendata.rdw.nl

De technologie van Socrata maakt het mogelijk om op allerlei manieren soort van database bevragingen af te vuren en terug te krijgen in gangbare formaten als XLSX, csv, xml of json. De opbouwe van deze bevragingen heeft veel weg van zogenaamde SQL statements die in de wereld van database gebruikelijk zijn. De variant hiervan is door Socrata ooit SoQL gedoopt. En deze SoQL kan door middel van SODA (Socrata Open Data API) gebruikt worden.

SODA versie 3 komt eraan

Kenteken.tv heeft inmiddels ruime ervaring opgebouwd met dit platform. Al die ervaring is gebaseerd op SODA versie 2.0 en versie 2.1. Socrata zit echter ook niet stil. Het bedrijf is in 2018 overgenomen door Tyler Technologies. Dat heeft de doorontwikkeling van Socrata dataplatform wel langzamer gemaakt. Medio 2025 is er wel een grote eerste stap gezet om het platform naar hogere versie van SODA te brengen. Deze SODA3 versie zal het platform voor semi-programmeurs minder aantrekkelijk maken mijn inziens. De visuele mogelijkheden om data te filteren via opendata.rdw.nl blijven nog wel bestaan. Als je echter direct de API’s wilt gebruiken, moet je iets meer programmeer skills hebben. Maar dat is tegenwoordig met al die GenAI tools ook weer niet zo moeilijk. En wellicht maak ik met Kenteken.tv nog wel eens translatielaag hiervoor…

Socrata zegt overigens zelf dat SODA versie 2.1 nog wel even ondersteund blijft. Op basis van ervaringen van andere platformen kan dit echter nooit langer dan twee jaar duren, is mijn inschatting.

Rowboat, snelle data analyse tool

Al eerder verscheen op deze blog uitgebreide tips en trucs om direct via tools van Kenteken.tv het kentekenregister in RDW opendata platform door te ploegen. Voor deze tips en trucs werd veel gebruik gemaakt van Microsoft Excel. Maar de tips waren met paar kleine wijzigingen ook toepasbaar voor andere spreadsheet programma’s, zoals Google sheets.

Recentelijk is er echter een andere tool gekomen die deze spreadsheets programma’s overbodig maken voor snelle data analyses. Deze tool heeft Rowboat.

Waarom handig?

De tool Rowboat is bedoeld voor specifiek gebruik. De tool is niet bedoeld om data te beheren en te manipuleren. Alhoewel een Excelsheet ook niet hiervoor per se bedoeld is, kan je daarmee wel lijsten beheren en aanvullen.

Rowboat is echter heel goed om snel allerlei dwarsdoorsnedes van de data te krijgen. Zo zit in de RDW opendata tabel gekentekende voertuigen maar liefst 98 verschillende kolommen. Als je dan voor een bestand van 20.000 Fordjes of 13.000 Volkswagens snel wat interessante inzichten wilt krijgen, dan moet je in Excel of andere tools nogal wat toeren uithalen. Rowboat doet dat echter in een handomdraai en ook nog veilig op je eigen computer. En is al kosteloos beschikbaar met een hele hoop mogelijkheden. Of zoals Rowboat zelf zegt:

A lightning fast tool for understanding large datasets.

Rowboat slogan

Hoe gebruik je Rowboat in de praktijk?

Als je wilt starten met Rowboat kan je natuurlijk in hun eigen documentatie kijken: https://docs.rowboat.net/resources/ . Hieronder beschrijft ik echter hoe je Rowboat makkelijk kan gebruiken via Kenteken.tv of direct op RDW opendata platform.

Klaar voor de start met Rowboat

Om Rowboat te kunnen gebruiken, moet je sowieso ingelogd zijn op het platform van Rowboat. Dat kan makkelijk via inlogpagina waarbij je na opgave van een emailadres in je mailbox een inloglink ontvangt.

Rowboat biedt ook een handige Chrome browser extensie “Open in Rowboat” aan. Deze wordt verderop in het stappenplan ook gebruikt en maakt gebruik van Rowboat nog een stapje makkelijker.

Selectie maken

Voordat je een bestand opent in Rowboat, moet je eerst een selectie van gegevens maken. Voor dit voorbeeld gebruik ik de Kenteken.tv tool “Hoeveel zijn er nog?” en dan specifiek de resultaten van alle gekentekende Ferrari’s in Nederland.

Op de resultaatpagina over deze Ferrari’s biedt Kenteken.tv tool al diverse inzichten, zoals aantal nieuw geregistreerde of gemiddelde lengte van Ferrari’s. Of als je wilt weten wat meest voorkomende bouwjaar is, kan je deze grafiek aflezen:

Als je tandje dieper wilt gaan qua analyses, wordt op deze pagina onderaan twee mogelijke download bestanden aangeboden. Als je op deze knoppen drukt, dan wordt direct een CSV bestand gedownload. En deze zou je vervolgens net zoals andere CSV of Excel bestanden in Rowboat kunnen openen.

Maar door de Chrome extensie kan je de downloadstap ook overslaan en direct openen in Rowboat door via contextmenu Open in Rowboat en vervolgens Open link in Rowboat te kiezen.

En dan wordt Rowboat in een nieuw tabblad geopend en bevat direct per kolom allerlei analyse mogelijkheden:

Linksonder vindt je in Rowboat de mogelijkheid om het uiterlijk van de weergave aan te passen. Persoonlijk vind ik theme Icebreaker fijner werken.

In een hele korte tijd geeft Rowboat per kolom de mogelijkheid tot allerlei inzichten. En deze inzichten kunnen ook op allerlei manieren gevisualiseerd worden. Zo bevat kolom handelsbenaming veel tekstuele verschillen. Hiervoor heeft de tool direct al een vorm van tekst analyse aan boord. Maar ook de verdeling van kleuren of aantal cilinders is in een handomdraai gemaakt. De volgende animated gif geeft direct al enkele mogelijkheden:

Daarnaast krijg je per kolom ook allerlei datakwaliteit wetenswaardigheden, zoals aanta unieke waardes (distinct values) of aantal rijen zonder waardes.

Rowboat is echter ook in staat om data snel te sorteren of te filteren. Zo kan je in een paar muisklikken de meest voorkomende handelsbenaming van Ferrari’s met twaalf cilinders achterhalen:

Geavanceerde datavisualisaties

Het is ook mogelijk om meerdere kolommen ten opzichte van elkaar te visualiseren. Als je bijvoorbeeld de relatie tussen “aantal cilinders” en “cilinderinhoud” wilt laten zien dan kan dat in een handomdraai. En zelfs kan je daarbij een animatie maken op basis van een datumveld:

Klik op afbeelding voor animatie

Rowboat gratis versie beperkingen

De gratis versie van Rowboat kent natuurlijk ergens zijn beperkingen. Dat zit ‘m vooral in het delen van mogelijke resultaten met andere mensen. Zo heb je een betaald account nodig om grafieken te exporteren (maar screenshot maken kan natuurlijk wel) of om een databestand in zijn geheel te delen met iemand anders.

Wat mij betreft een handige tool om in je digitale gereedschapskist te hebben!